• No se han encontrado resultados

Medidas de Variación o Dispersión

N/A
N/A
Protected

Academic year: 2019

Share "Medidas de Variación o Dispersión"

Copied!
42
0
0

Texto completo

(1)

Medidas de

Variación o

Dispersión

Dra. Noemí L. Ruiz © 2007

Derechos de Autor Reservados

(2)

Objetivos de la lección

Conocer cuáles son las medidas de

variación y cómo se calculan o se

determinan

Conocer el significado o interpretación

de cada una de las medidas

Aplicar las medidas de variación en un

conjunto de datos

(3)
(4)

Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos.

Algunas de estas medidas son: rango, rango

intercuartil, desviación intercuartil,

desviación promedio, varianza, desviación

estándar y coeficiente de variación.

Estas medidas miden el grado de dispersión, desviación, o variación, que tienen las

puntuaciones, entre sí , o en relación al centro de una distribución.

(5)

Ayudan a determinar cuán homogéneo es un grupo de datos.

Las puntuaciones que están relativamente juntas tienen una medida de variación más

pequeña.

Las puntuaciones que están más dispersas tienen una medida de variación más grande.

Menos dispersión significa que el grupo de datos es más homogéneo.

Más dispersión implica mayor

heterogeneidad.

(6)

Los valores en la muestra C son iguales, por lo tanto, no existe variabilidad entre ellos.

Al calcular cualquier medida que

cuantifique la variabilidad de esta muestra, el resultado sería igual a cero.

Medidas de Variación

Muestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5

Muestra A 5 15 25 25 58

Muestra B 15 16 16 17 19

(7)

Si se comparan los valores de la muestra A con los de la muestra B se puede observar que en la Muestra A los valores están más lejanos unos de otros.

Medidas de Variación

Muestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5

Muestra A 5 15 25 25 58

Muestra B 15 16 16 17 19

(8)

Si se fuese a calcular cualquier medida que cuantifique la variabilidad en cada una de estas muestras, el resultado sería mayor para la muestra A que para la muestra B.

En general, mientras mayor es la

variabilidad entre los datos, mayor será la medida de dispersión

Medidas de Variación

Muestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5

Muestra A 5 15 25 25 58

Muestra B 15 16 16 17 19

(9)
(10)

El rango es la medida que indica

cuánto se dispersa un grupo de datos.

Se le conoce también, como:

alcance

,

amplitud

,

recorrido,

o

campo de valores

Es la medida más sencilla pero menos

confiable.

Se determina restando el valor mayor

menos el valor menor.

Rango = (Valor mayor) – (Valor menor)

Rango

Dice cuál es la

dispersión total del grupo de

(11)

Aunque la mayoría de las veces se

determina con la fórmula:

Rango = (Valor mayor) – (Valor menor)

Para propósitos del libro de Hinkle se

utilizará la siguiente fórmula que

ajusta la inclusión de ambos

extremos:

Rango =[ (Valor mayor) – (Valor menor) ] + 1

(12)

Si el valor mayor es 5 y el menor es 3,

al restar 5 – 3 se obtiene 2.

5 – 3 = 2 indica que hay dos

unidades de diferencia entre estos

valores.

Si se suma 1, (5-3) + 1, tenemos el total

de valores que hay en ese intervalo de

5 a 3.

(5-3) + 1 = 2 + 1 = 3

Hay 3 valores: 5, 4, 3

(13)

Las medianas de ambos grupos es 23,

pero los rangos varían.

El rango del grupo 1 es 27 (37 – 11 +1 = 27)

El rango del grupo 2 es 12 (29 – 18 + 1 = 12)

El grupo 1 es más variado que el grupo 2.

Rango

Grupo Valor

1

Valor 2

Valor 3

Valor 4

Valor 5

Valor 6

Valor 7

Grupo 1 11 16 18 23 29 31 37

(14)

Se afecta por valores extremos.

Si el último valor del grupo 1

hubiera sido 64 en vez de 37, el

rango se duplacaría.

Se afecta por el tamaño de n, o sea, la

cantidad de sujetos en la muestra.

Los rangos de dos grupos que tienen diferente número de sujetos (n) no se pueden comparar.

(15)

Indica cuánto se dispersan los valores que están en el centro de un grupo de datos.

Se considera el centro como los valores que se concentran entre el primer y tercer

cuartil.

El rango intercuartil no es afectado por valores extremos.

Se determina usando la siguiente fórmula:

Rango Intercuartil= Q3 – Q1

Rango Intercuartil

Dice cuál es la

dispersión de los valores que

(16)

Es la distancia promedio que existe entre el primer y tercer cuartil.

Esta medida nos dice, en promedio, cuán amplio o dispersos están los datos que se concentran en el centro (de Q3 a Q1).

El centro se concentra entre el primer y tercer cuartil.

La fórmula para hallarlo es: Q3 - Q1 2

Desviación Intercuartil

Representa el punto medio del

(17)

Es una representación visual simple pero que brinda gran información sobre la

dispersión de un grupo de datos.

Utiliza la mediana y el rango intercuartil (Q3 – Q1) para el análisis.

Lo desarrolló el prominente estadístico llamado Tuckey.

Se puede usar para determinar valores que representan valores inusuales llamados “outliers” que requieren consideración especial.

(18)

Para trazar el diagrama se necesitan 5 números o valores.

Por eso a veces se le conoce como el análisis de los 5 números.

Estos 5 valores son:

Valor mayor (puntuación máxima) Q3

Mediana Q1

Valor menor (puntuación mínima)

(19)

Ejemplo:

Traza el diagrama de caja y bigotes usando los siguientes valores:

Valor mayor = 69 Q3 = 56.26

Mediana = 49.26 Q1 = 43.36

Valor menor = 24

Diagramas de Caja y Bigotes

(20)

Son valores inusuales que podrían considerarse extremos y que requieren consideración especial. Para determinar estos valores se utiliza el rango intercuartil: (Q3 – Q1) .

El límite superior razonable de una distribución está dado por la fórmula:

Límite Superior Razonable (LSR) = Q3 + 1.5 (Q3 – Q1) El límite inferior razonable de una distribución está dado por la fórmula:

Límite Inferior Razonable (LIR) = Q1 - 1.5 (Q3 – Q1)

(21)

Si un valor dado cae fuera de estos límites

razonables , el valor se considera un extremo y habría que considerarlo cuando se tomen

decisiones sobre el grupo.

Determine si los valores a continuación son razonables:

68 , 75 , 32, 21

“Outliers”

20 30 40 50 60 70 80

(22)

Es la suma de los valores absolutos de las desviaciones de los valores respecto a la media aritmética de la muestra.

La fórmula para hallarlo es:

Desviación Media

Representa el

promedio de las

desviacio-nes de todos los

valores respecto a

la media

n

x

x

n

i

i

1

(23)

Desviación Media

n x x n i i 1 86 . 2 7 2 3 4 1 1 6 3 7 2 3 4 1 1 6 3

9 3 3

12 6 6

7 1 1

5 -1 1

2 -4 4

3 -3 3

4 -2 2

Totales = 42 = 0 = 20

i

x x x

i xi x

(24)

Se puede usar la desviación media para comparar la variación de distintas

distribuciones.

Las distribuciones con mayor desviación media serán las que tengan la variación mayor.

Sin embargo, la utilidad de esta medida es

limitada debido a que se usa el valor absoluto como medio para hallarla.

Los análisis estadísticos más avanzados

requieren manejo algebraico más complejo, como la varianza.

(25)

Es una medida que representa una unidad cuadrada.

Esta medida promedia los cuadrados de las

desviaciones de los valores respecto a la media aritmética.

La varianza toma en consideración cada valor de la muestra.

La fórmula para hallar la varianza de una población es:

Varianza

2

2 xi

n

La varianza no se interpreta por ser una

unidad cuadrada

Fórmula 1

(26)

La fórmula para hallar la varianza de

una muestra es:

La fórmula anterior es equivalente

también a la siguiente fórmula:

Varianza

2 2 1 i x x s n 2 2 2 1 i i x x n s n Fórmula 2 Fórmula 3 Ver cuando se usa cada

(27)

Se usa la fórmula 1 cuando se va a

determinar la varianza de una población.

Se usa la fórmula 2 y fórmula 3 cuando se va a determinar la varianza de una muestra.

Se usa la fórmula 2 cuando se tiene una muestra pequeña y la media aritmética es un número entero, ya que se torna más

compleja y difícil de utilizar cuando hay muchos valores o cuando la media

representa un valor decimal.

En este caso, se usa mejor la fórmula 3.

(28)

Más adelante se presentarán ejemplos de cómo se utilizan estas fórmulas.

El elevar al cuadrado las desviaciones de las puntuaciones respecto a la media

aritmética, es un método alterno al uso del valor absoluto para eliminar los signos

negativos antes de sumar las desviaciones. Cuando se utilizan los cuadrados en vez de los valores absolutos de las desviaciones se facilita el manejo algebraico y se elimina la restricción que tiene la desviación media.

(29)

Desviación Media

9 3 9 1

12 6 36 16

7 1 1 1

5 -1 1 9

2 -4 16 36

3 -3 9 25

4 -2 4 16

Totales = 42 = 0 = 76 = 104

i

x

xi x xi x 2 xi 8 2

6

(30)

Es una medida que representa una

unidad lineal.

Se halla extrayendo la raíz cuadrada

de la varianza.

La fórmula para hallar la desviación

estándar es:

Para hallar la desviación estándar de

una población se usa la última fórmula.

Desviación Estándar

2 2

ó

s

s

Es un promedio

que mide cuánto se

desvían todos los

datos en relación a

(31)

Cuando los datos están agrupados se

utiliza la siguiente fórmula:

Varianza y Desviación Estándar

para datos agrupados

(32)

Ver las columnas que se necesitarían añadir en una tabla de distribución de

frecuencias para poder aplicar la fórmula 4.

Varianza y Desviación Estándar

para datos agrupados

(33)

Representa una medida relativa (por ciento) que permite comparar grupos distintos.

Relaciona la desviación estándar con la media aritmética.

Nos dice cuál es el por ciento de variación de un grupo respecto a la media aritmética.

La fórmula es:

desviación estándar media aritmética

Coeficiente de Variación

(34)
(35)

Halla el rango, varianza y desviación estándar usando fórmula 2.

Rango = 10-6 = 4

Ejemplo 1: Datos Crudos

Segundos de reacción antes de consumir un gramo de droga THC

X (segundos) (x – ) (x - )2

10 10-8= 2 4

10 10-8 = 2 4

10 10-8 = 2 4

9 9-8 = 1 1

9 9-8 = 1 1

8 8- 8 = 0 0

7 7 – 8 = -1 1

7 7 – 8 = -1 1

6 6 - 8 = -2 4

6 6 – 8 = -2 4

6 6 – 8 = -2 4

(36)

El mismo ejercicio anterior pero

usando la

fórmula 3

para calcular

s

.

Ejemplo 2: Datos Crudos

Segundos de reacción antes de consumir un gramo de droa THC

X (segundos) x2

10 100 10 100 10 100 9 81 9 81 8 64 7 49 7 49 6 36 6 36 6 36 88 732 2 2 2 2 2 2 1 88 7744 732 732 11 11 10 10

732 704 28

(37)

Halla la desviación intercuartil Q3 = 3(n+1) = 36 = 9 ó 9na posición

4 4 Q3 = 10

Q1 = n+1 = 12 = 3 ó 3era pos. 4 4

Q1 = 6

= = 2

Interpreta este resultado

Ejemplo 3

Segundos de reacción antes de consumir un gramo de droa THC

X (segundos) x2

10 100 10 100 10 100 9 81 9 81 8 64 7 49 7 49 6 36 6 36 6 36

Q

3

- Q

1

2

Q3 - Q1 2

10 - 6 2

(38)

Halla el coeficiente de variación

Coeficiente de Variación =

Desviación estándar =

Media aritmética

Interpreta este

resultado

Ejemplo 4

Segundos de reacción antes de consumir un gramo de droa THC

X (segundos) x2

10 100 10 100 10 100 9 81 9 81 8 64 7 49 7 49 6 36 6 36 6 36

1.67 = 0.20875 = 0.21=21%

8

(39)

Halla la varianza y desviación estándar del grupo de datos a continuación (Completar Tabla)

Ejemplo 5: Datos en Clases

Resultados de examen de estadística

Clases f x x. f x2 . f

35-41 1 38 38 1444

42-48 2 45 90 4050

49-55 2 52 104 5408

56-62 3 59 177 10443

63-69 7 66 462 30492

70-76 11 73 803 58619

77-83 9 80 720 57600

84-90 8 87 696 60552

91-97 6 94 564 53016

98-104 1 101 101 10201

50 3755 291825

Ver qué columnas

se

(40)

Halla la varianza y desviación estándar del grupo de datos a continuación (Clic para ver proceso)

Ejemplo 5: Datos en Clases

Resultados de examen de estadística

Clases f x x. f x2 . f

35-41 1 38 38 1444

42-48 2 45 90 4050

49-55 2 52 104 5408

56-62 3 59 177 10443

63-69 7 66 462 30492

70-76 11 73 803 58619

77-83 9 80 720 57600

84-90 8 87 696 60552

91-97 6 94 564 53016

98-104 1 101 101 10201

(41)

Continuación Ejemplo 5

2 2 2 2 2 2

(

)

(

1)

(3755)

14,100, 025

291,825

291,825

50

50

49

49

291,825 282, 000.5

9824.5

(42)

Referencias

Documento similar

[r]

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

"No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

El tutor de la empresa procura que los alumnos desarrollen el programa formativo.. La gestión de presentación de los alumnos a las empresas la realizo

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

En el capítulo de desventajas o posibles inconvenientes que ofrece la forma del Organismo autónomo figura la rigidez de su régimen jurídico, absorbentemente de Derecho público por

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

los hombres. Porque la insigne ohl';] de la encarnaciOll del Hijo y de la redencion del mundo, no podia darse á entender sino por unos hombres ilustrados por el Espíritu Santo. En