• No se han encontrado resultados

Medidas de dispersión

N/A
N/A
Protected

Academic year: 2021

Share "Medidas de dispersión"

Copied!
15
0
0

Texto completo

(1)

    

 Medidas de dispersión 

Por: Sandra Elvia Pérez

 

Rango 

En un estudio estadístico

El rango se define como la diferencia que existe entre el mayor y el menor de los datos analizados.

Esto es, si se realiza un estudio sobre las estaturas de los soldados del VII Batallón y el soldado de menor estatura mide 1.65 metros y el soldado más alto mide 1.94 metros, entonces el rango de estaturas de los soldados es:

29 . 0 65 . 1 94 . 1 − =

Lo anterior indica que la variación de las alturas de los soldados del VII Batallón es de 0.29 metros. Para datos desordenados, primero se requiere localizar al menor y mayor de los datos y luego calcular la diferencia entre ellos.

Para una distribución de frecuencias simple es más sencillo determinar el rango, debido a que los datos ya se encuentran ordenados.

Analiza el siguiente ejemplo

:

Determina el rango para los datos mostrados en la siguiente distribución de frecuencias simple.

x f 60 16 70 13 80 23 90 14 100 7

Tabla 1. Distribución de frecuencias simples

El rango para este conjunto de valores es: Rango=100-60=40

(2)

¿Cómo crees que se calcula el rango en una distribución de frecuencias por intervalos?

Analiza el siguiente ejemplo:

Determina el rango para los datos mostrados en la siguiente distribución de frecuencias por intervalos. clases f 61 – 70 8 71 – 80 10 81 – 90 19 91 – 100 9 101 – 110 5

Tabla 2. Distribución de frecuencias por intervalos clases y f frecuencia.

El rango para este conjunto de valores es: Rango=110-61=49

Es decir, el rango para una distribución de frecuencias por intervalos es el límite mayor de la última clase menos el límite inferior de la primera clase.

De esta forma:

(3)

Varianza y desviación estándar 

Analiza los siguientes conjuntos de datos:

A= 10, 11, 12, 12, 13, 13, 13, 14, 14, 15 B=10, 11, 12, 13, 14, 14, 15

¿Cómo se encuentran distribuidos estos datos?

Para contestar esta pregunta, calcula el rango para cada conjunto.

Rango A Rango B

15 – 10=5

15 – 10=5

El rango es igual para los dos conjuntos, pero al observar los conjuntos se notan distintos. Analiza

las gráficas para cada conjunto de datos, ¿qué observas?

Conjunto A x F 10 1 11 1 12 2 13 3 14 2 15 1 Conjunto B X F 10 1 11 1 12 1 13 1 14 2 15 1

Figura 1. Gráfica de barras de Conjunto A. Figura 2. Gráfica de barras de Conjunto B.

(4)

El conjunto A muestra una mayor concentración hacia los datos centrales que el conjunto B y debido a que el rango sólo contempla los datos extremos (el dato mayor y el dato menor) no es capaz de dar información sobre cómo se dispersan los datos con respecto a un valor central.

Para ello, la medida de dispersión más utilizada es la desviación estándar; también conocida como desviación típica.

Desviación estándar para datos desordenados 

Para calcular la desviación estándar en conjuntos de datos desordenados, se aplica la siguiente fórmula:

El análisis de la fórmula de la desviación estándar lo harás a través de los siguientes ejemplos:

Ejemplo 1

Calcula la desviación estándar del conjunto de datos siguiente:

A= 10, 11, 12, 12, 13, 13, 13, 14, 15

Solución La fórmula de la desviación es

(

)

n

x

x

s

=

2

, por lo que para utilizarla, primero se requiere que se determine la media aritmética:

56

.

12

9

15

14

13

13

13

12

12

11

10

=

+

+

+

+

+

+

+

+

=

x

(5)

x

(

x −x

)

10 10−12.56=−2.56 11 11−12.56=−1.56 12 1212.56=0.56 12 12−12.56=−0.56 13 13−12.56=0.44 13 13−12.56=0.44 13 1312.56=0.44 14 14−12.56=1.44 15 15−12.56=2.44

Tabla 3. Obtención del valor

(

x −

x

)

donde

x

es el valor del dato y x es el valor de la mediana.

De la tabla 3 se puede observar que la desviación de x=10, con respecto a la media

x

=

12

.

56

, es -2.56; y que la desviación de x=13, con respecto a la media

x

=

12

.

56

, es 0.44.

La fórmula incluye el término

(

x

x

)

2 por lo que se debe elevar al cuadrado cada desviación y efectuar la suma. Para hacerlo usa la tabla 3, pero le agregas una columna.

x

(

x −x

)

(

x −

x

)

2 10 1012.56=2.56 6,553 11 11−12.56=−1.56 2,433 12 12−12.56=−0.56 0,31 12 12−12.56=−0.56 0,31 13 13−12.56=0.44 0,193 13 13−12.56=0.44 0,193 13 1312.56=0.44 0,193 14 14−12.56=1.44 2,073 15 15−12.56=2.44 5,953

(

)

x

x

2

=

18.22

(6)

Dividiendo

(

x

x

)

2 entre n, que es el número total de datos, en este caso n=9 queda:

(

)

2

.

024

9

22

.

18

2

=

=

n

x

x

A este resultado se le conoce como varianza.

Varianza es el promedio de las desviaciones al cuadrado y se representa con s2.

Para este ejemplo:

024

.

2

2

=

s

Una desventaja de la varianza son sus unidades, por lo que la varianza para este ejemplo es 2.024 unidades cuadradas. Si las unidades fueran pesos, la varianza sería pesos al cuadrado; si fueran kilogramos, la varianza sería 2.024 kilogramos cuadrados.

Finalmente, extraes raíz cuadrada a la varianza, es decir:

(

)

42

.

1

024

.

2

2

=

=

=

s

s

n

x

x

s

La desviación estándar del conjunto de datos es s=1.42, pero… ¿Qué significa?

Magaña (2003) define la desviación estándar como sigue:

(7)

La anterior definición menciona que la desviación estándar da información de cómo se desvían los datos con respecto a su media aritmética.

Analiza otro ejemplo: Ejemplo 2

Calcula la desviación estándar del conjunto de datos siguiente:

B=10, 11, 12, 12, 13, 14, 15

Solución

La fórmula para calcular la desviación estándar es:

(

)

n

x

x

s

=

2

La media aritmética para el conjunto de datos es:

43

.

12

7

87

7

15

14

13

12

12

11

10

=

=

+

+

+

+

+

+

=

x

x

En la tabla 5 se llevan a cabo los cálculos de las desviaciones

(

x −x

)

y de los cuadrados de las desviaciones

(

x −

x

)

2, así como de la suma de estos últimos.

x

(

x −x

)

(

x −

x

)

2 10 10−12.43=−2.43 5,90 11 11−12.43=−1.43 2,04 12 1212.43=0.43 0,18 12 1212.43=0.43 0,18 13 13−12.43=0.57 0,33 14 1312.43=1.57 2,47 15 1312.43=2.57 6,61

(

)

x

x

2

=

17.71

(8)

La varianza del conjunto de dato es:

(

)

2

.

53

7

71

.

17

7

2 2

=

=

=

x

x

s

Y la desviación estándar es:

59

.

1

53

.

2

=

=

s

Las desviaciones de los conjuntos de datos planteados en los ejemplos anteriores:

A= 10, 11, 12, 12, 13, 13, 13, 14, 15 (Ejemplo 1) B=10, 11, 12, 12, 13, 14, 15(Ejemplo 2) Son s=1.42 y s=1.59, respectivamente.

El hecho de que la desviación estándar del conjunto B sea mayor que la del conjunto A, a pesar de que sus rangos son iguales, indica que los datos del conjunto B están más dispersos de su media aritmética, esto es, no se concentran en torno a ella. En las figuras 3 y 4 se muestran nuevamente las gráficas de los datos de ambos conjuntos.

Conjunto A x F 10 1 11 1 12 2 13 3 14 2 15 1 Conjunto B X F 10 1 11 1 12 1 13 1 14 2 15 1

Figura 3. Gráfica de barras de Conjunto A.

s=1.42

(9)

Una desviación estándar igual a cero implicaría que todos los datos son iguales a su media aritmética, es decir, que no tendrían ninguna dispersión. Entre mayor sea la desviación estándar, mayor será la dispersión.

Desviación estándar para datos agrupados 

Para datos agrupados en distribuciones de frecuencia simple y con intervalos la fórmula para calcular la desviación estándar es:

La fórmula sólo varía en la inclusión de la frecuencia (f). Es importante señalar que el valor de x para datos agrupados en distribuciones de frecuencia con intervalos es el valor de la marca de clase.

A continuación se presentan algunos ejemplos: Ejemplo 1

Calcula la desviación estándar de los datos agrupados en la siguiente distribución de frecuencias simple. x f 8 5 9 2 12 3 15 6 19 7 21 4 25 4

(10)

Por tratarse de datos agrupados es conveniente utilizar una tabla para llevar el registro de los cálculos. En la tabla 7 se realizan los cálculos de la media, la varianza y la desviación estándar.

x f

f ⋅

x

(

x −x

)

(

x −

x

)

2

f

(

x

x

)

2 8 5 (8)(5)=40 -8,16 66,61 333,03 9 2 18 -7,16 51,28 102,57 12 3 36 -4,16 17,32 51,95 15 6 90 -1,16 1,35 8,09 19 7 133 2,84 8,06 56,41 21 4 84 4,84 23,41 93,65 25 4 100 8,84 78,12 312,49 n= 31

f

⋅ x

=

501

(

)

f

x

x

2

=

958.19

La media aritmética es:

16

.

16

31

501

=

=

=

n

x

f

x

La varianza es:

(

)

91

.

30

31

19

.

958

2 2 2

=

=

=

s

n

x

x

f

s

La desviación estándar queda:

56

.

5

91

.

30

=

=

s

,

que significa que los datos, en promedio, se desvían de la media aritmética 5.56.

Tabla 7. Obtención de varianza y distribución estándar para datos organizados en frecuencia simple.

En el siguiente ejemplo, se calcula la desviación estándar de un conjunto de datos agrupados en una distribución de frecuencias con intervalos.

Ejemplo 2

(11)

Clases F 114 ─ 128 9 129 ─ 143 10 144 ─ 158 6 159 ─ 173 8 174 ─ 188 7

Tabla 8. Tabla de distribución de frecuencia por intervalos.

Por tratarse de datos agrupados es conveniente utilizar una tabla para registrar los cálculos realizados. En la tabla 9 se realizan los cálculos de la media, la varianza y la desviación estándar.

Clases Marca de clase x f

f ⋅

x

(

x −x

)

(

)

2

x

x −

f

(

x

x

)

2 114 ─ 128 121 9 (121)(9)=1089 -27,75 770,0625 6930,5625 129 ─ 143 136 10 1360 -12,75 162,5625 1625,625 144 ─ 158 151 6 906 2,25 5,0625 30,375 159 ─ 173 166 8 1328 17,25 297,5625 2380,5 174 ─ 188 181 7 1267 32,25 1040,0625 7280,4375 n= 40

f

⋅ x

=

5950

(

)

f

x

x

2

=

18247,5

La media aritmética es:

75

.

148

40

5950

=

=

=

n

x

f

x

La varianza es:

(

)

19

.

456

40

5

.

18247

2 2 2

=

=

=

s

n

x

x

f

s

La desviación estándar queda:

36

.

21

18

.

456

=

=

s

,

(12)

Cuando los cálculos contienen cantidades grandes o decimales, el efectuar los cálculos se puede complicar un poco; en estos casos se recomienda usar una hoja de cálculo como Excel para hacer las operaciones.

En los ejemplos anteriores, se revisó cómo calcular la varianza y la desviación estándar para datos no agrupados y agrupados en distribuciones de frecuencia simple y con intervalos.

Aplica este conocimiento para resolver el siguiente problema:

En la tabla 10 se muestran las ventas diarias de un negocio de comida rápida, en los últimos 30 días. Clases F 1500 ─ 1800 5 1801 ─ 2101 6 2102 ─ 2402 8 2403 ─ 2703 7 2704 ─ 3004 4

Tabla 10. Tabla de distribución de frecuencia por intervalosde las ventas de un negocio de comida.

¿Cuál es el promedio de las ventas diarias? ¿Cuál es el rango de las ventas diarias?

(13)

Solución

Haz los cálculos necesarios usando una tabla como la tabla 11:

Clases Marca de clase (x) f

f ⋅

x

(

x −x

)

(

x −

x

)

2

f

(

x

x

)

2 1500 - 1800 1650 5 8250 -591,97 350424,53 1752122,67 1801 -2101 1951 6 11706 -290,97 84661,60 507969,61 2102 – 2402 2252 8 18016 10,03 100,67 805,34 2403 -2703 2553 7 17871 311,03 96741,73 677192,14 2704 - 3004 2854 4 11416 612,03 374584,80 1498339,20 n= 30

67259

f

⋅ x

=

(

)

f

x

x

2

=

4 436 428.97

Tabla 11. Tabla auxiliar para el cálculo de medidas de dispersión.

¿Cuál es el promedio de las ventas diarias?

La media aritmética también se le conoce como promedio, por lo que:

97

.

2241

30

67259

=

=

=

x

n

x

f

x

En promedio, este negocio de comida rápida tiene ventas diarias de 2, 241.97 pesos.

¿Cuál es el rango de las ventas diarias?

El rango de las ventas diarias es:

1504

1500

3004

=

=

Rango

Esto significa que la diferencia entre el día que más se vendió y el día en el que se tuvieron menos ventas es de 1,504 pesos.

¿Cuál es la desviación estándar de las ventas diarias?

(14)

(

)

55

.

384

96

.

147880

30

97

.

4436428

2

=

=

=

=

s

n

x

x

f

s

Lo que indica que en promedio, las ventas diarias se desvían o dispersan de la media aritmética 384.55 pesos.

En la figura 5 se expone una gráfica de barras donde se muestran las marcas de clase y las frecuencias absolutas de los datos.

Figura 5. Marcas de clase y las frecuencias absolutas de los datos.

Dependiendo del propósito del estudio estadístico, se puede requerir que se organicen los datos en distribuciones de frecuencias, de representarlos en gráficas, o de calcular las medidas de tendencia central y de dispersión, ya que todo en conjunto ayudará a que la interpretación de la información contenida en los datos sea más precisa y por consecuencia, las decisiones que se tomen con base en estos análisis también sean más atinadas y pertinentes.

Ventas diarias en los últimos 30 días

0 2 4 6 8 10 1650 1951 2252 2553 2854

Ventas diarias (en pesos)

(15)

Referencia 

Magaña, L. (2003). Matemáticas III, Estadística y Probabilidad. México: Compañía Editorial Nueva Imagen.

 Bibilografía 

Evans, J. R. & Lindsay, W. M. (2008). Administración y control de la calidad (7a. ed.; F. Sánchez, Trad.). México: Cengage Learning.

Referencias

Documento similar

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Este libro intenta aportar al lector una mirada cuestiona- dora al ambiente que se desarrolló en las redes sociales digitales en un escenario de guerra mediática mantenido por

o esperar la resolución expresa" (artículo 94 de la Ley de procedimiento administrativo). Luego si opta por esperar la resolución expresa, todo queda supeditado a que se

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

¿Cómo se traduce la incorporación de ésta en la idea de museo?; ¿Es útil un museo si no puede concebirse como un proyecto cultural colectivo?; ¿Cómo puede ayudar el procomún

Asimismo una reflexión calmada sobre las intrincadas relaciones existentes en el péndulo que va del ODM 1 al ODM 8, debería conducirnos a observar por qué las formas mediante las

Primeros ecos de la Revolución griega en España: Alberto Lista y el filohelenismo liberal conservador español 369 Dimitris Miguel Morfakidis Motos.. Palabras de clausura