1. LA VARIANZA

Texto completo

(1)

Análisis de Datos I Esquema del Tema 5

Carmen Ximénez 1

Tema 5. Medidas de Variación

1. LA VARIANZA

2. LA DESVIACIÓN TÍPICA

3. PROPIEDADES DE LA VARIANZA y LA DESVIACIÓN TÍPICA

4. OTRAS MEDIDAS DE VARIACIÓN

5. REPRESENTACIÓN GRÁFICA DE LA VARIABILIDAD

__________________

Bibliografía: Tema 5 (pág. 101-120)

Ejercicios recomendados del libro:1, 2, 5, 6, 8, 9, 10, 11 y 16.

(2)

Análisis de Datos I Esquema del Tema 5

Carmen Ximénez 2

Para conseguir una visión completa y comprensiva de los datos obtenidos hay que complementar las medidas de tendencia central con otros estadísticos que reflejen otras propiedades. Por ejemplo, el grado en que los datos se parecen o diferencian entre sí, propiedad que se denomina variabilidad o variación.

Ejemplo. Consideremos los siguientes datos en X para los grupos A y B:

Totales: Medias:

XA: 8 9 10 11 12 50 X=10 XB: 3 8 9 10 20 50 Y=10

Para cuantificar esta variación podemos calcular la media de las distancias al cuadrado de las puntuaciones a la media (la varianza). Es decir:

Totales: Medias:

xA: -2 -1 0 1 2 0 0 xB: -7 -2 -1 0 10 0 0 xA2: 4 1 0 1 4 10 2 xB2

: 49 4 1 0 100 154 30,8

1. LA VARIANZA, SX2

Es el promedio de las distancias al cuadrado desde los valores en X hasta la media X (es decir, de las puntuaciones diferenciales al cuadrado) en una muestra de n sujetos.

Fórmulas:

n Xi X) S (

2 2

X

=

n xi

S

2 2

X

=

(en puntuaciones diferenciales) Fórmula alternativa: 2

2 2

X X

S =

n Xi

Ejemplo 1: Xi: 4, 5, 2, 5. X=4 xi: 0, 1, -2, 1.

xi2

: 0, 1, 4, 1. 1,5 4

1 4 1

2 = 0+ + + =

SX O bien: 4 1,5

4 70 2

2 = =

SX

2. LA DESVIACIÓN TÍPICA, SX

2 X

X S

S =

En el Ejemplo 1: SX = S2X = 1,5 =1,22 Las medias en A e B son iguales,

pero… ¿Son los datos similares?

Suele utilizarse más que la varianza porque al calcular la raíz cuadrada se retoman las unidades de medida originales para resumir las distancias entre las X y la X.

(3)

Análisis de Datos I Esquema del Tema 5

Carmen Ximénez 3

LA CUASIVARIANZA, S'X2

1 -

) X S' (

2 2

X n

Xi

=

Propiedades: S2X < S'2X; (n)SX2 =(n-1) S'X2

3. PROPIEDADES DE LA VARIANZA y LA DESVIACIÓN TÍPICA 1. S y SX2 X son siempre positivas, siendo su valor mínimo 0.

2. Si Yi = Xi + a S2Y =S2X; SY = SX 3. Si Yi = k Xi S2Y =k2S2X; SY = | k | SX

Ejemplo 2: Xi: 7, 9, 5, 11

4. OTRAS MEDIDAS DE VARIACIÓN Amplitud total o rango: AT = Xmáx - Xmín

Amplitud semi-intercuartílica

2

1

3 Q

Q Q

=

Coeficiente de variación: 100 X SX

×

= CV

5. REPRESENTACIÓN GRÁFICA DE LA VARIABILIDAD Diagrama de cajas

A B C D E F

6

5

4

3

2

1 0

Valor máximo que toma la variable (Xmáx)

Valor mínimo que toma la variable (Xmín) Q3: Centil 75

Q1: Centil 25 Q2: Centil 50

5 8 X

2 =

= SX

(4)

Análisis de Datos I Esquema del Tema 5

Carmen Ximénez 4

EJERCICIO 1

Obtenga la varianza de los siguientes conjuntos de datos:

X: 7 3 4 5 3 2 24

x: 3 -1 0 1 -1 -2

x2:

Y: 11 12 14 15 10 12 10 84

y: -1 0 2 3 -2 0 -2

y2:

Z: 1,3 1,7 1,6 1,4 1,5 7,5

z: -0,2 0,2 0,1 -0,1 0

z2:

EJERCICIO 2

En un ejemplo anterior hicimos una transformación de una temperatura media en grados centígrados y Fahrenheit:

32 C 5 º F 9

º = +

Supongamos ahora que la varianza de la temperatura tolerada es de 1,8 ºC en la muestra Española y de 4 ºF en la Americana.

¿Qué muestra es más homogénea en las temperaturas toleradas?

EJERCICIO 3

A los valores obtenidos por una muestra en un test con media 13 y desviación típica 2 los multiplicamos por una constante y le sumamos otra constante. Es decir: Y = k X + c

Tras estas operaciones la media queda en 25 y la varianza en 9.

¿Cuáles son las constantes sumadas y multiplicadas?

EJERCICIO 4

Se evalúa el nivel de tabaquismo en una muestra de 3 varones y 5 mujeres.

Sexo Tabaquismo (Xi)

V 3

V 4

V 2

M 7

M 5

M 2

M 10

M 6

1. Calcule la media y varianza para mujeres y varones

2. Calcule la media y la varianza para el grupo total

3. ¿Qué grupo es más homogéneo?

4. Represente gráficamente la variabilidad

Figure

Actualización...

Referencias

Actualización...

Related subjects :