ALISIS DE DATOS CON LA HOJA DE C ´ ALCULO EXCEL

Texto completo

(1)

ESTAD´ISTICA DESCRIPTIVA Y AN ´

ALISIS DE

DATOS CON LA HOJA DE C ´

ALCULO EXCEL

Organiza:

INSTITUTO C ´ANTABRO DE ESTAD´ISTICA

http://www.icane.es

Responsable: Francisco Parra Rodr´ıguez

Jefe de Servicio de Estad´ısticas Econ´omicas y Sociodemogr´aficas parra f@icane.es

Colabora: Ma Paz Moral Zuazo

Analista de coyuntura

(2)

ESQUEMA DE LA SEMANA: SESI ´

ON 3

1 Introducci´on

2 Descripci´on gr´afica de datos de una variable cualitativa 3 Descripci´on gr´afica de datos de una variable cuantitativa 4 Descripci´on num´erica de un conjunto de datos

5 Medidas de desigualdad

(3)

EJEMPLOS DE HISTOGRAMAS

0 0.02 0.04 0.06 0.08 0.1

1000 1500 2000 2500

Frecuencia relativa

(4)

EJEMPLOS DE HISTOGRAMAS

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

2 4 6 8 10 12 14 16

Densidad

bwghtlbs

bwghtlbs N(7.4187,1.2721) Estadístico para el contraste de normalidad:

Chi-cuadrado(2) = 290.610, valor p = 0.00000

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

0 2 4 6 8 10 12 14 16

Densidad

bwghtlbs

bwghtlbs N(7.4187,1.2721) Estadístico para el contraste de normalidad:

Chi-cuadrado(2) = 290.610, valor p = 0.00000

Media = 7.4187 Mediana = 7.5000

M´ınimo = 1.4375 M´aximo = 16.938

(5)

ESQUEMA DE LA SEMANA: SESI ´

ON 3

3. DESCRIPCI ´ON NUM´ERICA DE DATOS (II)

3.3 Medidas de dispersi´on.

3.4 Medidas de forma.

4. MEDIDAS DE DESIGUALDAD

4.1 Medidas de concentraci´on.

4.2 Curva de Lorenz: c´alculo e interpretaci´on.

(6)

3. DESCRIPCI ´

ON NUM´

ERICA DE DATOS

Descripci´on num´erica. Objetivo

Utilizar medidas num´ericas que den idea de determinadas caracter´ısticas de la distribuci´on. Por ejemplo:

Posici´on.

I Basada en suma de cantidades: media

I Basada en la ordenaci´on de los datos: mediana

Dispersi´on

I Basada en suma de cantidades: varianza, desviaci´on t´ıpica, coeficiente de variaci´on

I Basada en la ordenaci´on de los datos: rango intercuart´ılico

Forma

I Asimetr´ıa de la distribuci´on

(7)

Resumen

Media decribe la posici´on de los datos. Centro de gravedad.

x = x1+x2+. . .+xN

N

La desviaci´on t´ıpica mide la dispersi´on de los datos alrededor de la media.

Sx =

r

(x1−x)2+ (x2−x)2+. . .+ (xN −x)2

N Funci´ondesvestp

Sx∗ =

s

(x1−x)2+ (x2−x)2+. . .+ (xN−x)2

N−1 Funci´on desvest

Coeficiente de variaci´on: para comparar distintos conjuntos de datos.

CV = Sx

(8)

3.4 Medidas de forma

Las medidas de formareflejan otras caracter´ısticas del histograma.

El coeficiente de asimetr´ıa

La asimetr´ıa de una distribuci´on se refiere a si los datos se distribuyen de forma sim´etrica alrededor de la media o no. El coeficiente de asimetr´ıa se define:

Coef. de asimetr´ıa = 1

N

N X

i=1

(x1−x)3+ (x2−x)3+. . .+ (xN−x)3

S∗3

x

Interpretaci´on: si el coeficiente de asimetr´ıa es

Cero, la distribuci´on es sim´etrica respectro a la media.

Positivo, la distribuci´on es asim´etrica a la derecha.

(9)

3.4 Medidas de forma: ejemplos de asimetr´ıa

0 0.05 0.1 0.15 0.2

0 5 10 15 20 25 30 35 40

Frecuencia relativa

huswage

0 0.05 0.1 0.15 0.2

-2 -1 0 1 2 3

Frecuencia relativa

lwage

Caso 1 Caso 2

Media 7.5 1.2

C.V. 0.56 0.60

(10)

3.4 Medidas de forma: la curtosis

Las medidas de formareflejan otras caracter´ısticas del histograma.

El coeficiente de apuntamiento o curtosis

El apuntamiento o curtosis de una distribuci´on se refiere a lo picuda o plana que es. El coeficiente de apuntamiento o curtosis se define:

Coef. de curtosis = 1

N

N X

i=1

(x1−x)4+ (x2−x)4+. . .+ (xN−x)4

S∗4

x

Interpretaci´on: se compara con una distribuci´on de referencia. Si es

Tres, la distribuci´on es la normal (mesoc´urtica).

Mayor que 3, la distribuci´on es m´as apuntada que la normal (leptoc´urtica).

(11)

3.4 Medidas de forma: ejemplos de curtosias

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

-5 0 5 10 15 20 25 30 35 40

Densidad

huswage

huswage N(7.4822,4.2306) Estadístico para el contraste de normalidad:

Chi-cuadrado(2) = 340.874, valor p = 0.00000

0 0.5 1 1.5 2 2.5

0 0.2 0.4 0.6 0.8 1 1.2

Densidad

bmktshr

bmktshr N(0.61011,0.19644) Estadístico para el contraste de normalidad:

Chi-cuadrado(2) = 187.003, valor p = 0.00000

Caso 1 Caso 2

Media 7.5 0.6

C.V. 0.56 0.32

Asimetr´ıa 2.3 0.1

(12)

4. Medidas de desigualdad

4.1 Medidas de concentraci´on de una distribuci´on.

4.2 Curva de Lorenz: c´alculo e interpretaci´on.

4.3 ´Indice de Gini: c´alculo e interpretaci´on.

Bibliograf´ıa:

Mart´ın Pliego, J. (2004),Introducci´on a la Estad´ıstica Econ´omica y

(13)

4.1 Medidas de concentraci´

on

En Estad´ıstica se entiende por concentraci´on de una distribuci´on el grado de equidad en el reparto de los valores de una variable entre el colectivo estudiado.

Consideramos dos estad´ısticos que miden el grado de concentraci´on de una distribuci´on:

(14)

Ejemplo. (Fuente:Mart´ın Pliego, 1994, p´

ag. 190.)

Sup´ongase que dos padres de familia, cada uno de ellos con cuatro hijos, deciden repartir su patrimonio de la siguiente forma:

Padre A Padre B

Primer hijo 600 7200

Segundo hijo 3000 7800

Tercer hijo 1800 8400

Cuarto hijo 600 6600

Total 6000 30000

(15)

Ejemplo. (Mart´ın Pliego, 1994)

Padre A Padre B Padre A Padre B

(t´erminos absolutos) (t´erminos relativos)

Primer hijo 600 7200 10 % 24 %

Segundo hijo 3000 7800 50 % 26 %

Tercer hijo 1800 8400 30 % 28 %

Cuarto hijo 600 6600 10 % 22 %

(16)

4.2. Curva de Lorenz: ejemplo

X = cantidad a heredar.

Dos conjuntos de datos: Familia A y familia B.

1. Reparto de familia A

Tres clases,k = 3: x1 = 600,x2= 1800,x3 = 3000.

ni = no de hijos que recibe la cantidadxi,i = 1,2,3.

fi= proporci´on de hijos que recibe la cantidad xi,i = 1,2,3.

Fi = proporci´on de hijos que recibe una cantidad igual o menor que

(17)

4.2. Curva de Lorenz: ejemplo

Tabla de frecuencias de la familia A

xi ni porci´on de la herencia fi Fi

600 2 0,5 0,5

1800 1 0,25 0,75

3000 1 0,25 1

Total 4 1

-La clasex1 = 600 tiene asignadax1×n1 = 600×2 = 1200 euros.

x2= 1800 tiene asignadax2×n2 = 1800 euros.

x3= 3000 tiene asignadax2×n2 = 3000 euros.

(18)

4.2. Curva de Lorenz: ejemplo

Tabla de frecuencias de la familia A (cont.)

xi ni porci´on de la herencia fi Fi

600 2 6006000×2 = 0,2 0,5 0,5

1800 1 18006000×1 = 0,3 0,25 0,75

3000 1 30006000×1 = 0,5 0,25 1

Suma 4 1 1

-xi×ni= cantidad asignada a la clase xi,i = 1,2,3.

M =P3

i=1xi ×ni= total a repartir omasa total.

qi = Porci´on de herencia que recibe la clasexi =

xi×ni

(19)

4.2. Curva de Lorenz: ejemplo

Tabla de frecuencias de la familia A

xi ni qi fi porci´on acumulada Fi

600 2 0,2 0,5 0,2 0,5

1800 1 0,3 0,25 0,2+0,3=0,5 0,75

3000 1 0,5 0,25 0,2+0,3+0,5=1 1

Suma 4 1 1 -

-Qi= Porci´on de la herencia acumulada hasta clase i,i = 1,2,3.

(20)

Curva de Lorenz para reparto de herencias

25 % 50 % 75 % 100 %

25 % 50 % 75 % 100 %

(21)

4.3 ´Indice de Gini

El ´ındice de Gini es una medida de concentraci´on de la distribuci´on.

Mide el ´area que hay entre la bisectriz y la curva de Lorenz.

Se define:

IG = (F1−Q1) + (F2−Q2) +· · ·+ (FK−1−QK−1) (F1+F2+· · ·+FK−1)

=

PK−1

i=1 (Fi−Qi)

PK−1 i=1 Fi

Si IG=1, la concentraci´on es m´axima.

(22)

4.3. ´Indice de Gini: ejemplo

Tabla de frecuencias de la familia A

xi ni qi fi Qi Fi Fi−Qi

600 2 0,2 0,5 0,2 0,5 0,3

1800 1 0,3 0,25 0,2+0,3=0,5 0,75 0,25

3000 1 0,5 0,25 0,2+0,3+0,5=1 1 0

Suma 4 1 1 -

Figure

Actualización...

Referencias

Actualización...