Guia Indice de Gini y Curva de Lorenz

Loading.... (view fulltext now)

Loading....

Loading....

Loading....

Loading....

Texto completo

(1)

Curva de Lorenz e Indice de Gini

Curva de Lorenz

La curva de Lorenz es útil para demostrar la diferencia entre dos distribuciones: por ejemplo quantiles de población contra quantiles de ingresos. También es útil para comparar una distribución con relación a alguna distribución base (referencia), por ejemplo observado contra frecuencias esperadas.

Ejemplo

POBLACION INGRESO Grupo Porcentaj e (decil) Porcentaje Acumulado Porcentaj e Porcentaje Acumulado Los mas ricos 1 10 10 30 30

2 10 20 20 50 3 10 30 10 60 4 10 40 10 70 5 10 50 10 80 6 10 60 5 85 7 10 70 5 90 8 10 80 4 94 9 10 90 3 97

Los mas pobres 10 10 100 3 100 Source: Griffith & Amrhein

Gráfico de los Datos de la Tabla

(2)

CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Interpretación de la Diagonal

Cuándo la proporción de observaciones en cada quartil para la distribución 1 es igual a la proporción de observaciones en cada quartil para la distribución 2, los valores trazan una línea recta que forma una diagonal (por ejemplo. % población). Es decir, las distribuciones son proporcionalmente iguales.

Interpretación de la Curva de Lorenz

La curva de Lorenz es el resultado de cuando las proporciones difieren. El grado de la curvatura nos dice cuan diferentes las dos distribuciones son. El grado de la diferencia se puede medir directamente del gráfico: es la distancia vertical entre la diagonal y la curva de Lorenz.

Como Crear la Curva Lorenz

1. Calcule la frecuencia relativa para cada variable - es decir el porcentaje del total. 2. Sitúe las observaciones de acuerdo a la proporción de las variables - es decir Y/X.

3. Construya una tabla de frecuencias acumuladas para cada variable de las observaciones clasificadas. 4. Trace las frecuencias relativas acumulativas y la diagonal.

Otro Ejemplo

Empleo de las Herramientas Maquinarias vs. Industria Automovilística

Datos Originales

X

Y

Region A

30

30

Region B

20

15

Region C

10

8

Region D

10

5

Region E

20

19

Region F

30

23

Procedimiento para la Curva de Lorenz

1. Rank by Ratio 2. Conversión a Porcentajes 3. Acumulado Y/X X% Y% Cx Cy D 0.50 8.30 5.00 8.3 5 B 0.75 16.70 15.00 25 20 F 0.77 25.00 23.00 50 43 C 0.80 8.30 8.00 58 51 E 0.95 16.70 19.00 75 70 A 1.00 25.00 30.00 100 100

(3)

Rango de la Curva de Lorenz

En el caso más extremo, el 100 por ciento de la primera distribución se asocia con el 0 por ciento de la segunda distribución. Es decir, cuándo una variable es presente la otra está ausente.

En este caso la curva de Lorenz sigue el eje X hacia la derecha del gráfico, es decir, tomando la forma de un triángulo. El rango se encuentra entre 0% y 100%

El Coeficiente o Indice de Gini

El Coeficiente de Gini es una medida de resumen que captura la desviación mostrada en la curva de Lorenz.

Se aplica a:

VARIABLES QUE SIGNIFICAN UN RECURSO QUE SE DISTRIBUYE ENTRE UNOS ELEMENTOS

EJEMPLOS DE VARIABLES RENTA PRODUCCIÓN SALARIO HERENCIA Uso:

MEDIR SI LA DISTRIBUCIÓN TOTAL DEL RECURSO ENTRE LOS ELEMENTOS ES EQUITATIVA O NO

Será equitativa si se reparte de forma equilibrada entre todos los elementos

No será equitativa cuando unos pocos elementos acaparen la mayor parte del recurso

Compara:

LAS PROPORCIONES DE RECURSO REPARTIDAS HASTA UNA CANTIDAD (Qi)

CON LAS PROPORCIONES DE INDIVIDUOS QUE SE LO HAN REPARTIDO HASTA ESA CANTIDAD (Pi)

Obtención de Qi y Pi

Las medidas de formapermiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva:

(4)

CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra.

b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares.

c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra.

a) Concentración

Para medir el nivel de concentración de una distribucón de frecuencia se pueden utilizar distintos indicadores, entre ellos el Indice de Gini.

Este índice se calcula aplicando la siguiente fórmula: Σ (pi - qi) ---IG =

Σ pi

(i toma valores entre 1 y n-1)

En donde pi mide el porcentaje de individuos de la muestra que presentan un valor igual o inferior al

de xi.

n1 + n2 + n3 + ... + ni

--- x 100

pi =

n

Mientras que qi se calcula aplicando la siguiente fórmula:

(X1*n1) + (X2*n2) + ... + (Xi*ni)

---x 100

qi =

∑(X1*n1) + (X2*n2) + ... + (Xn*nn)

El Índice Gini (IG) puede tomar valores entre 0 y 1:

IG = 0: concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango. IG = 1: concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.

Interpretación

El coeficiente de Gini a menudo es referido como un índice de desigualdad dado que mide el grado de asociación entre dos variables:

• Coeficiente de variables de asociación geográfica. • Coeficiente de mercadotecnia

• Concentración de la Población • Coeficiente del área de localización • Segregación Residencial

(5)

Limitaciones del Coeficiente de Gini

• Debe ser capaz de expresar los datos como una frecuencia. • No puede tener los valores negativos de los datos.

• No pueden estudiar las variables espaciales continuas - es decir, usted necesita las categorías. • El valor de G depende de la distribución base (por ejemplo. Área). Como la base aumenta el valor

de G (Gini) desde el cero.

• Definición delas fronteras espaciales:

Se superpone (sensible a la definición de la frontera), el nuevo arreglo (insensible a la distribución entre áreas).

Trazo de la Probabilidad Normal

Prueba de la normalidad:

El trazo o ploteo observó la probabilidad acumulada contra la probabilidad acumulada esperada (derivada de la tabla normal).

En Resumen:

El coeficiente Gini data de 1912, y mide el grado en que la distribución del ingreso se desvia de una distribución proporcional (igualitaria aunque algunos autores dicen equitativa).

(6)

CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Se basa en la curva de Lorenz. En el semieje de las abscisas se indica la población en percentiles o quintiles o porcentajes (desde los mas pobres a los mas ricos). En el semieje positivo de las ordenadas se colocan los porcentajes de la renta de 0 a 100, en fracciones de 20. Si marcamos con un punto la relación población - ingreso, obtenemos la curva de Lorenz. Una distribución igualitaria seria: al 20% de la población le corresponde el 20% del ingreso, al 40% el 40% de los ingresos. Lo cual daría una recta con pendiente de 45 grados.

En la realidad se obtiene una curva cuya concavidad mira hacia el semieje positivo de las ordenadas (el segmento de la torta que le corresponde a los ricos es proporcionalmente mas grande). El coeficiente de Gini indica la relación entre el área bajo la curva teórica (un triangulo) y el área bajo la curva de Lorenz. Va entre 0 y 1, valores teóricos. El valor 0 correspondería a una distribución igualitaria y el 1 a una distribución en la situación de desigualdad absoluta (el hogar mas rico se lleva todo y el resto nada).

Ejemplo: vamos a calcular el Índice Gini de una serie de datos con los sueldos de los empleados de una empresa (millones pesetas).

Sueldos Empleados (Frecuencias absolutas) Frecuencias relativas

(Miles de Pesos) Simple Acumulada Simple Acumulada

3,5 10 10 25,0% 25,0% 4,5 12 22 30,0% 55,0% 6,0 8 30 20,0% 75,0% 8,0 5 35 12,5% 87,5% 10,0 3 38 7,5% 95,0% 15,0 1 39 2,5% 97,5% 20,0 1 40 2,5% 100,0%

Calculamos los valores que necesitamos para aplicar la fórmula del Índice de Gini:

Xi ni ΣΣΣΣni pi Xi * ni ΣΣΣΣ Xi * ni qi pi - qi 3,5 10 10 25,0 35,0 35,0 14,1 10,9 4,5 12 22 55,0 54,0 89,0 36,0 19,0 6,0 8 30 75,0 48,0 137,0 55,4 19,6 8,0 5 35 87,5 40,0 177,0 71,6 15,9 10,0 3 38 95,0 30,0 207,0 83,8 11,2 15,0 1 39 97,5 15,0 222,0 89,8 7,7 25,0 1 40 100,0 25,0 247,0 100,0 0 Σpi(entre 1 y n-1) = 435,0 x Σ (pi - qi) (entre 1 y n-1 ) = 84,3 Por lo tanto: IG = 84,3 / 435,0 = 0,19

Un Índice Gini de 0,19 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de concentración no es excesivamente alto.

Ejemplo: Ahora vamos a analizar nuevamente la muestra anterior, pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor concentración de renta en unas pocas personas.

(7)

Sueldos Empleados (Frecuencias absolutas) Frecuencias relativas

(Miles de Pesos) Simple Acumulada Simple Acumulada

3,5 10 10 25,0% 25,0% 4,5 10 20 25,0% 50,0% 6,0 8 28 20,0% 70,0% 8,0 5 33 12,5% 82,5% 10,0 3 36 7,5% 90,0% 15,0 0 36 0,0% 90,0% 20,0 4 40 10,0% 100,0%

En este caso obtendríamos los siguientes datos:

Xi ni ΣΣΣΣni pi Xi * ni ΣΣΣΣ Xi * ni qi pi - qi 3,5 10 10 25,0 35 35 11,7 13,26 4,5 10 20 50,0 45 80 26,8 23,15 6,0 8 28 70,0 48 128 43,0 27,05 8,0 5 33 82,5 40 168 56,4 26,12 10,0 3 36 90,0 30 198 66,4 23,56 15,0 0 36 90,0 0 198 66,4 23,56 25,0 4 40 100,0 100 298 100,0 0,00 ΣΣΣΣpi(entre 1 y n-1) = 407,5 x ΣΣΣΣ (pi - qi) (entre 1 y n-1 ) = 136,69

El Índice Gini sería:

IG = 136,69 / 407,5 = 0,34

El Índice Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas que hemos comentado.

A continuación un ejemplo para Datos Agrupados:

Frecuencia marca xini ui qi = (ui/un) 100 pi = (Ni/n) 100 pi - qi Li-1 - Li xi ni Ni 0 - 50 25 23 23 575 575 1,48 8,85 7,37 50 - 100 75 72 95 5400 5975 15,38 36,54 21,16 100 - 150 125 62 157 7750 13725 35,33 60,38 25,06 150 - 200 175 48 205 8400 22125 56,95 78,85 21,90 200 - 250 225 19 224 4275 26400 67,95 86,15 18,20 250 - 300 275 8 232 2200 28600 73,62 89,23 15,61 300 - 350 325 14 246 4550 33150 85,33 94,62 9,29 350 - 400 375 7 253 2625 35775 92,08 97,31 5,22 400 - 450 425 5 258 2125 37900 97,55 99,23 1,68 450 - 500 475 2 260 950 38850 100,00 100,00 0,00 260 ΣΣΣΣ xini= un= 38850 ΣΣΣΣpi= 651,15 ΣΣΣΣ (pi - qi)= 125,48

El Índice Gini sería:

Figure

Actualización...

Referencias

Actualización...