MEDIDAS DE CONCENTRACION Objetivos del módulo 6:

Anuncio
ESTADISTICA LABORAL
Relaciones Laborales
Facultad de Derecho
Profesores: Adjunto: Mariela Quiñones - Asistente: Mariana Cabrera
MEDIDAS DE CONCENTRACION
Objetivos del módulo 6:
1. Presentar herramientas que permiten analizar las distribuciones de frecuencias univariadas desde el punto
de vista de la concentración: curva de Lorenz e índice de Gini.
2.
Familiarizarse con el uso de estas herramientas y ver cómo complementan a las otras herramientas de
análisis univariado.
Conceptos clave del módulo 6:
Masa parcial y total de una variable
Concentración
Curva de concentración o curva de Lorenz
Equidistribución y máxima concentración
Indice de Gini
6.1 INTRODUCCION
Hemos aprendido en sesiones anteriores cómo caracterizar la distribución de una variable a
partir de la tabla de frecuencias, de las medidas resumen o estadísticos de la misma e incluso
graficándola. Al analizar estas características hemos puesto énfasis en algunos aspectos como
por ejemplo el estudio de la heterogeneidad u homogeneidad de la distribución y la asimetría de
la misma.
En el caso de las variables con sistema de categorías cuantitativo son varias las medidas que
tenemos para estudiar estos aspectos.
Hay algunas características de una población en las que el grado de heterogeneidad y sobre
todo el tipo de asimetría en su distribución pueden revestir un especial interés, y para abordar
su estudio vamos a introducir nuevas herramientas estadísticas, que permiten visualizar la
concentración.
Se trata de variables en las cuales sus valores (categorías) significan cantidades de algún
elemento para los individuos e interesa ver que tan equitativo o desigual es el reparto de estos
elementos entre los integrantes de la población.
Por ejemplo, ¿qué grado de concentración tiene la distribución del ingreso de una población?
¿los beneficios de un sistema de seguridad social se reparten equitativamente? ¿las horas
extra de una empresa están concentradas en algunos individuos?
Introducimos nuevos conceptos:
MASA PARCIAL de una variable= xi*fi
MASA TOTAL de una variable: Un=MTV=xi*fi
X es una variable que indica con sus categorías (valores de la variable) cuántos elementos se
asocian a cada individuo.
Estas herramientas ya las hemos usado, por ejemplo, al calcular la media. Sin embargo, en
este contexto tienen un significado propio:
MASA PARCIAL: indica la cantidad total de elementos que obtienen entre todos los que
reciben una cantidad xi.
MASA TOTAL: indica la cantidad total de elementos que obtiene el conjunto de la población.
2
6.2 EJEMPLO ILUSTRATIVO
Estamos en una empresa en la que trabajan 20 personas. Cada una es remunerada de
acuerdo al puesto que ocupa, en un escalafón donde –para simplificar el planteo- supondremos
que a igual puesto, igual paga. La empresa destina mensualmente $200 mil al rubro salarios.
Esta MASA SALARIAL no se distribuye equitativamente entre los 20 empleados de la empresa,
sino que, dependiendo del lugar que ocupen en el escalafón, recibirán una mayor o menor
proporción del mismo.
Salarios según puesto en el escalafón
Puesto
Salario
Empleados según puesto
Cant.empleados
Puesto
cadetes
2000
cadetes
3
planta no calificado
4000
planta no calif
5
administrativo
6000
administrativo
4
planta calificado
8000
planta calificado
3
técnicos
15000
técnicos
2
gerentes
25000
gerentes
2
gerente general
46000
gerente general
1
Con esta información podemos construir la:
DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS DE SALARIO EN EMPRESA
Salario
f1
2000
3
4000
5
6000
4
8000
3
15000
2
25000
2
46000
1
N=
20
Fuente: Planilla de trabajo de empresa
Si quisiéramos analizar la FORMA de esta distribución, por ejemplo en cuanto a la
homogeneidad de los datos o la asimetría, podríamos trabajar con medidas que ya hemos
aprendido.
Una primer mirada a la tabla nos permite ya ir anotando que se trata de una distribución poco
homogénea, con algunos valores muy altos y una concentración de los individuos en los valores
3
más bajos de la variable. Las frecuencias relativas acumuladas nos ratifican esta observación:
por ejemplo, el 60% (Fi=0,60) de los empleados ganan como máximo $ 6000.
Xi
fi
Ni
fr
Fi
xi*ni
(xi-X)2*fi
2000
3
3
0,15
0,15
6000
192000000
4000
5
8
0,25
0,40
20000
180000000
6000
4
12
0,20
0,60
24000
64000000
8000
3
15
0,15
0,75
24000
12000000
15000
2
17
0,10
0,85
30000
50000000
25000
2
19
0,10
0,95
50000
450000000
46000
1
20
0,05
1,00
46000
1296000000
200000
2244000000
20
1,00
Media= 200000/20= $10000
Varianza= 2244000000/20= 112200000 pesos 2
Desvío = 112200000 = $10592,45
Coeficiente Variación = 10592,45*100/10000= 105,9%
El coeficiente de variación nos vuelve a dar indicios de la heterogeneidad de esta distribución.
También podemos agregar algunas medidas de posición:
Me= $6000
P25=Q1= $4000 (Primer cuartil)
P75=Q3= $8000 (Tercer cuartil)
Estas medidas nos están mostrando por un lado que el 50% de los empleados gana como
máximo $6000, y que 75% $8000, cuando hay salarios de hasta 46000 pesos en la empresa.
A su vez podemos ver que, dejando de lado a los que menos ganan y más ganan, el 50%
central gana entre $4000 y $8000.
Si comparamos estos últimos estadísticos con la Media, tenemos nuevamente indicaciones de
la asimetría de la distribución:
La Media es $4000 mayor que la Mediana, y a su vez se ubica fuera del intervalo que creamos
entre el Primer y el Tercer Cuartil, o sea me está sirviendo poco como medida de tendencia
central. Cuando una distribución tiene este comportamiento, me está indicando una fuerte
asimetría hacia la derecha, lo cual ocurre porque, como veíamos desde el comienzo, existen
algunos individuos con valores muy altos de la variable, que se distancian del resto de la
población, cuyos valores son sensiblemente más bajos.
4
Un enfoque alternativo a este camino que estudia la FORMA de la distribución es
analizar la CONCENTRACIÓN.
6.3 ANALISIS DE LA CONCENTRACION
Vamos a reescribir la tabla de frecuencias, con las columnas que nos sean útiles y observando
el cambio de nomenclatura.
Trataremos de llegar a dos datos, pi y q1 que son los que necesitamos para construir los
indicadores de CONCENTRACION.
Conceptos útiles (repaso)
Masa parcial = xi*ni Resultado de multiplicar cada valor de la variable por su frecuencia absoluta
Masa parcial acumulada Ui=  (hasta i) xi*ni Resultado de multiplicar cada valor de la variable por su
frecuencia absoluta acumulada
Masa Total de la Variable = MTV=Un=  (todas las categorías) xi*ni Es la suma de todas las masas
parciales de las variables
pi = Ni*100/N (antes Frecuencia relativa acumulada como %)
qi=Ui*100/MTV
Supongamos que tenemos 7 franjas de salarios distribuidas según Xi y que a cada una le
corresponde una frecuencia (número de trabajadores que perciben ese monto). La masa parcial
es la porción de masa salarial que se lleva cada categoría de trabajadores. Los que ganan
2000 (cadetes) se llevan 6000 pesos de la masa total de los salarios que es 200.000$. El
siguiente cuadro puede ser leído análogamente para las distintas categorías de trabajadores.
Xi
(salario)
Masa parcial: xi*fi
Masa parcial
acumulada: Ui
pi (F%)
qi
(Ui en %)
2000
fi (Nº
trabajadore
s)
3
6000
6000
15
3
4000
5
20000
26000
40
13
6000
4
24000
50000
60
25
8000
3
24000
74000
75
37
15000
2
30000
104000
85
52
25000
2
50000
154000
95
77
46000
1
46000
200000
100
100
MTV=Un= 200000
5
Lectura de la tabla:
Al 15% de los empleados con menor salario les corresponde el 3% de la masa salarial.
Al 40%, el 13% de la masa salarial.
...
Al 95% de los empleados con menor salario les asignan el 77% de la masa salarial.
En definitiva:
pi es el porcentaje acumulado de trabajadores para cada categoría de Xi
qi es el porcentaje acumulado de masa de la variable para cada categoría de Xi
6.4 CURVA DE LORENZ
Con pi y q1 es posible construir una gráfica, a la que llamaremos CURVA DE
CONCENTRACIÓN o CURVA DE LORENZ
En el eje horizontal ubicamos a pi y en eje vertical a qi.
Esta curva nos permite ver en forma gráfica lo expresado en la tabla.
Además podemos ver que sucedería en el caso de una
- equidistribución: que todos los empleados ganaran el mismo sueldo. El sueldo sería MTV/N,
o sea, 200000/20=$10000, que equivale a la MEDIA de la variable. Las diferencias entre el
valor pi y qi sería cero. Es decir, cualquier porcentaje de trabajadores recibiría ese mismo
porcentaje de masa salarial. En términos ideales la tabla sería así:
pi
qi
(pi – qi )
15
15
0
40
40
0
60
60
0
75
75
0
85
85
0
95
95
0
100
100
- máxima concentración: que un solo empleado obtuviera toda la masa salarial, y los otros 19
no recibieran ningún salario. Es decir, cualquiera sea el porcentaje de trabajadores a considerar
6
no se llevan ninguna masa salarial. Las diferencias entre pi y qi son máximas, por tanto = a pi.
Sólo el estrato superior se llevaría el 100% de la masa salarial. En términos ideales la tabla
sería así:
pi
qi
(pi – qi )
15
0
15
40
0
40
60
0
60
75
0
75
85
0
85
95
0
95
100
100
Al graficar las tres situaciones podemos comparar, observando si la curva se acerca más a la
recta de equidistribución o a la curva de máxima concentración, dándonos una idea del grado
de concentración de la situación real.
Curva de concentración del salario en empresa
qi
100
90
80
70
60
50
40
30
20
10
0
Curva de
concentración
Recta de
equidistribución
Curva de máxima
concentración
0
10
20
30
40
50
60
70
80
90 100
pi
Agregamos ahora un resumen numérico, un indicador que permita sintetizar esta información y
darnos una medida del grado de concentración.
Existen diversos indicadores que cumplen con ese objetivo. Nosotros vamos a estudiar en
particular uno que se utiliza frecuentemente: el INDICE DE GINI.
7
6. 5 INDICE DE GINI
El fundamento de este índice es que pueden establecerse n-1 desigualdades entre pi y qi (en la fila “n”
sabemos que pi=qi=100). De la amplitud de estas desigualdades dependerá el mayor o menor nivel de
desigualdad de la masa total de la variable.
Introducimos la función:
(i=1 hasta i=n-1)(pi-qi)
A su vez, sabemos que si hay una equidistribución todos los pi=qi.
Para que la fórmula anterior sea aplicable a esta situación extrema, (si los datos están
presentados en una tabla de frecuencia, hay un sola fila, ya que todos los individuos presentan
el mismo valor, y por tanto es p1=q1).En ese casi la sumatoria anterior es=0.
Ese es el límite inferior de nuestra función. Sin embargo el límite superior no es fijo, ya que
dependerá de las magnitudes de las diferencias encontradas y del número de “filas” a sumar.
Por tanto, es necesario calcular este límite en cada caso, para ver qué tan cerca o lejos está
nuestra distribución de esa situación de máxima concentración.
Para facilitar la interpretación entonces, haremos que nuestra función tome como límite superior
el valor 1.
Esto se logra dividiendo la sumatoria entre (i=1 hasta i=n-1)pi
(Recuérdese que la máxima concentración se tiene cuando todas las filas hasta n-1 tienen
qi=0).
Por tanto obtenemos el INDICE DE GINI:
Indice de Gini = (i=1 hasta i=n-1)(pi-qi) / (i=1 hasta i=n-1)pi
O simplificando, si descomponemos el numerador y el denominador nos queda
= 1 - (i=1 hasta i=n-1)qi
(i=1 hasta i=n-1)pi
INTERPRETACIÓN:
Si hay equidistribución, todos los pi =qi y por tanto el IC=0.
En caso de máxima concentración, todos los qi=0 (menos el último) y por tanto IC=1
Cuanto mayor sea la concentración, mayores serán las diferencias entre los n-1 primeros pi y qi, y por
tanto el índice se acercará más a 1.
Si comparamos diferentes indices de Gini este criterio va a ser útil para saber cual es la población más
equitativa o más concentrada.
8
PARA SEGUIR LEYENDO:
Una presentación sumamente didáctica del tema se encuentra en:
Cortés Sierra, Georgina. Material de apoyo al curso ESTADÍSTICA E INTRODUCCIÓN A LA
ECONOMETRÍA
http://eco.unex.es/georgina/indice_de_gini.htm
Medina, Fernando. Consideraciones sobre el índice de Gini para medir la concentración del
ingresoFernando Medina. Serie Estudios estadísticos y prospectivos Nº 9. División de
Estadística y Proyecciones Económicas CEPAL. santiago de Chile, marzo de 2001
http://www.eclac.org/publicaciones/xml/0/6570/lcl1493e.pdf
Profundización sobre los alcances y limitaciones del índice de Gini y otras herramientas para medir la
desigualdad y la concentración de ingresos.
Vigorito, Andrea; Amarante, Verónica; equipo técnico del INE. Pobreza y Desigualdad en
Uruguay. 2006. PNUD-INE.
http://www.ine.gub.uy/biblioteca/pobreza/Informe%20pobreza%20y%20desigualdad.pdf
Análisis de la situación nde pobreza y desigualdad en Uruguay en base a la ENHA 2006.
Bucheli, Marisa; Furtado, Magdalena. Uruguay 1998-2002: ¿quiénes ganaron y quiénes
perdieron en la crisis?
http://www.bcu.gub.uy/autoriza/peiees/jor/2004/iees03j3280804.pdf
Análisis en base a la evolución de distintos indicadores, incluyendo indicadores de concentración y
desigualdad.
9
EJERCICIOS
1. El siguiente cuadro presenta la información agregada sobre los ingresos de los hogares de la
economía A, donde existen tres grupos de familias con ingresos diferentes (al interior de cada
grupo existe homogeneidad de ingresos):
Grupo
1
2
3
Nro. de familias
50
100
50
Ingreso promedio
5,000
10,000
15,000
a. Calcula la participación en el ingreso total del 20 % de familias más pobres.
b. Calcula la participación en el ingreso total del 10 % de familias más ricas.
c. Dibuja la curva de Lorenz (utilice cuartiles de población).
d. Calcula el índice de Gini
e. En la economía B existen 100 hogares, de los cuales el 50% tiene un ingreso de 4000, el 25% de
6000 y el resto de 7000. Dibuja la curva de Lorenz (utilice cuartiles)
f. Compara la economía A y la economía B, ¿cuál de las dos es más igualitaria?
g. Calcula el índice de Gini para la economía B.
Ejercicio presentado en: ECONOMIA DESCRIPTIVA II, TEMA: POBREZA Y DISTRIBUCION DEL
INGRESO (Ejercicio 3). Prof. Verónica Amarante.
http://www.ccee.edu.uy/ensenian/catecdes/pract2006pobydist.PDF
2. Realiza un análisis de la tabla siguiente en la que se presenta la evolución del Indice de
Gini del ingreso per cápita en Uruguay urbano, por región geográfica, entre 2001 y 2006.
Busca alguna representación gráfica que muestre las principales conclusiones que has
encontrado.
Extraído de Vigorito, Andrea; Amarante, Verónica; equipo técnico del INE. Pobreza y Desigualdad en Uruguay.
2006. PNUD-INE.
http://www.ine.gub.uy/biblioteca/pobreza/Informe%20pobreza%20y%20desigualdad.pdf
Nota: El valor locativo refiere al valor que el hogar paga cuando alquila o que se estima debería pagar en caso que no
lo haga. Cuando se consideran los ingresos sin valor locativo, se resta del ingreso del hogar ese valor real o estimado.
10
Documentos relacionados
Descargar