ESTADISTICA LABORAL Relaciones Laborales Facultad de Derecho Profesores: Adjunto: Mariela Quiñones - Asistente: Mariana Cabrera MEDIDAS DE CONCENTRACION Objetivos del módulo 6: 1. Presentar herramientas que permiten analizar las distribuciones de frecuencias univariadas desde el punto de vista de la concentración: curva de Lorenz e índice de Gini. 2. Familiarizarse con el uso de estas herramientas y ver cómo complementan a las otras herramientas de análisis univariado. Conceptos clave del módulo 6: Masa parcial y total de una variable Concentración Curva de concentración o curva de Lorenz Equidistribución y máxima concentración Indice de Gini 6.1 INTRODUCCION Hemos aprendido en sesiones anteriores cómo caracterizar la distribución de una variable a partir de la tabla de frecuencias, de las medidas resumen o estadísticos de la misma e incluso graficándola. Al analizar estas características hemos puesto énfasis en algunos aspectos como por ejemplo el estudio de la heterogeneidad u homogeneidad de la distribución y la asimetría de la misma. En el caso de las variables con sistema de categorías cuantitativo son varias las medidas que tenemos para estudiar estos aspectos. Hay algunas características de una población en las que el grado de heterogeneidad y sobre todo el tipo de asimetría en su distribución pueden revestir un especial interés, y para abordar su estudio vamos a introducir nuevas herramientas estadísticas, que permiten visualizar la concentración. Se trata de variables en las cuales sus valores (categorías) significan cantidades de algún elemento para los individuos e interesa ver que tan equitativo o desigual es el reparto de estos elementos entre los integrantes de la población. Por ejemplo, ¿qué grado de concentración tiene la distribución del ingreso de una población? ¿los beneficios de un sistema de seguridad social se reparten equitativamente? ¿las horas extra de una empresa están concentradas en algunos individuos? Introducimos nuevos conceptos: MASA PARCIAL de una variable= xi*fi MASA TOTAL de una variable: Un=MTV=xi*fi X es una variable que indica con sus categorías (valores de la variable) cuántos elementos se asocian a cada individuo. Estas herramientas ya las hemos usado, por ejemplo, al calcular la media. Sin embargo, en este contexto tienen un significado propio: MASA PARCIAL: indica la cantidad total de elementos que obtienen entre todos los que reciben una cantidad xi. MASA TOTAL: indica la cantidad total de elementos que obtiene el conjunto de la población. 2 6.2 EJEMPLO ILUSTRATIVO Estamos en una empresa en la que trabajan 20 personas. Cada una es remunerada de acuerdo al puesto que ocupa, en un escalafón donde –para simplificar el planteo- supondremos que a igual puesto, igual paga. La empresa destina mensualmente $200 mil al rubro salarios. Esta MASA SALARIAL no se distribuye equitativamente entre los 20 empleados de la empresa, sino que, dependiendo del lugar que ocupen en el escalafón, recibirán una mayor o menor proporción del mismo. Salarios según puesto en el escalafón Puesto Salario Empleados según puesto Cant.empleados Puesto cadetes 2000 cadetes 3 planta no calificado 4000 planta no calif 5 administrativo 6000 administrativo 4 planta calificado 8000 planta calificado 3 técnicos 15000 técnicos 2 gerentes 25000 gerentes 2 gerente general 46000 gerente general 1 Con esta información podemos construir la: DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS DE SALARIO EN EMPRESA Salario f1 2000 3 4000 5 6000 4 8000 3 15000 2 25000 2 46000 1 N= 20 Fuente: Planilla de trabajo de empresa Si quisiéramos analizar la FORMA de esta distribución, por ejemplo en cuanto a la homogeneidad de los datos o la asimetría, podríamos trabajar con medidas que ya hemos aprendido. Una primer mirada a la tabla nos permite ya ir anotando que se trata de una distribución poco homogénea, con algunos valores muy altos y una concentración de los individuos en los valores 3 más bajos de la variable. Las frecuencias relativas acumuladas nos ratifican esta observación: por ejemplo, el 60% (Fi=0,60) de los empleados ganan como máximo $ 6000. Xi fi Ni fr Fi xi*ni (xi-X)2*fi 2000 3 3 0,15 0,15 6000 192000000 4000 5 8 0,25 0,40 20000 180000000 6000 4 12 0,20 0,60 24000 64000000 8000 3 15 0,15 0,75 24000 12000000 15000 2 17 0,10 0,85 30000 50000000 25000 2 19 0,10 0,95 50000 450000000 46000 1 20 0,05 1,00 46000 1296000000 200000 2244000000 20 1,00 Media= 200000/20= $10000 Varianza= 2244000000/20= 112200000 pesos 2 Desvío = 112200000 = $10592,45 Coeficiente Variación = 10592,45*100/10000= 105,9% El coeficiente de variación nos vuelve a dar indicios de la heterogeneidad de esta distribución. También podemos agregar algunas medidas de posición: Me= $6000 P25=Q1= $4000 (Primer cuartil) P75=Q3= $8000 (Tercer cuartil) Estas medidas nos están mostrando por un lado que el 50% de los empleados gana como máximo $6000, y que 75% $8000, cuando hay salarios de hasta 46000 pesos en la empresa. A su vez podemos ver que, dejando de lado a los que menos ganan y más ganan, el 50% central gana entre $4000 y $8000. Si comparamos estos últimos estadísticos con la Media, tenemos nuevamente indicaciones de la asimetría de la distribución: La Media es $4000 mayor que la Mediana, y a su vez se ubica fuera del intervalo que creamos entre el Primer y el Tercer Cuartil, o sea me está sirviendo poco como medida de tendencia central. Cuando una distribución tiene este comportamiento, me está indicando una fuerte asimetría hacia la derecha, lo cual ocurre porque, como veíamos desde el comienzo, existen algunos individuos con valores muy altos de la variable, que se distancian del resto de la población, cuyos valores son sensiblemente más bajos. 4 Un enfoque alternativo a este camino que estudia la FORMA de la distribución es analizar la CONCENTRACIÓN. 6.3 ANALISIS DE LA CONCENTRACION Vamos a reescribir la tabla de frecuencias, con las columnas que nos sean útiles y observando el cambio de nomenclatura. Trataremos de llegar a dos datos, pi y q1 que son los que necesitamos para construir los indicadores de CONCENTRACION. Conceptos útiles (repaso) Masa parcial = xi*ni Resultado de multiplicar cada valor de la variable por su frecuencia absoluta Masa parcial acumulada Ui= (hasta i) xi*ni Resultado de multiplicar cada valor de la variable por su frecuencia absoluta acumulada Masa Total de la Variable = MTV=Un= (todas las categorías) xi*ni Es la suma de todas las masas parciales de las variables pi = Ni*100/N (antes Frecuencia relativa acumulada como %) qi=Ui*100/MTV Supongamos que tenemos 7 franjas de salarios distribuidas según Xi y que a cada una le corresponde una frecuencia (número de trabajadores que perciben ese monto). La masa parcial es la porción de masa salarial que se lleva cada categoría de trabajadores. Los que ganan 2000 (cadetes) se llevan 6000 pesos de la masa total de los salarios que es 200.000$. El siguiente cuadro puede ser leído análogamente para las distintas categorías de trabajadores. Xi (salario) Masa parcial: xi*fi Masa parcial acumulada: Ui pi (F%) qi (Ui en %) 2000 fi (Nº trabajadore s) 3 6000 6000 15 3 4000 5 20000 26000 40 13 6000 4 24000 50000 60 25 8000 3 24000 74000 75 37 15000 2 30000 104000 85 52 25000 2 50000 154000 95 77 46000 1 46000 200000 100 100 MTV=Un= 200000 5 Lectura de la tabla: Al 15% de los empleados con menor salario les corresponde el 3% de la masa salarial. Al 40%, el 13% de la masa salarial. ... Al 95% de los empleados con menor salario les asignan el 77% de la masa salarial. En definitiva: pi es el porcentaje acumulado de trabajadores para cada categoría de Xi qi es el porcentaje acumulado de masa de la variable para cada categoría de Xi 6.4 CURVA DE LORENZ Con pi y q1 es posible construir una gráfica, a la que llamaremos CURVA DE CONCENTRACIÓN o CURVA DE LORENZ En el eje horizontal ubicamos a pi y en eje vertical a qi. Esta curva nos permite ver en forma gráfica lo expresado en la tabla. Además podemos ver que sucedería en el caso de una - equidistribución: que todos los empleados ganaran el mismo sueldo. El sueldo sería MTV/N, o sea, 200000/20=$10000, que equivale a la MEDIA de la variable. Las diferencias entre el valor pi y qi sería cero. Es decir, cualquier porcentaje de trabajadores recibiría ese mismo porcentaje de masa salarial. En términos ideales la tabla sería así: pi qi (pi – qi ) 15 15 0 40 40 0 60 60 0 75 75 0 85 85 0 95 95 0 100 100 - máxima concentración: que un solo empleado obtuviera toda la masa salarial, y los otros 19 no recibieran ningún salario. Es decir, cualquiera sea el porcentaje de trabajadores a considerar 6 no se llevan ninguna masa salarial. Las diferencias entre pi y qi son máximas, por tanto = a pi. Sólo el estrato superior se llevaría el 100% de la masa salarial. En términos ideales la tabla sería así: pi qi (pi – qi ) 15 0 15 40 0 40 60 0 60 75 0 75 85 0 85 95 0 95 100 100 Al graficar las tres situaciones podemos comparar, observando si la curva se acerca más a la recta de equidistribución o a la curva de máxima concentración, dándonos una idea del grado de concentración de la situación real. Curva de concentración del salario en empresa qi 100 90 80 70 60 50 40 30 20 10 0 Curva de concentración Recta de equidistribución Curva de máxima concentración 0 10 20 30 40 50 60 70 80 90 100 pi Agregamos ahora un resumen numérico, un indicador que permita sintetizar esta información y darnos una medida del grado de concentración. Existen diversos indicadores que cumplen con ese objetivo. Nosotros vamos a estudiar en particular uno que se utiliza frecuentemente: el INDICE DE GINI. 7 6. 5 INDICE DE GINI El fundamento de este índice es que pueden establecerse n-1 desigualdades entre pi y qi (en la fila “n” sabemos que pi=qi=100). De la amplitud de estas desigualdades dependerá el mayor o menor nivel de desigualdad de la masa total de la variable. Introducimos la función: (i=1 hasta i=n-1)(pi-qi) A su vez, sabemos que si hay una equidistribución todos los pi=qi. Para que la fórmula anterior sea aplicable a esta situación extrema, (si los datos están presentados en una tabla de frecuencia, hay un sola fila, ya que todos los individuos presentan el mismo valor, y por tanto es p1=q1).En ese casi la sumatoria anterior es=0. Ese es el límite inferior de nuestra función. Sin embargo el límite superior no es fijo, ya que dependerá de las magnitudes de las diferencias encontradas y del número de “filas” a sumar. Por tanto, es necesario calcular este límite en cada caso, para ver qué tan cerca o lejos está nuestra distribución de esa situación de máxima concentración. Para facilitar la interpretación entonces, haremos que nuestra función tome como límite superior el valor 1. Esto se logra dividiendo la sumatoria entre (i=1 hasta i=n-1)pi (Recuérdese que la máxima concentración se tiene cuando todas las filas hasta n-1 tienen qi=0). Por tanto obtenemos el INDICE DE GINI: Indice de Gini = (i=1 hasta i=n-1)(pi-qi) / (i=1 hasta i=n-1)pi O simplificando, si descomponemos el numerador y el denominador nos queda = 1 - (i=1 hasta i=n-1)qi (i=1 hasta i=n-1)pi INTERPRETACIÓN: Si hay equidistribución, todos los pi =qi y por tanto el IC=0. En caso de máxima concentración, todos los qi=0 (menos el último) y por tanto IC=1 Cuanto mayor sea la concentración, mayores serán las diferencias entre los n-1 primeros pi y qi, y por tanto el índice se acercará más a 1. Si comparamos diferentes indices de Gini este criterio va a ser útil para saber cual es la población más equitativa o más concentrada. 8 PARA SEGUIR LEYENDO: Una presentación sumamente didáctica del tema se encuentra en: Cortés Sierra, Georgina. Material de apoyo al curso ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA http://eco.unex.es/georgina/indice_de_gini.htm Medina, Fernando. Consideraciones sobre el índice de Gini para medir la concentración del ingresoFernando Medina. Serie Estudios estadísticos y prospectivos Nº 9. División de Estadística y Proyecciones Económicas CEPAL. santiago de Chile, marzo de 2001 http://www.eclac.org/publicaciones/xml/0/6570/lcl1493e.pdf Profundización sobre los alcances y limitaciones del índice de Gini y otras herramientas para medir la desigualdad y la concentración de ingresos. Vigorito, Andrea; Amarante, Verónica; equipo técnico del INE. Pobreza y Desigualdad en Uruguay. 2006. PNUD-INE. http://www.ine.gub.uy/biblioteca/pobreza/Informe%20pobreza%20y%20desigualdad.pdf Análisis de la situación nde pobreza y desigualdad en Uruguay en base a la ENHA 2006. Bucheli, Marisa; Furtado, Magdalena. Uruguay 1998-2002: ¿quiénes ganaron y quiénes perdieron en la crisis? http://www.bcu.gub.uy/autoriza/peiees/jor/2004/iees03j3280804.pdf Análisis en base a la evolución de distintos indicadores, incluyendo indicadores de concentración y desigualdad. 9 EJERCICIOS 1. El siguiente cuadro presenta la información agregada sobre los ingresos de los hogares de la economía A, donde existen tres grupos de familias con ingresos diferentes (al interior de cada grupo existe homogeneidad de ingresos): Grupo 1 2 3 Nro. de familias 50 100 50 Ingreso promedio 5,000 10,000 15,000 a. Calcula la participación en el ingreso total del 20 % de familias más pobres. b. Calcula la participación en el ingreso total del 10 % de familias más ricas. c. Dibuja la curva de Lorenz (utilice cuartiles de población). d. Calcula el índice de Gini e. En la economía B existen 100 hogares, de los cuales el 50% tiene un ingreso de 4000, el 25% de 6000 y el resto de 7000. Dibuja la curva de Lorenz (utilice cuartiles) f. Compara la economía A y la economía B, ¿cuál de las dos es más igualitaria? g. Calcula el índice de Gini para la economía B. Ejercicio presentado en: ECONOMIA DESCRIPTIVA II, TEMA: POBREZA Y DISTRIBUCION DEL INGRESO (Ejercicio 3). Prof. Verónica Amarante. http://www.ccee.edu.uy/ensenian/catecdes/pract2006pobydist.PDF 2. Realiza un análisis de la tabla siguiente en la que se presenta la evolución del Indice de Gini del ingreso per cápita en Uruguay urbano, por región geográfica, entre 2001 y 2006. Busca alguna representación gráfica que muestre las principales conclusiones que has encontrado. Extraído de Vigorito, Andrea; Amarante, Verónica; equipo técnico del INE. Pobreza y Desigualdad en Uruguay. 2006. PNUD-INE. http://www.ine.gub.uy/biblioteca/pobreza/Informe%20pobreza%20y%20desigualdad.pdf Nota: El valor locativo refiere al valor que el hogar paga cuando alquila o que se estima debería pagar en caso que no lo haga. Cuando se consideran los ingresos sin valor locativo, se resta del ingreso del hogar ese valor real o estimado. 10