XXV Simposio Internacional de Estadística 2015 Armenia, Colombia, 5, 6, 7 y 8 de Agosto de 2015 La Distribución del Ingreso Laboral de los Trabajadores de Colombia Un Análisis por Regresión Cuantílica. Labor Income Distribution of Colombian Workers. A Quantile Regression Analysis Giampaolo Orlandoni Merli1,a Josefa Ramoni Perazzi2,b Miguel Pérez Pulidol1,c 1 DEPARTAMENTO MATEMÁTICAS y F’ISICA, FACULTAD CIENCIAS EXACTAS, FISICAS, NATURALES, UNIVERSIDAD DE SANTANDER 2 PROGRAMA ADMINISTRACIÓN FINANCIERA, FACULTAD CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES, UDES BUCARAMANGA, COLOMBIA ______________________________ Resumen Con base en la Gran Encuesta Integrada de Hogares del DANE, (2014:3), se analiza la distribución del ingreso laboral mediante regresión cuantílica usando covariables como edad, nivel educativo, experiencia y género. Se corrige por sesgo de selección con el procedimiento de Heckman. Se concluye la influencia positiva de la experiencia y el nivel educativo en el ingreso laboral de los trabajadores, sobre todo en los formales masculinos. Palabras clave: regresión cuantílica, sesgo selección, ingreso laboral, Heckman. Abstract Based on the Colombian Household Survey 2014, and using Quantile regression, this paper analyzes the labor income distribution considering some covariables such as age, experience, educational level and gender. The selection bias is corrected by Heckman’s two step procedure. The results indicate the positive influence of experience and educational level on labor income, especially for formal male workers. Keywords: Quantile regression, selection bias, labor income, Heckman two step. 1- Introducción El tema de la distribución del ingreso es fundamental en el análisis y comprensión del crecimiento y desarrollo económico de las naciones. El objetivo de este trabajo es estudiar la distribución del ingreso laboral de los trabajadores colombianos e identificar los principales factores que determinan dicha distribución, mediante modelos de regresión cuantílica, tomando como variables explicativas edad, nivel educativo, experiencia, género, entre otras, y partiendo del supuesto de que hay diferencias según el tramo de ingresos que se considere. La fuente de datos es la Gran Encuesta Integrada de Hogares (GEIH), para el tercer trimestre del año 2014, y el modelo se estima para el mes de agosto de 2014. ____________________ a Profesor Titular. E-mail: gi.orlandoni@udes.edu.co orlandon@ula.ve b Profesora Titular. E-mail: j.ramoni@udes.edu.co, jramoni@ula.ve c Profesor Titular. E-mail: miguel.perez@udes.edu.co 1 2 Giampaolo Orlandoni Merli y Josefa Ramoni Perazzi 2- Características de la distribución del ingreso laboral de Colombia El ingreso laboral de la muestra de 46.774 trabajadores, correspondiente al tercer trimestre 2014, se reporta por Cuantiles en la tabla 1. Las primeras dos columnas y las dos últimas describen el extremo inferior y superior de la distribución; las columnas centrales describen sus deciles y quintiles. Se observa una gran desigualdad en el ingreso laboral de los trabajadores colombianos: el percentil 95 incluye el 9.9% de la muestra de trabajadores, de los cuales el 0.8% tiene un ingreso promedio mensual de 45 millones de pesos. Por otra parte, el percentil 5 recoge los trabajadores que reciben un ingreso mensual de 90 mil pesos o menos. La posición relativa de un trabajador se puede identificar en la tabla: si su ingreso es de 3 millones de pesos mensuales, está por encima del percentil 95, mientras que si recibe el salario mínimo, entonces se ubica en el percentil 50 (mediana del salario laboral). Tabla 1: Ingreso laboral por percentiles (1000$). Colombia, 3er Trimestre 2014. Percentil 1 Ingreso 30 5 90 10 20 30 40 50 60 70 80 90 95 99 160 300 480 600 617 730 889 1.200 1.800 2.600 5.000 N. Trab 617 1.734 2.416 4.841 4.577 5.240 4.012 4.651 4.654 5.827 3.588 2.300 2.317 % Trab 1,3 3,7 5,2 10,3 9,8 11,2 8,6 9,9 9,9 12,5 7,7 4,9 5,0 Fuente: Elaboración propia a partir de la Gran Encuesta de Hogares del DANE, 2014. La tabla 2 muestra la distribución cuantílica del ingreso, clasificada por nivel educativo, sector de empleo (formal, informal) y género. El ingreso promedio de trabajadores formales es un 86% mayor que el de trabajadores informales, mientras que las trabajadoras ganan en promedio un 21% menos que sus colegas del género masculino. Esa diferencia varía cuando el análisis se hace comparando los cuantiles de la distribución, como se observa en la tabla. Tabla 2: Ingreso laboral por Cuantiles (1000$). Colombia, Agosto 2014 Cuantil Básica Media Superior Informal Formal Masc Fem Total 0.05 0.25 0.50 0.75 0.90 0.95 130 300 600 716 1,000 1,200 180 500 620 890 1,300 1,800 300 688 1,152 2,000 3,010 4,000 130 300 580 800 1,200 1,700 300 616 800 1,400 2,500 3,274 200 580 700 1,100 2,000 2,850 128 350 616 900 1,779 2,500 160 450 650 1,000 1,900 2,700 1.00 N. Trabajad (%) Ingreso Medio 19,000 8,364 (37%) 12,400 7,715 (35%) 19,000 6,264 (28%) 18,000 11,854 (53%) 19,000 10,489 (47%) 19,000 12,100 (54%) 16,600 10,243 (46%) 19,000 22,343 597 773 1,622 674 1252 1,028 847 945 Fuente: Elaboración propia a partir de la GEIH, DANE, 2014. Para comparar la distribución del ingreso de los trabajadores clasificados por sector y género, en la figura 1 se muestran las funciones de densidad no paramétricas estimadas para la muestra del mes de agosto 2014, diferenciadas tanto por trabajadores formales e informales, como por género masculino y femenino. Se observa que las distribuciones del ingreso de trabajadores formales y masculinos siempre dominan a las correspondientes de los informales y trabajadoras, tratando de igualarse en los extremos superiores de las distribuciones. XXV Simposio de Estadística (2015) La Distrribución del Inggreso Laboral de d los Trabajadores de Colombbia Un Anáálisis por Regressión Cuantil 3 Figurra1:Densidadesdelingreso olaboralgeneeral,porsectorrdeempleoy yporgénero(A Agosto,2014)). La disttribución dell ingreso labo oral promediio de los trabbajadores collombianos, cclasificados p por nivel educativo, e secctor de emplleo (formal, informal) i y ggénero (M, F)) se resume een la tabla 3. El ingreso o laboral pro omedio está directamente d influenciadoo por el nivell educativo, p por el hecho de tener trabajo t formaal y por ser de d sexo masculino. Tabla 3: Inggreso laboral por nivel eduucativo, sectoor y género ((1000$) Agossto 2014 Trabajo info ormal Trabajo form mal Nivel N Educativo E M F Total M F Total Básica B 642 554 7885 719 432 572 6.177 2.187 N 3.587 3 2.590 1.5509 678 Media M 808 678 9776 737 875 525 3.998 3.717 N 2.154 2 1.844 2.139 1.578 Superior S 1.379 1 838 1.102 2.110 1.602 1.812 N 821 858 1.679 1.8890 2.695 4.585 Total T 789 674 1.3311 1.185 1.252 530 N 6.562 6 5.292 11.854 5.5538 4.951 10.489 Fuente: F Elaboraación propia a partir p de la GEIIH, DANE, 20014. Género M F 6844 461 5.096 3.268 8922 623 4.293 3.422 1.8889 1.417 2.711 3.553 1.0228 847 12.1000 10.243 Total 597 8.364 773 7.715 1.622 6.264 945 22.343 XXV V Simposio de Estadística (20015) 4 Giampaolo Orlandoni Merli y Josefa Ramoni Perazzi 3- Estimación del modelo de regresión cuantílica condicional de los ingresos laborales. La regresión cuantílica (RC) surge como una metodología para estimar las funciones cuantílicas condicionales mediante la minimización de los errores absolutos ponderados asimétricamente. El análisis de RC difiere de la regresión mínimo cuadrática por el énfasis que se hace en la distribución de la variable dependiente: mientras que esta última estudia el efecto que cambios en las variables explicativas ejercen sobre el valor esperado de la variable dependiente, E(Y/X), la cuantílica estima el efecto de esos cambios en la totalidad de la distribución de la variable dependiente. La RC genera estimaciones robustas cuando la variable dependiente no está normalmente distribuida, proporcionando una solución a problemas de falta de normalidad y simetría y presencia de heterocedasticidad en los datos; además, reduce la influencia de datos outliers, ofreciendo estimadores más eficientes que los estimadores máximo verosímiles para modelos paramétricos convencionales (Koenker, 2005). En la RC, para una muestra Yi de ingresos laborales y un vector X de covariables observadas para n trabajadores, el modelo de regresión lineal viene dado por Yi=Xi β(p)+Ui(p). El pCuantil de la distribución Y, condicional a X se expresa como Qp(Yi|Xi)Xi(p). La RC minimiza la suma de errores absolutos con respecto a β(p), en la función: Min [ Σ{p|YiXiβp|} Σ{(1-p) |YiXiβp|}] {β(p)} {R1} R1=(i|Yi>XiR2=(i|Yi<Xi0<p<1 {R2} Las diferencias observadas en los coeficientes estimados a través de los distintos cuantiles se interpretan como diferencias en la respuesta de la variable dependiente ante cambios en las variables independientes en diferentes puntos de la distribución condicional. En esta investigación sobre el ingreso laboral, antes de hacer la estimación cuantílica, es necesario resolver el problema del sesgo de selección. Si una variable dependiente está censurada, porque no se observa un valor positivo para todos los casos, se genera una concentración de observaciones en los valores nulos y los estimadores MCO producen estimaciones sesgadas de los parámetros. Para corregir el sesgo de selección y obtener estimaciones insesgadas, Heckman propone un procedimiento de estimación en dos fases. La primera fase implica estimar modelos probit para modelar la decisión de los trabajadores de emplearse (D=1) o no (D=0) en una actividad remunerada Pr(D=1/X)=(X). Así, se estiman términos de corrección por sesgo de selección muestral (lambda-Mills), que controlan por la decisión de participar o no en empleo remunerado, decisión que se refleja en la probabilidad de observar el salario para cada individuo. Luego, en la segunda fase, se estima mediante regresión cuantílica el modelo propuesto, incluyendo la lambda-Mills entre las covariables. En la tabla 4 se muestran las estimaciones de los parámetros de las distintas variables (antigüedad, género, nivel educativo, sector de empleo y tipo de empleo), para los cuantiles seleccionados, comparando con las estimaciones por MCO. La figura 2 muestra la evolución del proceso cuantil, para cada variable. Se observa que el ingreso laboral está influenciado positivamente por los años de antigüedad en el trabajo, por ser trabajador formal de género masculino, y por tener nivel educativo alto, efecto que se incrementa a medida que se avanza en el proceso cuantil, al pasar de cuantiles bajos a los superiores. Las estimaciones de los parámetros para los diferentes cuantiles se diferencian significativamente de las estimaciones promedio mínimo cuadráticas, representadas por las líneas constantes horizontales rojas. XXV Simposio de Estadística (2015) La Distrribución del Inggreso Laboral de d los Trabajadores de Colombbia Un Anáálisis por Regressión Cuantil 5 Tabla T 4: Estim mación por MC CO y Regresióón Cuantílica ((logaritmo) Variables MCO 0.05 0.100 0.25 0.50 00.75 0.90 0.95 1669.6 889.3 8 0.06 -90.8 37.3 1443.8 137.3 -388.1 1.2 1060 1 0.144 -112.6 60.4 2005.1 204.4 -472.9 Géénero Femen -274.9 1502.5 0.322 -153.8 57.2 2338.5 216.2 -611.2 E. Media 155.9 2096 2 0.57 -176 97.4 4444.4 193.6 -808.1 E. Superior 876.7 2337.1 0.86 -220 123.1 9990.1 161.4 -792.2 Informal 266.9 2344.9 1.76 -333.9 209.8 1948.3 168.7 -615.8 -570.6 2484.3 2.68 -455.8 324.1 27721.9 176.3 Fueente: Estimació ón con rutina quuantreg de R. Datos D de la GEIIH del DANE,, 2014. Nota: todaas las estimacio ones son estadíssticamente signiificativas (p<0.01) -515.8 Intercepto An ntigüedad Pú úblico Figura22: Estimación por MCO y Regresión R Cuaantílica. GEIH H, DANE, 2014. onclusiones. 4- Co Las esstimaciones por p regresió ón cuantílica permiten annalizar el coomportamien nto del ingreeso laborall ante cambiios en las co ovariables, paara toda la ddistribución dde la variablle dependien nte, diferen nciándose siignificativam mente de lass estimacionnes medias producidas por regresiión ordinaaria. Estos reesultados perrmiten observvar cómo vaaría el efecto de las covarriables para llos diferen ntes cuantilees. Se concluuye la imporrtancia que tiene el niveel educativo o en el ingreeso laborall, que mejoraa al subir en la l escala eduucativa. Los trrabajadores ccon mejor prreparación, qque en gen neral trabajan n en el secto or formal dee la econom mía, reciben llos mejores ingresos; y las trabajaadoras recibeen en promed dio salarios in nferiores a loos de sus coleegas, aunquee esta diferen ncia tiende a desapareceer a medida que q se analizaan los cuantililes superiorees de la distribución. Refereencias. Heckm man, J. J. (19799). "Sample Seelection as a Sp pecification E Error". Econom metrica 47 (1): 153–161. Koenker, R. (2005). “Quantile Reggression”, CU UP. New Yorkk. R Devvelopment Co ore Team (20015), R:A Lan nguage and E Environment for Statisticall Computing,, R Foundaation for Statiistical Computting, Vienna, Austria. A XXV V Simposio de Estadística (20015)