La distribución del ingreso de los trabajadores de Colombia

Anuncio
XXV Simposio Internacional de Estadística 2015
Armenia, Colombia, 5, 6, 7 y 8 de Agosto de 2015
La Distribución del Ingreso Laboral de los Trabajadores de Colombia
Un Análisis por Regresión Cuantílica.
Labor Income Distribution of Colombian Workers. A Quantile Regression Analysis
Giampaolo Orlandoni Merli1,a Josefa Ramoni Perazzi2,b Miguel Pérez Pulidol1,c
1 DEPARTAMENTO MATEMÁTICAS y F’ISICA, FACULTAD CIENCIAS EXACTAS, FISICAS, NATURALES, UNIVERSIDAD DE SANTANDER
2 PROGRAMA ADMINISTRACIÓN FINANCIERA, FACULTAD CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES, UDES
BUCARAMANGA, COLOMBIA
______________________________
Resumen
Con base en la Gran Encuesta Integrada de Hogares del DANE, (2014:3), se
analiza la distribución del ingreso laboral mediante regresión cuantílica usando
covariables como edad, nivel educativo, experiencia y género. Se corrige por sesgo
de selección con el procedimiento de Heckman. Se concluye la influencia positiva
de la experiencia y el nivel educativo en el ingreso laboral de los trabajadores,
sobre todo en los formales masculinos.
Palabras clave: regresión cuantílica, sesgo selección, ingreso laboral, Heckman.
Abstract
Based on the Colombian Household Survey 2014, and using Quantile regression,
this paper analyzes the labor income distribution considering some covariables
such as age, experience, educational level and gender. The selection bias is
corrected by Heckman’s two step procedure. The results indicate the positive
influence of experience and educational level on labor income, especially for
formal male workers.
Keywords: Quantile regression, selection bias, labor income, Heckman two step.
1- Introducción
El tema de la distribución del ingreso es fundamental en el análisis y comprensión del
crecimiento y desarrollo económico de las naciones. El objetivo de este trabajo es estudiar la
distribución del ingreso laboral de los trabajadores colombianos e identificar los principales
factores que determinan dicha distribución, mediante modelos de regresión cuantílica,
tomando como variables explicativas edad, nivel educativo, experiencia, género, entre otras, y
partiendo del supuesto de que hay diferencias según el tramo de ingresos que se considere. La
fuente de datos es la Gran Encuesta Integrada de Hogares (GEIH), para el tercer trimestre del
año 2014, y el modelo se estima para el mes de agosto de 2014.
____________________
a Profesor Titular. E-mail: [email protected] [email protected]
b Profesora Titular. E-mail: [email protected],
[email protected]
c Profesor Titular. E-mail: [email protected]
1
2
Giampaolo Orlandoni Merli y Josefa Ramoni Perazzi
2- Características de la distribución del ingreso laboral de Colombia
El ingreso laboral de la muestra de 46.774 trabajadores, correspondiente al tercer trimestre
2014, se reporta por Cuantiles en la tabla 1. Las primeras dos columnas y las dos últimas
describen el extremo inferior y superior de la distribución; las columnas centrales describen sus
deciles y quintiles. Se observa una gran desigualdad en el ingreso laboral de los trabajadores
colombianos: el percentil 95 incluye el 9.9% de la muestra de trabajadores, de los cuales el
0.8% tiene un ingreso promedio mensual de 45 millones de pesos. Por otra parte, el percentil 5
recoge los trabajadores que reciben un ingreso mensual de 90 mil pesos o menos. La posición
relativa de un trabajador se puede identificar en la tabla: si su ingreso es de 3 millones de pesos
mensuales, está por encima del percentil 95, mientras que si recibe el salario mínimo, entonces
se ubica en el percentil 50 (mediana del salario laboral).
Tabla 1: Ingreso laboral por percentiles (1000$). Colombia, 3er Trimestre 2014.
Percentil
1
Ingreso
30
5
90
10
20
30
40
50
60
70
80
90
95
99
160
300
480
600
617
730
889 1.200 1.800 2.600 5.000
N. Trab
617 1.734 2.416 4.841 4.577 5.240 4.012 4.651 4.654 5.827 3.588 2.300 2.317
% Trab
1,3
3,7
5,2
10,3
9,8
11,2
8,6
9,9
9,9
12,5
7,7
4,9
5,0
Fuente: Elaboración propia a partir de la Gran Encuesta de Hogares del DANE, 2014.
La tabla 2 muestra la distribución cuantílica del ingreso, clasificada por nivel educativo, sector
de empleo (formal, informal) y género. El ingreso promedio de trabajadores formales es un
86% mayor que el de trabajadores informales, mientras que las trabajadoras ganan en
promedio un 21% menos que sus colegas del género masculino. Esa diferencia varía cuando el
análisis se hace comparando los cuantiles de la distribución, como se observa en la tabla.
Tabla 2: Ingreso laboral por Cuantiles (1000$). Colombia, Agosto 2014
Cuantil
Básica
Media
Superior
Informal
Formal
Masc
Fem
Total
0.05
0.25
0.50
0.75
0.90
0.95
130
300
600
716
1,000
1,200
180
500
620
890
1,300
1,800
300
688
1,152
2,000
3,010
4,000
130
300
580
800
1,200
1,700
300
616
800
1,400
2,500
3,274
200
580
700
1,100
2,000
2,850
128
350
616
900
1,779
2,500
160
450
650
1,000
1,900
2,700
1.00
N. Trabajad
(%)
Ingreso Medio
19,000
8,364
(37%)
12,400
7,715
(35%)
19,000
6,264
(28%)
18,000
11,854
(53%)
19,000
10,489
(47%)
19,000
12,100
(54%)
16,600
10,243
(46%)
19,000
22,343
597
773
1,622
674
1252
1,028
847
945
Fuente: Elaboración propia a partir de la GEIH, DANE, 2014.
Para comparar la distribución del ingreso de los trabajadores clasificados por sector y género,
en la figura 1 se muestran las funciones de densidad no paramétricas estimadas para la muestra
del mes de agosto 2014, diferenciadas tanto por trabajadores formales e informales, como por
género masculino y femenino. Se observa que las distribuciones del ingreso de trabajadores
formales y masculinos siempre dominan a las correspondientes de los informales y
trabajadoras, tratando de igualarse en los extremos superiores de las distribuciones.
XXV Simposio de Estadística (2015)
La Distrribución del Inggreso Laboral de
d los Trabajadores de Colombbia
Un Anáálisis por Regressión Cuantil 3
Figurra1:Densidadesdelingreso
olaboralgeneeral,porsectorrdeempleoy
yporgénero(A
Agosto,2014)).
La disttribución dell ingreso labo
oral promediio de los trabbajadores collombianos, cclasificados p
por
nivel educativo,
e
secctor de emplleo (formal, informal)
i
y ggénero (M, F)) se resume een la tabla 3. El
ingreso
o laboral pro
omedio está directamente
d
influenciadoo por el nivell educativo, p
por el hecho de
tener trabajo
t
formaal y por ser de
d sexo masculino.
Tabla 3: Inggreso laboral por nivel eduucativo, sectoor y género ((1000$) Agossto 2014
Trabajo info
ormal
Trabajo form
mal
Nivel
N
Educativo
E
M
F
Total
M
F
Total
Básica
B
642
554
7885
719
432
572
6.177
2.187
N 3.587
3
2.590
1.5509
678
Media
M
808
678
9776
737
875
525
3.998
3.717
N 2.154
2
1.844
2.139 1.578
Superior
S
1.379
1
838
1.102
2.110 1.602
1.812
N 821
858
1.679
1.8890 2.695
4.585
Total
T
789
674
1.3311 1.185
1.252
530
N 6.562
6
5.292 11.854 5.5538 4.951 10.489
Fuente:
F
Elaboraación propia a partir
p
de la GEIIH, DANE, 20014.
Género
M
F
6844
461
5.096
3.268
8922
623
4.293
3.422
1.8889
1.417
2.711
3.553
1.0228
847
12.1000
10.243
Total
597
8.364
773
7.715
1.622
6.264
945
22.343
XXV
V Simposio de Estadística (20015)
4
Giampaolo Orlandoni Merli y Josefa Ramoni Perazzi
3- Estimación del modelo de regresión cuantílica condicional de los ingresos laborales.
La regresión cuantílica (RC) surge como una metodología para estimar las funciones cuantílicas
condicionales mediante la minimización de los errores absolutos ponderados asimétricamente.
El análisis de RC difiere de la regresión mínimo cuadrática por el énfasis que se hace en la
distribución de la variable dependiente: mientras que esta última estudia el efecto que cambios
en las variables explicativas ejercen sobre el valor esperado de la variable dependiente, E(Y/X),
la cuantílica estima el efecto de esos cambios en la totalidad de la distribución de la variable
dependiente. La RC genera estimaciones robustas cuando la variable dependiente no está
normalmente distribuida, proporcionando una solución a problemas de falta de normalidad y
simetría y presencia de heterocedasticidad en los datos; además, reduce la influencia de datos
outliers, ofreciendo estimadores más eficientes que los estimadores máximo verosímiles para
modelos paramétricos convencionales (Koenker, 2005).
En la RC, para una muestra Yi de ingresos laborales y un vector X de covariables observadas
para n trabajadores, el modelo de regresión lineal viene dado por Yi=Xi β(p)+Ui(p). El pCuantil de la distribución Y, condicional a X se expresa como Qp(Yi|Xi)Xi(p). La RC
minimiza la suma de errores absolutos con respecto a β(p), en la función:
Min [ Σ{p|YiXiβp|}  Σ{(1-p) |YiXiβp|}]
{β(p)} {R1}
R1=(i|Yi>XiR2=(i|Yi<Xi0<p<1
{R2}
Las diferencias observadas en los coeficientes estimados a través de los distintos cuantiles se
interpretan como diferencias en la respuesta de la variable dependiente ante cambios en las
variables independientes en diferentes puntos de la distribución condicional.
En esta investigación sobre el ingreso laboral, antes de hacer la estimación cuantílica, es
necesario resolver el problema del sesgo de selección. Si una variable dependiente está
censurada, porque no se observa un valor positivo para todos los casos, se genera una
concentración de observaciones en los valores nulos y los estimadores MCO producen
estimaciones sesgadas de los parámetros. Para corregir el sesgo de selección y obtener
estimaciones insesgadas, Heckman propone un procedimiento de estimación en dos fases.
La primera fase implica estimar modelos probit para modelar la decisión de los trabajadores de
emplearse (D=1) o no (D=0) en una actividad remunerada Pr(D=1/X)=(X). Así, se
estiman términos de corrección por sesgo de selección muestral (lambda-Mills), que controlan
por la decisión de participar o no en empleo remunerado, decisión que se refleja en la
probabilidad de observar el salario para cada individuo. Luego, en la segunda fase, se estima
mediante regresión cuantílica el modelo propuesto, incluyendo la lambda-Mills entre las
covariables.
En la tabla 4 se muestran las estimaciones de los parámetros de las distintas variables
(antigüedad, género, nivel educativo, sector de empleo y tipo de empleo), para los cuantiles
seleccionados, comparando con las estimaciones por MCO. La figura 2 muestra la evolución
del proceso cuantil, para cada variable. Se observa que el ingreso laboral está influenciado
positivamente por los años de antigüedad en el trabajo, por ser trabajador formal de género
masculino, y por tener nivel educativo alto, efecto que se incrementa a medida que se avanza
en el proceso cuantil, al pasar de cuantiles bajos a los superiores. Las estimaciones de los
parámetros para los diferentes cuantiles se diferencian significativamente de las estimaciones
promedio mínimo cuadráticas, representadas por las líneas constantes horizontales rojas.
XXV Simposio de Estadística (2015)
La Distrribución del Inggreso Laboral de
d los Trabajadores de Colombbia
Un Anáálisis por Regressión Cuantil 5
Tabla
T
4: Estim
mación por MC
CO y Regresióón Cuantílica ((logaritmo)
Variables
MCO
0.05
0.100
0.25
0.50
00.75
0.90
0.95
1669.6
889.3
8
0.06
-90.8
37.3
1443.8
137.3
-388.1
1.2
1060
1
0.144
-112.6
60.4
2005.1
204.4
-472.9
Géénero Femen
-274.9
1502.5
0.322
-153.8
57.2
2338.5
216.2
-611.2
E. Media
155.9
2096
2
0.57
-176
97.4
4444.4
193.6
-808.1
E. Superior
876.7
2337.1
0.86
-220
123.1
9990.1
161.4
-792.2
Informal
266.9
2344.9
1.76
-333.9
209.8
1948.3
168.7
-615.8
-570.6
2484.3
2.68
-455.8
324.1
27721.9
176.3
Fueente: Estimació
ón con rutina quuantreg de R. Datos
D
de la GEIIH del DANE,, 2014.
Nota: todaas las estimacio
ones son estadíssticamente signiificativas (p<0.01)
-515.8
Intercepto
An
ntigüedad
Pú
úblico
Figura22: Estimación por MCO y Regresión
R
Cuaantílica. GEIH
H, DANE, 2014.
onclusiones.
4- Co
Las esstimaciones por
p regresió
ón cuantílica permiten annalizar el coomportamien
nto del ingreeso
laborall ante cambiios en las co
ovariables, paara toda la ddistribución dde la variablle dependien
nte,
diferen
nciándose siignificativam
mente de lass estimacionnes medias producidas por regresiión
ordinaaria. Estos reesultados perrmiten observvar cómo vaaría el efecto de las covarriables para llos
diferen
ntes cuantilees. Se concluuye la imporrtancia que tiene el niveel educativo
o en el ingreeso
laborall, que mejoraa al subir en la
l escala eduucativa. Los trrabajadores ccon mejor prreparación, qque
en gen
neral trabajan
n en el secto
or formal dee la econom
mía, reciben llos mejores ingresos; y las
trabajaadoras recibeen en promed
dio salarios in
nferiores a loos de sus coleegas, aunquee esta diferen
ncia
tiende a desapareceer a medida que
q se analizaan los cuantililes superiorees de la distribución.
Refereencias.
Heckm
man, J. J. (19799). "Sample Seelection as a Sp
pecification E
Error". Econom
metrica 47 (1): 153–161.
Koenker, R. (2005). “Quantile Reggression”, CU
UP. New Yorkk.
R Devvelopment Co
ore Team (20015), R:A Lan
nguage and E
Environment for Statisticall Computing,, R
Foundaation for Statiistical Computting, Vienna, Austria.
A
XXV
V Simposio de Estadística (20015)
Descargar