ESTIMACIÓN DEL SESGO DE SELECCIÓN PARA EL MERCADO LABORAL DE MENDOZA Lic. Iris PERLBACH de MARADONA 1 Lic. Mónica Iris CALDERÓN2 RESUMEN El interés de este trabajo se centra en estimar ecuaciones de salarios del tipo Mincer diferenciando el mercado laboral en masculino y femenino con la idea de captar las diferencias en los ingresos que no son explicadas por diferencias en las dotaciones de capital humano. El modelo se estima utilizando la técnica de corrección propuesta por Heckman para solucionar el llamado Sesgo por Selección presente en la mayoría de las estimaciones empíricas al analizarse el perfil de ingresos de personas con distintos niveles de educación. El instrumental econométrico que se utiliza es la corrección para Distribuciones Truncadas para captar el sesgo por selección a través de modelos Probit. El objetivo es medir el diferencial de los retornos marginales a la educación y a la experiencia teniendo en cuenta los salarios de reserva individuales. Las muestras comprendidas son los trabajadores femeninos y masculinos mendocinos para el año 1997. Como conclusiones del trabajo se encontraron evidencias de ausencia de sesgo por selección tanto para hombres como para mujeres. Campos temáticos: (I2) Educación (C1) Métodos Econométricos y Estadísticos: General 1 Profesor Asociado Macroeconomía I y Economía Laboral, Fac. de Ciencias Económicas, Universidad Nacional de Cuyo. 2 Profesor Titular Economía de la Educación, Fac. de Filosofía y Letras, Universidad Nacional de Cuyo y Profesor Adjunto de Econometría I, Fac. de Ciencias Económicas, Universidad Nacional de Cuyo. ESTIMATING SELECTION BIAS IN MENDOZA´S LABOUR MARKET Lic. Iris PERLBACH de MARADONA 3 Lic. Mónica Iris CALDERÓN4 ABSTRACT The purpose of this paper is to estimate wage equations of the Mincer type distinguishing between male and female workers with the aim to capture differences in earnings that cannot be explained by human capital theory. The model was estimated using Heckman,s technique to solve for the selection bias present in almost all studies that analyse earnings profiles for different levels of education and experience. The econometric tool employed to obtain the selection bias was the adjustment for censored distributions through the estimation of Probit models. The most important objective is to measure the differential of marginal returns to education and experience considering the individual reservation wage. The samples used included workers from Mendoza during 1997. We didn, t find evidence of selection bias neither in male earning profiles, nor in female,s. That means one can use the whole labour market data without spliting it. 3 Profesor Asociado Macroeconomía I y Economía Laboral, Fac. de Ciencias Económicas, Universidad Nacional de Cuyo. 4 Profesor Titular Economía de la Educación, Fac. de Filosofía y Letras, Universidad Nacional de Cuyo y Profesor Adjunto de Econometría I, Fac. de Ciencias Económicas, Universidad Nacional de Cuyo. ESTIMACIÓN DEL SESGO DE SELECCIÓN PARA EL MERCADO LABORAL DE MENDOZA Lic. Iris PERLBACH de MARADONA Lic. Mónica Iris CALDERÓN I. INTRODUCCIÓN La interpretación de la ecuación de Mincer en cuanto a tasas de retorno a la inversión en capital humano sugiere que la única distinción entre ingresos de personas proviene exclusivamente de diferencias en el nivel de educación alcanzado (cantidad de años de educación) y/o en el nivel de entrenamiento laboral (años de experiencia potencial en el mercado laboral). Se puede pensar que cada persona tiene una función de producción que transforma su capital humano (y otros insumos) en un flujo de servicios que se traducen, en definitiva, en sus ingresos laborales. Pero este enfoque puede no ser correcto si consideramos que un mayor nivel de educación o entrenamiento tiene una mayor probabilidad de participación, puesto que tiene mayores costos de oportunidad; la idea que se intenta mostrar es que puede existir lo que se denomina “sesgo por selección”: a mayor nivel educativo formal, mayor probabilidad de participación. Se cree y es lo que se intenta probar que existe un “sesgo por selección” en grupos de mayores niveles de educación o entrenamiento cuando los ingresos del mercado no alcanzan los salarios de reserva individuales. La idea básica es que en los datos de la Encuesta Permanente de Hogares (EPH), no figuran los “ingresos” de personas que no trabajan por que no desean hacerlo, ya que su salario de reserva o ingreso de propiedad es mayor al salario que obtendrían empleándose. Si esto ocurre, entonces los coeficientes de la ecuación mencionada son inconsistentes, puede existir sesgo en los parámetros estimados. La metodología de trabajo consiste en estimar el “Sesgo por Selección” a través de la técnica de corrección propuesta por Heckman. Esta técnica usa un modelo Probit que tiene por objeto medir la decisión de participación en función de las características personales y del stock de capital humano de las personas. Luego se incorpora dicha estimación en la ecuación para ingresos del tipo Mincer, donde el salario de mercado depende solamente de las dotaciones de capital humano. Se trabaja por separado la muestra correspondiente a los hombres de la muestra de las mujeres, estimando para cada caso una ecuación de participación y la posterior ecuación de salarios. La base de datos corresponde a la Encuesta Permanente de Hogares de Mayo de 1997 para el Gran Mendoza. II. ANTECEDENTES El uso de funciones de salarios se enfrenta usualmente con problemas derivados de sesgo censal de selección. Este problema se asocia a la ausencia en forma no aleatoria de observaciones dentro de la muestra, lo cual es equivalente a producir un sesgo en los coeficientes obtenidos de modelos econométricos que involucran variables obtenidas de dicha muestra. Willis y Rosen (1979) estiman perfiles de ingresos incluyendo control por sesgo de selección y por autoselección, a través de un vector de condiciones personales. Heckman (1974) propone una corrección a este problema, que posteriormente ha sido utilizada con resultados exitosos por varios autores a un conjunto de países Latinoamericanos, los cuales reúnen ciertas condiciones socioeconómicas, caracterizada por un sustancial subempleo y la presencia de pobreza estructural. Por citar algunos, Psacharopoulos y Tzannatos (1991), por ejemplo, concluyen que si en los países de menor desarrollo, la educación, la experiencia y la participación de la mujer aumentaran, entonces su remuneración crecería más que proporcionalmente. Riveros y Balmaceda (1993) probaron la presencia de sesgo por selección en El Salvador, al trabajar en discriminación en un mercado de trabajo segmentado, encontrando diferencias salariales entre hombres y mujeres. III. SESGO POR SELECCIÓN El uso de funciones de salario en el estudio de la discriminación se enfrenta normalmente con problemas derivados de selectividad o sesgo de selección. Como se sabe, este problema se asocia a la ausencia en forma no aleatoria de observaciones dentro de la muestra, lo cual es equivalente a producir un sesgo en los coeficientes obtenidos de modelos econométricos que incluyen variables obtenidas de dicha muestra. Dicho sesgo resulta del hecho que la selectividad es equivalente a omitir variables relevantes al análisis. Por ejemplo, si los hombres y las mujeres son homogéneos en sus características y el salario promedio de los hombres es Wh y el de las mujeres es Wm, entonces la diferencia D=(Wh-Wm) correspondería a una medida de discriminación. Sin embargo, si la participación de la mujer es 50 por ciento entonces será cierto que la discriminación equivale a D siempre y cuando las mujeres excluidas -es decir, aquellas que no participan en la fuerza de trabajo- posean las mismas características que aquellas que sí lo hacen (incluidas en la muestra). Si las mujeres excluidas (desempleadas y trabajadoras desalentadas e inactivas, por ejemplo) tienen características distintas a aquellas que se observan por medio de las estadísticas salariales (ocupadas, en general) las diferencias del análisis estadístico estarán dominadas por el sesgo de selección (Paredes, 1987). La discriminación medida dependerá del tipo de población que se esté excluyendo del análisis. Por ejemplo, si las mujeres observadas en la muestra, i.e., las actualmente ocupadas y perceptoras de ingreso, poseen mayores habilidades innatas que las no observadas, entonces la discriminación correctamente medida será mayor que D, debido a que el verdadero salario de las mujeres sería menor. Esto se debe a que la incorporación de aquellas no observadas, o sea, las caracterizadas por menor habilidad innata, disminuiría el salario predicho. Del mismo modo, si la población excluida tiene mayor educación que el grupo cuyos ingresos se observan efectivamente por medio de la muestra, entonces el diferencial D será una subestimación del diferencial efectivo. Estas mismas consideraciones son, por supuesto, válidas para los hombres, haciendo aconsejable la corrección por sesgo de selección para ambos grupos. La idea básica aquí es que en los datos de la Encuesta Permanente de Hogares (EPH), no figuran los “ingresos” de personas que no trabajan por que no desean hacerlo, ya que su salario de reserva o ingreso de propiedad es mayor al salario que obtendrían empleándose. El ejemplo clásico es el de la participación de la mujer en el mercado laboral: si el salario que obtendrían es muy bajo en relación de lo que ellas valoran el atender los quehaceres domésticos, educar a sus hijos, etc. no buscarán empleo. El problema es que dicho salario de reserva es el resultado de una valoración subjetiva de la persona en razón de varios conceptos: si está casada o no, la cantidad de hijos en edad escolar, su nivel de educación alcanzado, su edad, su experiencia laboral anterior, etc., y por lo tanto no es observable en datos estadísticos. El sesgo de selección proviene en gran parte del hecho de no poder observar aquellas mujeres que poseen un salario de reserva más alto o que tienen menores costos de oportunidad al permanecer en el hogar, o cuyas características le hacen más difícil obtener empleo. La exclusión no es un problema cuando las personas excluidas están distribuidas en forma aleatoria a través de diferentes grupos de calificación y niveles de capital humano o poseen las mismas características que aquellas incluidas en la muestra. No obstante, es muy probable que ello no sea así cuando se observa un mayor desempleo femenino junto a una menor tasa de participación femenina. La importancia de analizar el efecto de esta falta de representatividad de la muestra sobre la discriminación como se ha dicho, se refiere a la necesidad de contar con parámetros insesgados para poder establecer un diagnóstico apropiado en cuanto a los orígenes de las diferenciales salariales observadas. Entonces se tiene un problema de tipo estadístico - inferencial: si sabemos que los datos de salarios excluyen una parte del universo, las mujeres cuyo salario de reserva es mayor al salario que ganarían en el mercado, se tiene una regresión “censurada”, y se debe tomar en cuenta, pues de lo contrario se obtendrán estimadores no consistentes. El concepto de fondo es el de probabilidad condicional: dado que se sabe que se trabaja solamente con una parte del universo, es necesario calcular la probabilidad de participación en función de algunas variables, que no necesariamente son las mismas usadas en la estimación del modelo de tipo Mincer, y utilizar esta información en la estimación de la ecuación de salarios para evitar parámetros sesgados. Para entender mejor los efectos del sesgo de selección sobre la discriminación, se asumirá que la decisión de participación depende del salario de reserva. Esto es, si el salario de mercado es mayor que el salario de reserva la persona decide incorporarse a la fuerza de trabajo, mientras que si es menor no ingresará a ella. Se asumirá también que el salario de reserva (Wt) depende de características personales y del stock de capital humano de los individuos, mientras que el salario de mercado (WM) depende del capital humano solamente. Se supone, además que dicha dependencia es lineal. (1) WM=X∼ + ←Ν (2) Wt = Yϒ=+ ←Ο===========================================Salario de reserva Salario del mercado Donde X corresponde a un vector de características de capital humano e Y a un vector de características personales y de capital humano. ∼=y=ϒ==son parámetros y, + ←Ν==←Ο====son errores aleatorios con media cero y varianza constante. La diferencia entre los salarios de mercado y de reserva representa la propensión de las personas a participar en el mercado del trabajo, y es medida por una variable continua llamada I. (3) I = WM - Wt = X∼ + Yϒ + ←Ν - ←Ο En la presente formulación cuando para una mujer en particular esta variable toma signo positivo, ella decidirá incorporarse al mercado del trabajo. Si este es el caso, el valor esperado del salario de mercado para la mujer no dependerá solo de las características de capital humano (X) sino que también de las características personales incluidas en el vector Y, las cuales se incluyen en la esperanza condicional del término de error. (4) E(WM/Xi) = X∼ + E(←Λφ=[ΜΦ La esperanza condicional del término de error posee media cero, sin embargo, la esperanza no condicional, que es la utilizada cuando utilizamos MCO, posee una media diferente de cero y está correlacionada con las variables independientes; siendo estas las razones por las cuales las estimaciones por MCO resultarán sesgadas. Se puede demostrar que la esperanza del término de error condicionada a la decisión de participación es factible de descomponer en dos términos (Paredes, 1987; Paredes y Riveros, 1988). El primero corresponde a la razón entre la función de densidad y la función de densidad acumulada evaluada en el valor de I para cada individuo. Este término es conocido como el inverso de la razón de Mill's, y constituye la variable excluida en el análisis de la ecuación de salario de mercado no corregida por el sesgo de selección. El segundo término corresponde al coeficiente de la regresión teórica entre los errores de las ecuaciones (1) y (2). Así, la ecuación de salario de mercado corregida por la presencia de sesgo de selección se plantea en términos empíricos del siguiente modo: (5) Wm = X ∼ + ƒ=↔=Η=⁄ =↔ ⁄ (6)==ƒ=Ζ=ƒ=Ε=← =←Ν ; ←Ο=Ξ=± ±←Ν - ←Ο==Φ============= La variable lambda, corresponde al inverso de la razón de Mill, y el parámetro que le acompaña se relaciona, como se ha dicho, con las desviaciones estándar y la covarianza de los errores de ambas ecuaciones salariales. La exclusión de la variable lambda es causa de sesgo en las estimaciones del vector ∼. Por lo tanto, estimar la magnitud de la discriminación sin corregir por selectividad tendrá como consecuencia subestimar o sobrestimar la verdadera discriminación. Por ejemplo, si la exclusión afecta a individuos de baja escolaridad, es posible que se sobrestime el nivel promedio de los salarios debido a que se está considerando una muestra con niveles de educación altos. Para corregir este problema, se ha propuesto estimar separadamente una variable que aproxime lambda y que elimine el sesgo implícito en estimaciones por MCO. El propósito de estimar funciones de ingreso es predecir la variable dependiente W para hombres y mujeres, bajo supuestos alternativos con respecto a los valores de las variables independientes. Estas estimaciones estarán sesgadas a menos que se incorpore un valor para la variable ↔ que corresponderá a la probabilidad de estar incluido (o excluido) de la muestra de personas con ingreso. Para incorporar el valor de esta variable, se propone estimar una ecuación de participación en que la decisión de participar o no en la fuerza de trabajo por parte de una persona --esto es, de estar desempleado o en situación de inactividad con deseos de trabajar-- depende de un conjunto de variables de características personales, de ingreso y de capital humano. Esta ecuación es especificada en forma ad hoc. La sobre o subestimación de los ingresos que resulta de estimar la ecuación salarial sin corregir por sesgo de selección no es predecible a priori. Como se ha dicho, esto dependerá fundamentalmente de que tipo de relación exista entre el capital humano y la decisión de participación y de la magnitud y signo de la correlación entre los errores de las ecuaciones de salarios. IV. METODOLOGÍA Y MODELO A ESTIMAR La metodología empírica que se utilizará para obtener los índices de discriminación corregidos se basa en el método propuesto por Heckman (1974) y que ha sido aplicado por otros autores a un conjunto de países Latino Americanos (Pscharopoulos y Tzannatos, 1991; Paredes y Riveros, 1992). Para la aplicación de esta metodología se procedió primero, a dividir la muestra total en muestras separadas en hombres y mujeres. Segundo, se estimó una ecuación de participación, --a través del método Probit-- la cual relaciona la probabilidad de observar el salario de cada individuo. Tercero, se corrigió la estimación por MCO del sesgo de selección, como propone Heckman, incluyendo en la ecuación de salarios la variable ↔ que cuantifica la probabilidad predicha de observar el salario, la cual es a su vez estimada sobre la base de la ecuación Probit. Una vez obtenidos los coeficientes de la ecuación corregida por sesgo de selección, se obtienen los salarios corregidos. La estimación empírica del modelo considera dos ecuaciones. La primera, corresponde a la variable de participación la cual es una variable dicotómica del tipo “participa” o “no participa” en términos de ser o no ser observado un ingreso del trabajo. Esta ecuación se interpreta como la forma reducida de un modelo en el cual la decisión de participación – que es una variable dicotómica—depende del salario de reserva y, por lo tanto, de características personales y de capital humano. Esta ecuación se supone lineal en los parámetros y permite estimar la probabilidad predicha de participación de un individuo con ciertas características. La segunda ecuación corresponde a la estimación del salario como función de variables de capital humano y de la probabilidad de participar en el mercado laboral, que llamamos lambda. Esta última corresponde a un modelo de determinación de ingresos a la Mincer, corregido por la presencia de sesgo de selección. La siguiente es la especificación de las ecuaciones: (7) Part = ∼o + ∼1*S + ∼2*E+∼3 *E2 + ∼4*Jefe + ↓ (8) LnW = ϒo+ ϒ1*S*ϒ2*E+ ϒ3*E2+ϒ4*Hm+ ϒ5*EC+ϒ6*TE+ ϒ7*↔+ ← En la ecuación (7) la variable dependiente Part corresponde a una variable dicotómica que toma el valor 1 cuando la persona obtiene un ingreso positivo y cero en caso contrario; S son años de estudio formales; E son años de experiencia potencial. La experiencia potencial se mide a través de la aproximación empírica Exp=Edad-educ-6. La aplicación de esta proxy requiere necesariamente del cumplimiento de dos condiciones, la primera, que el inicio de la vida laboral comienza inmediatamente después de terminada la etapa escolar. La segunda, que la vida laboral debe ser ininterrumpida. Indudablemente, este supuesto es más discutible en el caso de las mujeres y de los grupos caracterizados por altas tasas de desempleo. E2 corresponde a la experiencia al cuadrado, se espera que tenga signo negativo, mostrando la obsolescencia del capital humano. Jefe es una variable dicotómica que toma el valor 1 si el individuo i es jefe de hogar, y el valor 0 en caso de no serlo. En la ecuación (8) la variable dependiente LnW corresponde al logaritmo natural del salario total mensual; EC es una variable dicotómica que representa el estado civil tomando el valor 1 en el caso de que ser casado o conviviente y 0 en los restantes casos; TE es el tamaño de la empresa, medido por el número de trabajadores, sirviendo como proxy del grado de informalidad de las empresas en la cual trabajan hombre y mujeres. La inclusión del tamaño de empresa tiene por finalidad capturar en parte la dualidad del mercado ya que se postula a que el sector peor remunerado es aquel en que operan las firmas de menor tamaño en cuanto a capital y a trabajadores. En general muchas de estas empresas corresponden a empresas de tipo familiar con alta presencia de familiares no remunerados. Hm indica el número de horas totales trabajadas en el mes. Incluimos como variable explicativa a la cantidad de horas mensuales trabajadas para relajar el supuesto de elasticidad unitaria del salario real respecto de las horas trabajadas. ↔ Es la probabilidad ajustada de que el individuo i participe en el mercado del trabajo y corresponde a la variable Lambda o al inverso de la razón de Mill’s; ƒ y ← son errores aleatorios que se asumen con media cero y varianza constante. En el caso de la ecuación (7), se espera que los parámetros asociados a variables que aumenten el costo del ocio tengan signo positivo. Es decir, las variables de capital humano deben tener signo positivo, al igual que el parámetro asociado a la variable Jefe. Con respecto a la ecuación (8), los signos esperados son los típicos para un modelo de capital humano, es decir los parámetros de educación y experiencia deben tener signo positivo, mientras que la variable experiencia al cuadrado debería tener un efecto negativo. El signo del parámetro asociado a la variable tamaño de empresa, que se asocia al grado de informalidad, se espera que sea positivo, es decir, a mayor tamaño de la firma el salario debería ser más alto, manteniendo las otras variables a un nivel constante. Esto último, es concordante con la mayor parte de las versiones de la teoría de segmentación del mercado del trabajo, en que el sector informal es el sector de bajos salarios. V. ESTIMACIONES ECONOMÉTRICAS Los datos utilizados en este estudio provienen de la Encuesta Permanente de Hogares, correspondiente a la onda de Mayo de 1997. Esta sección presenta tres partes: Se analiza la muestra de hombres en las ecuaciones de participación y de salarios. Igual tratamiento se sigue para el caso de las mujeres. Por último, se realizan las estimaciones para el mercado laboral integrado. Las ecuaciones utilizadas son las siguientes: PART = ∼0+ ∼1 NIVELEDU + ∼2 EXPERIE + ∼3 EXPERIE2+ ∼4 JEFE LOGING = ∼0 + ∼1 NIVELEDU+ ∼2 EXPERIE +∼3 EXPERIE2 + ∼4ESTCIVIL + ∼5 TAMEMP + ∼6 LAMBDA+ ∼7 HORAMENS V.1. HOMBRES Para estimar la existencia de sesgo de selección, se calculó la variable Participación (↔), donde las variables corresponden a la descripción que se hizo en el modelo teórico. CUADRO I Dependent Variable: PART Method: ML - Binary Probit Included observations: 1093 Convergence achieved after 2 iterations Variable Coefficient Std. Error z-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 JEFE -0.680089 0.012280 0.089043 -0.001724 0.624327 -4.398746 0.996943 7.741687 -8.470314 5.066472 0.0000 0.3188 0.0000 0.0000 0.0000 Log likelihood -579.3188 Obs with Dep=0 Obs with Dep=1 738 355 0.154610 0.012317 0.011502 0.000204 0.123227 Total obs 1093 A partir de esta ecuación se incorpora la variable ↔ para la estimación de la ecuación de Mincer. Lo que se tuvo en cuenta es no incorporar la variable NIVELEDU al estimar LAMBDA, al no resultar significativo el coeficiente que acompaña a la variable. CUADRO II Dependent Variable: LOGINGHO Method: Least Squares Included observations: 738 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 ESTCIVIL TAMEMP LAMBDA HORAMENS 4.013195 0.098976 0.004983 0.000107 0.203241 0.003780 0.323372 0.002945 0.123363 0.006791 0.012177 0.000225 0.061368 0.000740 0.106859 0.000291 32.53161 14.57361 0.409225 0.474585 3.311810 5.108520 3.026164 10.13165 0.0000 0.0000 0.6825 0.6352 0.0010 0.0000 0.0026 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.478168 0.473164 0.617228 278.1080 -687.0569 1.991458 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 6.182744 0.850369 1.883623 1.933530 95.55969 0.000000 Los coeficientes de EXPERIE y EXPERIE2 resultaron no significativos. La variable ↔ es significativa pero fuertemente colineal con los dos variables antes mencionadas, según se aprecia en la matriz de correlación de primer orden. Esto dio lugar a una nueva ecuación de participación excluyendo la variable EXPERIE2, que luego es incorporada a la ecuación de salarios. CUADRO III Dependent Variable: PART Method: ML - Binary Probit Included observations: 1093 Convergence achieved after 3 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-Statistic Prob. C NIVELEDU EXPERIE JEFE -0.230375 0.017368 -0.002282 1.016158 0.141771 0.012068 0.003810 0.112289 -1.624979 1.439206 -0.598983 9.049501 0.1042 0.1501 0.5492 0.0000 Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (3 df) Probability(LR stat) Obs with Dep=0 0.675206 0.437092 208.0524 -615.8432 -689.0605 146.4346 0.000000 355 S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared Total obs 0.468512 1.134205 1.152491 1.141125 -0.563443 0.106257 1093 Obs with Dep=1 738 La ecuación de participación sólo presenta un coeficiente significativo, que es el correspondiente a JEFE, construyéndose la variable lambda2 a partir de estos resultados, lo que equivaldría a decir que la decisión de participar o no depende básicamente de sí se es jefe o no. CUADRO IV Dependent Variable: LOGINGHO Method: Least Squares Included observations: 738 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 ESTCIVIL TAMEMP LAMBDA2 HORAMENS 3.881771 0.099588 0.031150 -0.000405 0.215762 0.003770 0.181424 0.002967 0.108857 0.006833 0.006581 0.000120 0.061371 0.000741 0.070783 0.000291 35.65927 14.57412 4.733277 -3.385142 3.515719 5.085221 2.563109 10.19936 0.0000 0.0000 0.0000 0.0007 0.0005 0.0000 0.0106 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.476334 0.471313 0.618311 279.0852 -688.3512 1.990301 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 6.182744 0.850369 1.887131 1.937038 94.85994 0.000000 La ecuación de salarios calculada a partir de lambda2 figura en el cuadro IV, en el cual se observas que los coeficientes resultaron todos significativos y de signos esperados. La bondad del ajuste es importante 47%, y no aparecen problemas sobre los supuestos del modelo clásico. Sin embargo, los coeficientes para las variables tradicionales de la ecuación de Mincer no son significativamente diferentes cuando se estima la misma ecuación sin el ↔. Todos estos resultados nos llevan a concluir que desestimar el sesgo por selección no lleva a un error de especificación en la ecuación. V.2. MUJERES La misma secuencia seguida para los hombres se aplicó a la muestra femenina. CUADRO V Dependent Variable: PART Method: ML - Binary Probit Included observations: 1194 Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 JEFE -2.069088 0.090140 0.074797 -0.001307 0.457505 0.159459 0.011434 0.010474 0.000240 0.130123 -12.97568 7.883494 7.141308 -5.440368 3.515952 0.0000 0.0000 0.0000 0.0000 0.0004 Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (3 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 0.340034 0.444136 234.5386 -687.9917 -765.4229 154.8624 0.000000 788 406 S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared Total obs 0.473919 1.160790 1.182084 1.168813 -0.576207 0.101161 1194 CUADRO VI Dependent Variable: LOGINGMU Method: Least Squares Included observations: 406 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 ESTCIVIL TAMEMP HORAMENS LAMBDA 4.128984 0.084789 0.007407 -0.000461 0.052159 0.003214 0.003850 0.324817 0.480558 0.022502 0.020058 0.000214 0.073690 0.001155 0.000380 0.214044 8.592064 3.768105 0.369281 -2.154633 0.707818 2.783202 10.12551 1.517527 0.0000 0.0002 0.7121 0.0318 0.4795 0.0056 0.0000 0.1299 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.467386 0.458018 0.609104 147.6611 -370.7680 2.034185 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 5.789325 0.827369 1.865852 1.944795 49.89398 0.000000 Al incorporar la estimación de participación en la ecuación de salarios, los coeficientes no resultaron significativos para EXPERIE y para ESTCIVIL. Lo cual lleva a calcular dos nuevas alternativas de ecuaciones de participación. La variables ↔ 2 y ↔3 se calcularon eliminando una variable por vez, EXPERIE2 primero y luego EXPERIE y EXPERIE2 . Posteriormente se incorporaron a las ecuaciones de salarios correspondientes. CUADRO VII Dependent Variable: LOGINGMU Method: Least Squares Included observations: 406 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU EXPERIE ESTCIVIL TAMEMP HORAMENS LAMBDA2 3.810664 0.104032 0.010341 0.040154 0.003261 0.003835 0.146470 0.392803 0.022826 0.005678 0.070308 0.001162 0.000383 0.191744 9.701199 4.557635 1.821342 0.571124 2.805723 10.01606 0.763886 0.0000 0.0000 0.0693 0.5682 0.0053 0.0000 0.4454 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.458635 0.450494 0.613318 150.0872 -374.0763 2.053094 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 5.789325 0.827369 1.877223 1.946298 56.33765 0.000000 CUADRO VIII Dependent Variable: LOGINGMU Method: Least Squares Included observations: 406 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU ESTCIVIL TAMEMP HORAMENS LAMBDA3 4.360114 0.073105 0.166183 0.003231 0.003902 0.367671 0.174133 0.012232 0.067808 0.001182 0.000389 0.134003 25.03901 5.976707 2.450791 2.733454 10.03227 2.743753 0.0000 0.0000 0.0147 0.0065 0.0000 0.0063 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.438851 0.431836 0.623643 155.5722 -381.3626 2.028518 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 5.789325 0.827369 1.908190 1.967398 62.56453 0.000000 Los resultados no mostraron con claridad la presencia de sesgo por selección, si bien el coeficiente para la variable de probabilidad de participación LAMBDA3 resulta significativo presenta fuertes problemas de multicolinealidad con experiencia y experiencia al cuadrado, que les hace perder significación. Estas variables son fundamentales para la ecuación de salarios. Sobre la base de estas estimaciones se presupone la ausencia de sesgo de selección. V.3. COMPARACIÓN DE LOS RESULTADOS PARA HOMBRES Y MUJERES A continuación, sobre la base de las ecuaciones salariales, sin corregir por sesgo de selección; se comparan los resultados correspondientes a los retornos marginales a la educación y a la experiencia de Hombres y Mujeres. Para esta comparación se utiliza la ecuación definida teóricamente. CUADRO IX VARIABLE (*) Constante NIVELEDU EXPERIE EXPERIE2 ESTCIVIL TAMEMP HORAMENS R2 AJUSTADO Nº OBSERVAC. TEST F DURBINWATSON HOMBRES 3.823683 0.104761 0.036692 -0.000477 0.281636 0.003807 0.002997 0.467285 738 108.7465 1.988 MUJERES 3.437387 0.116233 0.034117 -0.000470 -0.001383 0.003290 0.003854 0.456249 406 57.6376 2.041 (*) Errores estándar entre paréntesis. Para evaluar las diferencias entre los coeficientes de hombres y mujeres, se utiliza el test ′2 de homogeneidad, dado que se trata de muestras no independientes entre sí. El valor para ′ es de 0.06386357 inferior al ′ crítico. Por lo cual no se rechaza la hipótesis nula 2 2 de diferencias entre los coeficientes estimados para hombres de los estimados para mujeres. V.4. COMPARACIÓN DE LOS RETORNOS MARGINALES A LA EDUCACIÓN Para poder calcular los retornos por nivel educativo es necesario estimar otro tipo de ecuaciones de salarios, donde se crean variables dummies según el nivel alcanzado por la persona. Se considera como variable dependiente al logaritmo del ingreso real; las variables independientes son los años de experiencia potencial, su valor al cuadrado, la educación de la persona en cuestión, medida a través de cinco variables dummies y las horas mensuales trabajadas. Las dummies corresponden a: primaria completa, secundaria incompleta, secundaria completa, superior incompleta y superior completa. La educación primaria incompleta ha sido excluida por encontrarse esta incluida dentro del valor de la constante. Se incluye como variable explicativa a la cantidad de horas mensuales trabajadas para relajar el supuesto de elasticidad unitaria del logaritmo del salario real respecto de las horas trabajadas; esta metodología en alguna literatura aparece como más general. Como se desprende del análisis realizado, se espera que los coeficientes sean positivos para la experiencia, negativo para la experiencia al cuadrado (señal que el retorno a los años de experiencia crece a tasa decreciente), y valores positivos para las dummies de educación, con valores crecientes según el nivel alcanzado. A continuación se muestran los resultados de las estimaciones: CUADRO X Retornos marginales a la educación (en %) NIVEL EDUCATIVO PRIMARIA COMPLETA SECUNDARIA INCOMPLETA SECUNDARIA COMPLETA UNIV. INCOMPLETA UNIV. COMPLETA AÑOS HOMBRES PROMEDIO (%) DE EDUCACION 7 0.42 9 0.15 12 0.25 13 0.19 17 0.48 MUJERES (%) 0.27 0.13 0.24 0.22 0.47 Esta comparación permite concluir que no hay diferencias significativas en los retornos marginales a la educación entre hombres y mujeres para niveles de educación equivalentes o superiores a primaria completa. Las diferencias se dan especialmente en los niveles primario y secundario incompleto, donde la mujer aparece con menores retornos salariales, sin embargo, la diferencia se invierte a favor de la mujer para el nivel universitario incompleto. En función de estos resultados se calculó un ↔4, considerando solamente el grupo de mujeres con nivel educativo inferior a secundario completo. CUADRO XI Dependent Variable: LOGINGMU Method: Least Squares Included observations: 176 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 TAMEMP ESTCIVIL LAMBDA4 4.093534 0.078026 0.040231 -0.000580 0.085618 0.012105 0.102100 0.435905 0.024616 0.023008 0.000421 0.024100 0.048617 0.207518 9.390894 3.169733 1.748585 -1.376583 3.552629 0.248984 0.492004 0.0000 0.0018 0.0822 0.1705 0.0005 0.8037 0.6234 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.186602 0.157723 0.656576 72.85466 -172.1156 1.685765 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 5.387502 0.715415 -0.802472 -0.676373 6.461708 0.000004 Nuevamente al incorporarse la variable ↔ no dio significativa. Esto permite concluir que, de acuerdo a la metodología empleada en este trabajo, el mercado laboral en Mendoza para la onda estudiada (mayo de 1997) no presenta sesgos de selección. Como un aporte adicional se calculó la ecuación de salarios de Mincer para la muestra completa. Los resultados fueron altamente significativos y con los signos correctos. CUADRO XII Dependent Variable: LOGINGTO Method: Least Squares Included observations: 1144 Variable Coefficient Std. Error t-Statistic Prob. C EXPERIE EXPERIE2 HORAMENS PRIMCOM SECINCOM SECCOM UNIVINCO UNIVCOM 3.926928 0.045671 -0.000603 0.004064 0.386777 0.607887 0.838777 1.130266 1.505455 0.095657 0.005292 0.000106 0.000231 0.074059 0.078467 0.083492 0.085804 0.085171 41.05229 8.629847 -5.674049 17.56972 5.222527 7.747067 10.04615 13.17269 17.67561 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.417444 0.413338 0.660792 495.5932 -1144.770 1.869442 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 6.043122 0.862722 2.017080 2.056749 101.6640 0.000000 CUADRO XIII Dependent Variable: LOGINGTO Method: Least Squares Included observations: 1143 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. C NIVELEDU EXPERIE EXPERIE2 ESTCIVIL TAMEMP HORAMENS 3.609828 0.098326 0.035939 -0.000458 0.220299 0.004223 0.003925 0.092160 0.005169 0.005362 0.000104 0.042527 0.000644 0.000225 39.16902 19.02203 6.702698 -4.422999 5.180219 6.559838 17.46459 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.452434 0.449542 0.639690 464.8549 -1107.676 1.904004 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 6.044287 0.862199 1.950439 1.981314 156.4391 0.000000 VI. CONCLUSIONES En este trabajo se trata de determinar si se encuentran diferencias salariales entre hombres y mujeres en el mercado laboral motivado por la existencia de sesgos de selección. La metodología aplicada consiste en incorporar vectores de cualificaciones personales a la ecuación de salarios de tipo Mincer, con la idea de aproximar los salarios de reserva a los de mercado. Esta técnica no mostró la existencia de sesgos por selección ni para hombres ni para mujeres. Al existir diferencias salariales marginales, especialmente para primaria completa, que no se explican por diferentes niveles educativos, ni por experiencia potencial, ni por sesgos de selección, según los resultados obtenidos, estas divergencias salariales se podrían atribuir a la existencia de un mercado segmentado. Si se tienen en cuenta los antecedentes en la aplicación de esta metodología, se observa que muestran sesgos de selección, un conjunto de países Latinoamericanos, que reúnen ciertas condiciones socio - económicas, caracterizadas por un sustancial subempleo y la presencia de pobreza estructural. Estos autores concluyen que si en los países de menor desarrollo, la educación, la experiencia y la participación de la mujer aumentaran, entonces su remuneración crecería más que proporcionalmente. Estas consideraciones indican que para estimar correctamente la discriminación salarial contra la mujer, cuando esta existe, es fundamental corregir el sesgo de selección en la información muestral. Cuando existe sesgo de selección las diferencias salariales tienden a sobrestimarse o subestimarse, según sea el caso. Una vez estimada la diferenciación salarial, corregida por sesgo de selección; se pueden establecer medidas de política económica tendientes a homogeneizar los salarios entre hombres y mujeres con iguales características. Es posible que dichas medidas apunten más a políticas que faciliten el acceso a la educación formal e informal y a medidas que permitan el acceso a puestos de trabajo formales, gozando de beneficios sociales y de la protección de las leyes laborales. De acuerdo a estas características, no es de extrañar que no exista en Mendoza, ni sesgo de selección, ni segmentación del mercado laboral, salvo para los sectores de educación bajos, puesto que las tasas de desempleo en la década del 90 no han superado el 8% y las tasas de subempleo equivalente (en las cuales se supone que los subocupados trabajan las mismas horas que un ocupado), han llegado al 15,6%; niveles inferiores a los nacionales. Por otro lado, Mendoza presenta tasas de escolaridad primaria del 96%, tasas de escolaridad media de un 71% y para el nivel superior tasas del 36%, que son comparativamente razonables con las del resto del mundo industrializado. VI. REFERENCIAS BIBLIOGRÁFICAS 1) BECKER, GARY, “Human Capital”, Columbia University Press (New York, 1964). 2) FUNDACIÓN DE INVESTIGACIONES ECONÓMICAS LATINOAMERICANAS, “Educación y mercados de trabajo en la Argentina”, Asociación de Bancos Argentinos, Décima Convención Anual de Bancos Privados (Buenos Aires, 1994). 3) HECKMAN, J. “Sample selection bias as a especification error”, Econométrica 47. 4) MADDALA, G.S., “Limited-dependent and qualitative variables in econometrics”, Econometric Society Monographs Nº3, Cambridge University Press, 1983. 5) MINCER, JACOB, “The distribution of labor income: a survey; With special reference to human capital approach” , Journal of Economic Literature, Vol. VIII, Nro. 1, March 1970. 6) PSACHAROPOULOS, G. y TZANNATOS, Z. “Women´s employment and pay in Latin America - Overview and metodology”, World Bank (Washington, 1992) 7) RIVEROS, L. y BALMACEDA, F. “Discriminación en un mercado de trabajo segmentado: diferencias salariales entre hombres y mujeres en El Salvador”, XII Encuentro Latinoamericano de la Sociedad Econométrica, Tucumán, Argentina, 1993. 8) WILLIS, R. y ROSEN, S., “Education and self-selection”, Journal of Political Economy, Vol.87, Nº5, 1979.