La Muestra Continua de Vidas Laborales de la Seguridad Social ALMUDENA DURÁN* ¿QUÉ ES LA MUESTRA CONTINUA DE VIDAS LABORALES? E s la recopilación de información sobre más de un millón de personas, presentada de forma individual pero anónima, obtenida de los registros de la Seguridad Social, y organizada de manera que pueda utilizarse para la investigación. Constituye una Muestra representativa de todas las personas que cotizaron o cobraron prestaciones en un determinado año en este sistema de protección. Es Continua porque se actualiza anualmente, con versiones para 2004 y 2005 hasta el momento. Cada muestra, aunque referida a la población cotizante o pensionista en el año de referencia, reproduce el historial anterior de las personas seleccionadas, remontándose hacia atrás hasta donde se conserven registros informatizados, y por ello se denomina de Vidas Laborales. Se acompaña de documentación sobre las variables incluidas. La Seguridad Social requiere para su gestión registrar información sobre los distintos individuos que o bien reciben prestaciones, o bien contribuyen con sus cotizaciones. En España, como en otros países, las pensiones dependen de lo cotizado durante toda la vida laboral, por lo que esta información indivi* Responsable de la coordinación de la muestra continua. Ministerio de Trabajo y Asuntos Sociales. dualizada se conserva durante muchas décadas. Por lo tanto sus registros tienen ventajas considerables como fuente de información: ya están almacenados, por lo que no hay que preguntar de nuevo, e incluyen muchas variables referidas a largos períodos de tiempo. Pero también tienen una desventaja importante: puesto que han sido diseñados para la gestión, su organización está muy alejada de las necesidades de la investigación, por lo que obtener información utilizable requiere bastante esfuerzo. ¿PARA QUÉ SE HACE? Los objetivos que han llevado a la creación de la Muestra Continua de Vidas Laborales son el apoyo a: La investigación, para ayudar a los que hacen estudios socioeconómicos, con mejores datos y más baratos que haciendo encuestas La transparencia, porque no sólo es relevante qué estudios pueden hacerse, sino también quién y cómo puede hacerlos. La muestra está disponible en DVD y se envía de forma gratuita a los centros de investigación para la ejecución de proyectos concretos. Los interesados deben firmar un protocolo para garantizar el uso adecuado de los datos y comprometerse a entregar copia de los resultados REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES 231 ESTUDIOS de la investigación que realicen, así como detalle de la metodología, de tal manera que sea posible replicar los trabajos, por motivos de rigor científico. Además de estudios sobre protección social, la Muestra Continua de Vidas Laborales se está usando para otras investigaciones. Disponen de ella cerca de medio centenar de estudiosos, la mayoría relacionados con la Universidad, que la están utilizando para estudios sobre distintos temas, entre los que se cuentan: trayectoria laboral a lo largo de la vida, movilidad, probabilidad de encontrar empleo, temporalidad, diferencias salariales, estudios de empleo sectoriales o locales, situación relativa de hombres y mujeres, inmigración, integración laboral de minusválidos, licencias por cuidados de hijos, análisis del tiempo, transición del empleo a la jubilación, proyección del gasto en pensiones y su relación con las previsiones demográficas, efectos redistributivos del sistema de pensiones y su incidencia espacial, microsimulación de políticas públicas. La mayoría de estos estudios está todavía en proceso, pero ya se han completado algunos, uno referido a trayectorias laborales y otro sobre el impacto de las ayudas a la contratación. En el anexo de este trabajo se presentan dos ejemplos de información obtenida en trabajos internos. PROCEDIMIENTO PARA CONSTRUIR LA MUESTRA Para construir cada versión hay que resolver una serie de pasos, y en cada uno de ellos se requieren tanto tareas de diseño como de ejecución. De las primeras se encarga un grupo de trabajo en el que se incluyen estadísticos profesionales y personas con experiencia en la realización de estudios, coordinados desde la Dirección General de Ordenación de la Seguridad Social; de las segundas se ocupa la Gerencia Informática de la Seguridad Social. Pero se requiere también la colabora- 232 ción de muchas otras personas, porque, como veremos, el conocimiento sobre los distintos aspectos de los registros está muy disperso. Los pasos más importantes son: Obtener la población de referencia. Extraer la muestra a partir de ésta. Incluir las variables relevantes para cada una de las personas en la muestra. Presentar la información organizada y documentada de forma que sea utilizable por los estudiosos. LA POBLACIÓN DE REFERENCIA La Seguridad Social guarda información sobre mucha gente, en situaciones muy diversas: algunos han fallecido ya, otros han cotizado alguna vez pero hace tiempo que no lo hacen, o cotizan pero no trabajan. Por lo tanto, la primera tarea era definir a quién se iba a referir la muestra, qué es lo que se denomina la población de referencia. Se han incluido tanto los que cotizaron como los que recibieron alguna prestación económica contributiva de la Seguridad Social en el año de referencia, que en la primera versión fue 2004. Este sistema cubre al 95% de los ocupados en España; hay otro mecanismo de protección: el de Clases Pasivas y Mutualidades, para algunas categorías de funcionarios, que aún no se ha incluido, aunque se han iniciado contactos para hacerlo. Dentro de los cotizantes se incluyen no solo los que están trabajando, sino también los que de esta manera mantienen derecho a prestaciones futuras (preceptores de prestaciones de desempleo, convenios especiales). En cambio no figuran los que están de alta exclusivamente a efectos de prestaciones sanitarias. Tampoco forman parte de la población de referencia hasta el momento, además de los funcionarios mencionados, los perceptores de las distintas prestaciones no ligadas a una cotización previa. REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES ALMUDENA DURÁN Una decisión muy relevante fue definir la población como todos los individuos que han estado en relación con la Seguridad Social en cualquier momento del año, no solo en una fecha determinada (que es lo que hacen las estadísticas habituales). Por ello las personas que trabajan solo ocasionalmente, bastante numerosas en España, están mucho más representadas que en otras fuentes de información, como las cifras mensuales de afiliados o las de la Encuesta de Población Activa. LAS PERSONAS QUE FORMAN PARTE DE LA MUESTRA La muestra de cada año está formada por cuatro de cada cien de las personas que forman parte de la población de referencia. Esta proporción supuso en 2004 la selección de una muestra de 1.098.165 personas, mientras que la de 2005 es de 1.143.829. Este crecimiento de 4,2% se debe al aumento de la población de referencia: 4,4% los afiliados y 1,3% las pensiones. El muestreo es aleatorio simple, y la selección está basada en unas determinadas cifras dentro del número de identificación de cada persona. Cada año permanecen en la muestra los que ya estaban y han seguido teniendo relación con la Seguridad Social, y se incorporan a la muestra nuevas personas que por primera vez son cotizantes o pensionistas, con los mismos criterios de selección. Por ello, las sucesivas versiones de la muestra funcionan como un panel. ¿QUÉ TIPO DE DATOS CONTIENE LA MUESTRA? Para seleccionar las variables a incluir, el primer paso fue descubrir qué información guarda la Seguridad Social, desde cuándo, cómo está almacenada y cómo puede recupe- rarse. Esta tarea es más difícil de lo que puede parecer a los que conocen la Seguridad Social desde fuera, puesto que la información ha sido organizada según la lógica de gestión, que puede incluso ser diferente para distintos Regímenes Especiales. No puede considerarse terminada, porque el conocimiento de los distintos aspectos que afectan al diseño está muy especializado. Sin duda la MCVL continuará cambiando en el futuro, no solo por el intento de sus promotores de presentar mejor la información, sino también porque los usuarios formulan preguntas de interpretación de los datos que obligan a reexaminar planteamientos. En ambos casos, la solución exige encontrar y consultar a la persona que realmente conozca ese tema en concreto tanto en su formulación actual como en el pasado. Pero el proceso, sobre todo en la medida en que se deja constancia a través de las fichas, resulta útil no solo para la MCVL, sino también para futuros usos estadísticos de los registros. El segundo paso fue determinar hasta qué punto esa información era relevante para los estudios que previsiblemente iban a realizarse, buscando un equilibrio entre la dificultad de disponer de la información, su calidad y su interés. Finalmente se han incluido en la Muestra 2004 medio centenar de variables distintas, referidas a las personas seleccionadas, sus empleos o situaciones laborales y las pensiones que puedan haber percibido: Algunas son simplemente identificativas, y sirven para conectar los diferentes módulos. Siete se refieren a la persona: fecha de nacimiento y fallecimiento si lo hubiera, sexo, lugar de nacimiento, lugar de residencia, nacionalidad, provincia donde se afilió por primera vez; se ofrece un único dato por persona en la muestra. REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES 233 ESTUDIOS Doce variables tienen que ver con el trabajo desempeñado: régimen de afiliación, fechas de alta y baja, tipo de contrato, tipo de jornada, grupo de cotización, causa de baja, minusvalía si consta en el contrato, base de cotización, e información similar para otros regímenes y situaciones de afiliación. Otras diez son variables relativas al empleador o responsable de la cotización: actividad económica, tamaño, antigüedad como empleador, dos referidas a su localización y cinco que ayudan a describir el tipo de empleador. De las variables referidas al empleo y al empleador se ofrece un dato por cada uno de los puestos de trabajo desempeñados, excepto las bases de cotización, que es mensual . Una quincena de variables describen la pensión: clase, grado y fecha de revisión de la minusvalía para las de incapacidad, régimen, fecha de inicio y cese, base reguladora, porcentaje aplicado y pensión inicialmente calculada, revalorización acumulada, complemento al mínimo, y otros importes, pensión total mensual de cada año, causa de cese si lo hubiera. Se ofrece un dato por cada año que se ha percibido la prestación. Para cada una de estas variables se ha elaborado una ficha recogiendo la información relevante para los usuarios, como la definición a la fecha desde que se conservan datos y los códigos empleados. Algunas variables que no son de importancia directa para la gestión pueden quedar con frecuencia en blanco o tener una actualización deficiente, y en la ficha se ha reflejado. CRUCE CON OTROS FICHEROS ADMINISTRATIVOS (MATCHING) La Seguridad Social guarda gran cantidad de información sobre las personas que entran 234 en contacto con ella, pero no necesariamente de todas las variables que los analistas consideran importantes. Además, como hemos visto, las variables disponibles pueden no estar debidamente actualizadas. Por ello se han incorporado datos de otros organismos públicos que tienen información complementaria. La Muestra 2004 se ha cruzado con el fichero de retenciones sobre salarios para el impuesto sobre la renta, que identifica entre otras cosas el salario total, sin el tope máximo que afecta a las bases de cotización. Esto ha dado lugar a una nueva versión de la Muestra 2004, que incluye la información de la Seguridad Social más la tributaria. La Muestra 2005, que se está editando en la actualidad, incorpora desde su origen variables procedentes del Padrón Continuo del Instituto Nacional de Estadística, referidos a algunos aspectos para los cuales la Seguridad Social tenía información deficiente (domicilio, lugar de nacimiento) o no tenía (nivel de estudios, personas que conviven en el mismo hogar). Está previsto cruzar también con datos tributarios, aunque por motivos legales de protección de datos debe hacerse posteriormente. PROTECCIÓN DE DATOS Para preservar la confidencialidad de la información, y así asegurar que la Muestra cumple con todos los requisitos de la Ley de Protección de Datos Personales, ha sido necesario tratar los valores de ciertas variables. Por supuesto se han eliminado los nombres y trasformado los números identificativos tanto de la persona como de la empresa. Otras variables, como el domicilio y la nacionalidad, se han trasformado también como precaución adicional ante el riesgo de que pudieran facilitar la identificación. En el caso del domicilio, sea referido al trabajador o a la empresa, se suministra el código completo del municipio sólo cuando tiene una pobla- REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES ALMUDENA DURÁN ción mayor de 40 mil habitantes; si no es así, sólo se recoge la provincia. Del mismo modo, la nacionalidad aparece identificada para los países con mayor número de residentes en España; en el resto de los casos se han agrupado varios países. Por otro lado, los usuarios de los datos se comprometen por escrito a no hacer uso de la información excepto para la investigación concreta que han señalado de antemano. CÓMO SOLICITAR LOS DATOS La solicitud debe dirigirse por escrito a la Dirección General de Ordenación de la Seguridad Social. El formulario puede descargarse de la web, en en www.seg-social.es >estadísticas > Muestra Continua de Vidas laborales > Protocolo de petición de los microdatos. La nota informativa señala los pasos a seguir. Los usuarios se comprometen a utilizar la muestra solo para fines de estudio, y a informar a la Seguridad Social sobre los resultados y el método seguido. ¿QUÉ HACE FALTA PARA USARLA? Como toda información presentada en microdatos, sin datos agregados, la muestra no es fácil de usar. Se requiere un buen sistema informático, y los conocimientos suficientes para manejarlo. Los que ya la están usando indican que hace falta un esfuerzo inicial para familiarizarse con la estructura de presentación de los datos y los conceptos utilizados. Algunos optan por trabajar solo con la parte de los datos que sea relevante para su investigación y prescinden del resto, reduciendo por consiguiente la complejidad. En cambio, otros equipos de usuarios, que disponen de más medios y van a utilizar la MCVL para varios estudios, han dedicado mucho esfuerzo a adaptar los ficheros facilitados a sus propios sistemas, para después acceder a la información con mayor comodidad. Anexo Presentación de ejemplos concretos de utilización de la Muestra Ejemplo 1. Permanencia de los trabajadores en la misma empresa La inestabilidad en el empleo se mide normalmente a través de la tasa de temporalidad según la EPA, estimando la proporción de los asalariados que dicen tener contratos temporales. A su vez, el tiempo que los trabajadores permanecen en los empleos temporales se suele medir a través de la duración inicial declarada cuando se registran los contratos en el Servicio Público de Empleo. Los registros de afiliación a la Seguridad Social permiten estudiar los contratos en vigor, según datos facilitados por los empleadores, con mucho mayor detalle que las encuestas. Pero también facilitan una perspectiva diferente: observar el tiempo que de hecho ha permanecido de alta un trabajador en una empresa durante un período determinado. Los datos que se muestran a continuación proceden de la MCVL 2004. Se han tomado para el estudio los trabajadores que en el momento de la extracción (23 de septiembre de 2005) estaban de alta en el Régimen General, con un sistema de cotización normal. Reflejan, por tanto, una situación anterior a la última reforma laboral, que se produjo en 2006. Se analizó cuántos días ha permanecido de alta cada trabajador en su actual empresa1 1 Se utiliza indistintamente el término empresa y empleador, aunque no siempre éste será una sociedad mercantil. Se han considerado de la misma empresa las relaciones en que coincidía el código de cotización principal. REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES 235 ESTUDIOS en el último año, cuántos en el último trienio, y cuántas veces distintas ha sido dado de alta por esa empresa en el período señalado de los últimos tres años. Hay que recordar que los trabajadores continuaban de alta cuando se tomaron los datos, por lo que no se refleja la duración total de la relación laboral. Los resultados confirman el elevado porcentaje de contratos por tiempo determinado, pero permiten analizar la estabilidad de hecho, con resultados que no siempre coinciden con los que se infieren de las tasas de temporalidad o de las cifras habituales de duración de contratos. en la empresa menos de uno, mientras que el 47% han estado de alta en ella todo el tiempo. TIEMPO DE PERMANENCIA EN LA EMPRESA EN LOS ÚLTIMOS TRES AÑOS Los trabajadores han permanecido de alta de media 306 días dentro del último año (de septiembre de 2004 a septiembre de 2005) en la empresa para la que trabajan. En los últimos tres años han permanecido de media 754 días de alta en la empresa. En los últimos tres años, una cuarta parte de los trabajadores ha permanecido TIEMPO MEDIO DE PERMANENCIA EN LA EMPRESA Y NÚMERO MEDIO DE ALTAS EN LOS ÚLTIMOS TRES AÑOS, SEGÚN TIPO DE CONTRATO * Sólo cuentan altas de Seguridad Social ocurridas en los tres años anteriores al 23 de septiembre de 2005, de modo que los afiliados que hayan permanecido en la empresa desde antes de esa fecha registrarán cero altas en el periodo. 236 REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES ALMUDENA DURÁN Una parte importante de los trabajadores formalmente temporales mantiene con su empleador relaciones bastante estables, a través de dos mecanismos: por un lado, utilizando tipos de contratos que permiten duraciones largas (obra o servicio, interinidad, contratos de tipo administrativo); por otro, mediante contrataciones sucesivas en el tiempo. Los trabajadores con contrato temporal han estado de promedio siete meses y medio en la empresa en el último año, y algo más de catorce meses en los últimos tres. En una proporción considerable de los casos la relación, aunque formalmente temporal, se ha extendido o renovado en varios ejercicios. Dentro de los contratos temporales a jornada completa influye considerablemente la modalidad: por ejemplo, los interinos de la Administración tienen un promedio de días de permanencia próximo a los indefinidos. TIEMPO MEDIO DE PERMANENCIA EN LA EMPRESA EN LOS ÚLTIMOS TRES AÑOS, SEGÚN MODALIDAD DE CONTRATO TEMPORAL La MCVL permite también analizar la permanencia en el empleo según las características del trabajador o del empleador. Aunque las líneas generales de tendencia que se observan son, naturalmente, las mismas que se obtienen de otras fuentes, puede profundizarse más. Por ejemplo, en «Actividades sanitarias y veterinarias, servicio social» la tasa de temporalidad medida por EPA (33,4%) es similar al promedio, pero el tiempo real de permanencia en los últimos tres años es de 849 días, bastante por encima de la media (754). Por el contrario, «Actividades inmobiliarias y de alquiler; servicios empre- REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES 237 ESTUDIOS sariales», con una tasa de temporalidad incluso algo menor que aquella (32%), tiene un promedio de días de permanencia muy inferior (633). Ejemplo 2. Las altas de nuevos trabajadores a la Seguridad Social Mediante la MCVL pueden obtenerse datos sobre las altas de Seguridad Social más detallados que las estadísticas que se publican habitualmente, incluyendo la base de cotización, el tipo de contrato, o la relación entre éstos. Sin embargo, la utilización sin más de esta información sobre las altas puede resultar confusa, por varios motivos. La cifra de altas de Seguridad Social en el Régimen General está formada mayoritariamente por relaciones muy cortas, cuyo impacto en el empleo total es relativamente pequeño; puede estimarse que, de todas las relaciones laborales comenzadas en un período determinado, dos tercios duran menos de un mes y solo generan el 9% del tiempo cotizado entre todas las altas. Por el contrario, aunque apenas el 12% de las relaciones duran más de un año, éstas generaron el 70% del tiempo global cotizado. Por ello, para estudiar la dinámica del empleo asalariado conviene distinguir entre las relaciones laborales que permanecen algún tiempo y las cortas, mucho más numerosas, que tienen unas características diferentes. Así, para el Régimen General, las altas se distribuyeron según tipos de contrato como se indica en el cuadro adjunto; la distribución es bastante diferente entre el total, dominado por las relaciones cortas, y las que duraron. DISTRIBUCIÓN DE LAS ALTAS DE SEGURIDAD SOCIAL EN EL PRIMER SEMESTRE DE 2004, SEGÚN TIPOS DE CONTRATO. RÉGIMEN GENERAL Fuente: elaboración con datos de la MCVL 2004. 238 REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES ALMUDENA DURÁN Una pregunta que se formula frecuentemente se refiere a cuál es la base de cotización de las altas de Seguridad Social. La MCVL permite obtenerlas, pero puede resultar equívoca por varios motivos. Como se ha indicado, la mayoría de las altas van a tener un escaso impacto en el volumen de empleo. Por otro lado, la base en el primer mes de cotización registrado es un indicador muy poco fiable, porque no suele corresponder a una mensualidad completa, ya que la mayoría habrá empezado a trabajar después del día 1; en el segundo mes aumenta la proporción de trabajadores que han trabajado la mensualidad completa, pero aún hay muchos que cesan sin terminarla. Si lo que tratamos de establecer es el «salario de entrada», resulta más indicada la base de cotización del segundo mes de los trabajadores que han permanecido posteriormente en la empresa. casos no habrán trabajado los 30 días. Otra serie, que se refiere a la segunda mensualidad de estas mismas, ya no incluye los contratos más breves (29% no llegan a este punto), y tendrá una mayor proporción que han trabajado el mes completo; la base media de cotización es de 966?. La diferencia entre estos dos datos se debe fundamentalmente al número de días trabajado. El tercer tipo se refiere también a la segunda mensualidad, pero no de todas las altas sino solo de los que sabemos que perduraron hasta septiembre del año siguiente; son una parte pequeña del total, pero generarán la mayor parte de las cotizaciones ligadas a las altas de ese semestre. En este caso sí habrán trabajado un mes completo; su base media es de 1.224 ?. Esta cifra sigue siendo inferior a la base media de todos los cotizantes existentes ese año, que fue de 1.322 ? 2. La comparación entre estos tres tipos de base media de cotización puede verse en el gráfico adjunto, referidos siempre al Régimen General en el primer trimestre de 2004. Una serie refleja la primera mensualidad de todas las altas con cotización, y arroja una base media de 622 euros; en la mayor parte de los Comparando las bases de cotización de las altas que perduraron puede verse que los que tienen un contrato indefinido ordinario cobran, desde el comienzo, significativamente más que los temporales y que los otros indefinidos (incluyendo las distintas modalidades de fomento del empleo). BASE DE COTIZACIÓN MEDIA, 2004 (En euros) Informe Económico Financiero que acompaña al Presupuesto de la Seguridad Social de 2006 2 REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES 239 ESTUDIOS El tamaño de la muestra es suficientemente grande como para poder estudiar las bases de cotización por tipos de contrato a gran nivel de detalle, o bien para estudiar grandes tipos de contratos cruzados con bases de cotización. Sin embargo, en algunas combinaciones poco habituales el número de observaciones es bajo, por lo que el dato es menos preciso, como se señala en el cuadro adjunto. BASE DE COTIZACIÓN DE LA SEGUNDA MENSUALIDAD (en euros). RÉGIMEN GENERAL ALTAS DEL PRIMER SEMESTRE DE 2004 QUE PERMANECÍAN EN SEPTIEMBRE DE 2005 * En las casillas donde aparece un asterisco, el número de observaciones en la muestra es inferior a 50, y por tanto, la estimación es menos precisa. Fuente: elaboración con datos de la MCVL 2004. 240 REVISTA DEL MINISTERIO DE TRABAJO Y ASUNTOS SOCIALES