Data collection for developing the Employment National Survey

Anuncio
documentos
de trabajo
RECOPILACIÓN DE INFORMACIÓN
ACERCA DE LA CONSTRUCCIÓN
DE PRODUCTO ENE
Junio 2007
Nº4
RECOPILACIÓN DE INFORMACIÓN
ACERCA DE LA CONSTRUCCIÓN
DE PRODUCTO ENE
Departamento de Investigación y Desarrollo
Instituto Nacional de Estadísticas de Chile
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Departamento de Investigación y Desarrollo
Coordinadora Departamento I+D
Claudia Matus Correa
Jefe Área Análisis de Estadísticas Sociales
Miguel Guerrero Herrera
Analista
Jaime Vargas Barraza
2
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Introducción
Dando cumplimiento a las actividades propuestas para el trimestre Abril – Junio de 2007,
en cuanto a la Recopilación de Información Acerca de la Construcción de Encuestas de
Empleo, en este documento se presentan un estudio de comparación de metodologías de
trabajo, en diversos países que llevan a cabo encuestas de empleo. La idea es presentar las
distintas visiones y resultados obtenidos por países pertenecientes a la Unión Europea y
contrastar esto con lo hecho por países de América, incluyendo a Chile. Puntualmente los
países en estudio son:
Unión Europea:
Bélgica, Dinamarca, Alemania, Grecia, España, Francia, Irlanda, Italia,
Luxemburgo, Los Países Bajos, Austria, Portugal, Finlandia, Suecia y El
Reino Unido.
América:
Estados Unidos, Argentina, Perú, Colombia y Chile
Dentro de los puntos analizados se encuentran:
i)
ii)
iii)
iv)
v)
Diseño muestral,
Metodología de levantamiento de los datos,
Métodos de cálculo de factores de expansión,
Inclusión o no de la no respuesta como parte del factor de expansión,
Esquemas de rotación de la muestra.
En el ámbito del cálculo de factores de expansión se presentan ejemplos de metodologías
utilizadas tanto a nivel europeo como a nivel americano y en los esquemas de rotación de la
muestra se presentan los distintos enfoques con que se enfrenta el problema de la carga de
los entrevistados, en el sentido del agotamiento que produce en los entrevistados las
constantes visitas o contactos por parte del equipo de encuestadores.
Además para el caso de las encuestas a nivel europeo, se presenta de forma breve las
principales legislaciones que regulan la construcción de las encuestas de empleo de los
Países Miembros de la Unión Europea.
Por último, con el afán de dar una mirada más general a la construcción de las encuestas, se
han construidos tablas resumen sobre la metodología y tratamiento de los datos para las
distintas encuestas de empleo. La información contenida en dichas tablas corresponde a:
i)
ii)
iii)
Cobertura, Frecuencia y Tasa de Respuesta
Tamaño y Diseño Muestral
Estratificación, Esquema de Rotación y Ponderación
3
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Unión Europea
Base Usada para la Muestra:
Los registros de población y el último censo de población o lista de direcciones usadas en
ese Censo son las dos principales fuentes para el marco muestral. Otras fuentes incluyen
listas de direcciones desde, por ejemplo, las Autoridades Postales o bases de datos del
servicio público. Los países Nórdicos tales como Bélgica e Italia usan los registros de
población como su única base, mientras que Alemania y Los Países Bajos complementan
esta información con el Censo o Datos Postales.
Etapas de Muestreo y Unidades de Muestreo Primarias (UMP)
Dinamarca, Luxemburgo, Austria, Finlandia, Suecia y El Reino Unido, usan un diseño
muestral de una etapa. Alemania, usa un diseño muestral bietápico. Todos los otros países
usan un diseño bietápicos o trietapicos, usualmente seleccionando distritos administrativos
o áreas de enumeración censal en la primera etapa (Irlanda es un caso especial y usa un
diseño de conglomerados bietápico).
Unidades de Muestreo Últimas
Tres tipos de unidades de muestreo últimas son empleadas: 1) Hogares, 2) Viviendas ó
Direcciones, y 3) Personas. Alemania, Irlanda y Portugal muestrean clusters de unidades de
viviendas. En las muestras de viviendas o direcciones, usualmente todas las personas y de
ese modo, todas las unidades de hogares residentes dentro de la vivienda/dirección son
entrevistadas (Alemania, España, Francia, Austria, Portugal y El Reino Unido). La
excepción es Los Países Bajos donde una etapa de muestreo final es implementada, es
decir, submuestras de hogares desde direcciones de correo de multi-hogares. Cuando las
personas constituyen las unidades de muestreo primarias, la selección de personas
constituye la muestra final (los países nórdicos).
Estratificación
Todos los países estratifican el marco muestral antes del muestreo. Región, Regiones
NUTS II, NUTS III, NUTS IV o áreas definidas nacionalmente, es la variable de
estratificación más común (todos menos Dinamarca y El Reino Unido). La Urbanización es
también una variable de estratificación popular (Grecia, Francia, España e Irlanda). Otras
variables de estratificación incluyen registros de estados de empleo o desempleo de los
individuos (Dinamarca y Suecia) e información auxiliar sobre las características (tamaño,
tipo) de las unidades de muestreo primarias (España, Francia e Italia).
Descripción del Esquema de Rotación
Todos los países usan un diseño de panel de rotación para las muestras. Los paneles (o
rondas) van de dos a ocho paneles. Los diseños de paneles con cuatro o cinco paneles son el
más común. Cada panel es entrevistado sucesivamente sin interrupción, o el panel puede
4
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
salir uno o más trimestres antes de ser entrevistado otra vez. Dependiendo del énfasis
nacional, el número de rondas y patrones de salidas conducen a diferentes resultados de
sobrelapos entre dos trimestres sucesivos o en el mismo trimestre en dos años sucesivos.
Breve Descripción de método de Cálculo de Factores de Ponderación
El Consejo de Regulación (EC) No 577/98 sobre las Encuestas de Fuerza Laboral (LFS) de
la Unión Europea impone que los factores de ponderación deberían ser tomados en cuenta
“en particular la probabilidad de selección y datos externos relacionados con la distribución
de la población que está siendo encuestada, por sexo, edad (grupos etáreos de cinco años) y
región (nivel de NUTS II), donde tales datos externos cumplen con ser lo suficientemente
confiables para los Estados Miembros afectados” (Articulo 3(5)).
Los métodos de cálculo de las ponderaciones difieren mucho entre países. Dos métodos
principales son usados, dependiendo del detalle de la información externa y de si la
información externa permite o no hacer cruces de tabulados: 1) inverso de la probabilidad
de selección ajustada a posteriori por la distribución de la población por sexo, grupo etareo,
y otras fuentes externas (administrativas), y 2) Diferentes variaciones del método de
Ranking-Ratio, incluyendo calibración generalizada. La mayoría de los países realizan
ajustes para la no respuesta, directamente en el proceso de ponderación o en un paso
preliminar antes de ajustar las ponderaciones a fuentes externas.
Ejemplo de Cálculo de Factores de Ponderación
La ponderación de los datos muestrales sirven dos fines: El primero es compensar por la no
respuesta entre diferentes subgrupos de la población y segundo es ajustar la distribución de
ciertas características en la muestra de los valores poblacionales. Estos valores se toman
desde proyecciones de la población, que están en los países basadas más o menos
directamente en los Datos Censales.
En Austria este proceso inicia calculando una ponderación básica para cada registro. Esta
ponderación básica para cada persona depende del estrato y del dominio, al cual la persona
pertenece. Así cada ponderación de persona puede ser a través del número de individuos
que la persona representa en el subgrupo (post-estratificación). Un paso más adelante, el
ajuste a la distribución de la población toma lugar. Esta calibración es hecha por medio de
un proceso iterativo. En el paso 1 las ponderaciones son ajustadas de modo que el grueso de
la distribución de la variable Estado Federal por edad y sexo sea igual a la proyección de la
población. En el paso 2 esto es continuado para la variable Estado Federal por nacionalidad.
En el paso 3 se calcula el valor medio de todas las personas que viven en una vivienda, ya
que es deseable tener los mismos pesos en una vivienda. A causa de la posibilidad que por
estos cálculos los ajustes en pasos 1 o 2 son arruinados, el paso 4 chequea, si la distribución
en cualquier celda corresponde suficientemente a la estructura de la población. En al caso
de no estar entre algunos rangos predefinidos, otras iteraciones son necesarias. De todas
formas el procedimiento para después de 100 iteraciones.
Para la LFS finlandesa en un comienzo se hace el cálculo de los pesos para cada persona de
acuerdo a la post-estratificación para las variables sexo, edad y región. Luego, los pesos
5
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
calibrados son calculados de acuerdo a sexo, edad, región, semana de referencia (en el caso
de una encuesta continua la tasa de respuesta varía semanalmente, de modo que ella debería
ser balanceada sobre el nivel mensual) y basado en el registro del estado de búsqueda de
trabajo tomado de un registro mantenido por el Ministerio de Trabajo. Para el
procedimiento de Calibración una función de distancia lineal es usada, disponible en el
programa CLAN
En el microcenso Alemán en el paso de compensación de la no respuesta diferentes tipos de
supuestos de compensación son formados por medio de la combinación de las siguientes
características: tamaño del hogar, nacionalidad, para alemanes: lugar de residencia, para
hogares de una persona: sexo y edad. Para cada hogar de estos tipos en un nivel regional
con a lo menos 100.000 habitantes la no respuesta es compensada. En el paso de
calibración del procedimiento ponderación la nacionalidad en combinación con el sexo es
utilizada como variable auxiliar. El ajuste es desarrollado dentro de cada estrato regional
con a lo menos 500.000 habitantes. Multiplicando el peso relativo al hogar del paso 1 por el
peso relacionado a la persona resultado del paso 2 en el respectivo peso de la persona.
Además del peso de la persona, para los datos de hogares un peso para los hogares es
calculado como el valor medio de todos los pesos de las personas de un hogar (ver, Gruber,
1996).
En Los Países Bajos el Procedimiento de ponderación para la LFS neerlandesa comienza
con pesos de inclusión que se derivan las personas que responden, que toma en cuenta el
sobremuestreo de direcciones, que ocurre en el registro de la Oficina de Empleo, el
submuestreo de direcciones con sólo personas de 65 años y más, el mes de entrevistas y las
diferencias en las tasas de respuesta entre regiones geográficas (ver, Hilbink et al., 2001).
Estos pesos de inclusión son los pesos de partida para un estimador de regresión que usa
varias combinaciones de las variables auxiliares, área, edad, sexo, estado civil y origen
étnico. El método de Lemaitre and Dufour (1987) se aplica para obtener pesos iguales para
miembros del mismo hogar.
Finalmente para las LFS de El Reino Unido, la etapa 1 del proceso de ponderación corrige
para la no respuesta a nivel de área local. El ajuste de la categoría en la etapa 2
Métodos de Levantamiento de los Datos
Existen tres formas de levantamiento de datos para las LFS de la Unión Europea, visitas
personales, entrevistas telefónicas y formas de papel enviadas por correo. Muchos de los
estados miembros mezclan los dos primeros de modo que en la primera ronda es siempre
por medio de visitas personales mientras que en rondas subsecuentes son mediante teléfono
si es que esto es posible. Alemania levanta datos en una mezcla de cuestionarios por correo
y entrevistas personales. Dinamarca recoge los datos con entrevistas telefónicas pero las
personas que no pueden ser localizadas por teléfono reciben un cuestionario por correo.
Bélgica utiliza éstos tres modos en la segunda (y última) entrevista. Luxemburgo, Suecia y
Finlandia cuentan únicamente de encuestas telefónicas. Grecia, Irlanda y Portugal sólo
realizan entrevistas personales. Cuatro países utilizan cuestionarios computarizados,
España, Italia, Los Países Bajos y El Reino Unido; en todos ellos se realiza una primera
entrevista personal y las posteriores rondas se realizan vía telefónica. En al caso de Francia,
6
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
sea realiza un entrevista personal en la primera ronda y encuestas telefónicas en las rondas
siguientes, en todos los casos utiliza cuestionarios de papel. Por último, Austria, realiza en
su primera ronda una entrevista con lápiz y papel, y en las rondas siguientes realiza la
encuesta vía telefónica en cuestionarios computarizados.
Principales Regulaciones de las LFS de la Unión Europea
La LFS de la Unión Europea (UE) es gobernada por varias regulaciones del Consejo,
Parlamento Europeo y la Comisión. Council Regulation (EC) No 577/98 es la principal
regulación de la LFS de la UE, desde el 9 de Marzo de 1998, y trata sobre la organización
de una encuesta muestral de fuerza laboral en la Comunidad. Entrega recomendaciones
sobre frecuencia de la encuesta, representatividad, características y conducción de la
muestra; además de la transmisión de los resultados, reportes y procedimientos.
Regulation (EC) No 1991/2002 del Parlamento Europeo y del Consejo del 8 de Octubre de
2002 sobre la organización de una encuesta muestral de fuerza laboral en la Comunidad.
Esta regulación pone un límite de tiempo sobre la adopción de la LFS continua.
Otra de las regulaciones que establece parámetros sobre la implementación de la LFS a
nivel nacional para poder suministrar datos a Eurostat y formar la LFS de la EU es
Commission Regulation (EC) No 1897/2000 del 7 de Septiembre de 2000. Esta regulación
contiene los 12 principios para la construcción del cuestionario nacional.
7
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Comparación de Encuesta de Empleo en América
USA, Colombia, Perú, Argentina y Chile
Tamaño y Diseño de la Muestra
La fuente del marco muestral está basado en la información del último censo de población
y vivienda de cada país y de su respectivo material cartográfico. La unidad final de
muestreo es el hogar (USA) o bien la vivienda (Chile, Perú, Argentina), a excepción de
Colombia cuya unidad final de muestreo son los segmentos, los cuales corresponden en
promedio a grupos de 10 viviendas cada uno.
La edad base para considerar a un individuo en situación de empleo difiere para cada uno
de los países analizados. En el caso de USA, Chile y Perú, las edades son 16, 15 y 14 años
respectivamente. Por su parte, Colombia, establece distintas edades dependiendo si se es de
zona urbana o rural (12 y 10 años respectivamente). En el caso de Argentina no se
especifica en sus documentos metodológicos, la edad mínima para ser considerado
individuo en situación de empleo.
Los esquemas de rotación que se plantean en estas encuestas son de dos tipos: 1) con salida
temporal (USA, Argentina), y, 2) Con permanencia continua hasta su salida definitiva
(Chile). El esquema de rotación utilizado por USA es mensual, estableciendo una
permanencia de 4 meses consecutivos, una posterior salida temporal durante 8 meses y un
una reincorporación por un período de 4 meses, para luego salir definitivamente de la
muestra. De forma similar Argentina establece un esquema de rotación de 2 – (2) – 2, es
decir, que la vivienda es encuestada durante 2 trimestres, y la misma cantidad de períodos
se deja sin encuestar, para luego entrevistarla durante otros 2 trimestre. Luego de esto la
vivienda sale de la muestra. En el documento metodológico de la encuesta de empleo
Argentina se plantea que: “Se optó por este esquema 2-(2)-2, teniendo en cuenta: La
experiencia previa, sobre la tasa de no respuesta cuando se trabaja con períodos largos de
permanencia en el panel. La necesidad de contar con un solapamiento mínimo entre
períodos consecutivos. La necesidad de contar con un solapamiento mínimo entre iguales
períodos de años consecutivos”. Además plantea que: “El solapamiento de las muestras
entre dos períodos consecutivos (o sea el porcentaje de muestra en común) juega en
sentido contrario para los primeros dos aspectos: si un esquema tiene un alto porcentaje
de solapamiento entre un período y el siguiente, medirá bien los cambios pero disminuirá
su precisión para una agregación a lo largo de varios períodos. Por el contrario, un bajo
solapamiento mejora la precisión cuando se agrega muestra, pero disminuye la precisión
de la estimación del cambio entre períodos sucesivos”. Por su parte, nuestra encuesta de
empleo establece un sistema de rotación de 6-, es decir, que cada vivienda es visitada en
seis ocasiones, con una diferencia entre cada entrevista, de tres meses. Luego de
transcurrido ese período la vivienda sale definitivamente de la muestra. En el caso de Perú
y Colombia, no aparece establecido ningún esquema de rotación en sus documentos
metodológicos.
En cuanto al método de levantamiento de la información, este se realiza por medio de
entrevista personal (en la primera y quinta entrevista) y vía telefónica las restantes
8
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
ocasiones, en el caso de USA. El resto de los países analizados, realizan sus encuestas a
través de entrevistas personales.
Sustitución, No Respuesta e Imputación
A nivel de estos cinco países americanos, no se realiza sustitución de las unidades finales
de muestreo que no responden y sólo Perú y USA realizan ajustes en sus estimaciones para
considerar el efecto de la no respuesta. Tanto Chile como Colombia, no llevan a cabo
dicho ajuste. En el caso de Argentina no se encontraba disponible esa información. Por
último la imputación por no respuestas de ítems se realiza sólo en USA y no hay
información sobre Argentina que señale si se realiza esta imputación o no.
Factores de Ponderación, el caso de USA, Perú y Chile
En el caso de Chile, en la Encuesta Nacional de Empleo el factor de ponderación o
expansión utilizado es:
( 2)
hi
F
Mh
M hi' PhSE
=
⋅
⋅ SE
nh ⋅ M hi mhi Pˆh
el cual está formado por dos partes:
(1)
hi
F
Mh
M hi'
=
⋅
nh ⋅ M hi mhi
que depende sólo del diseño muestral y que puede ser
interpretado como el inverso de la probabilidad de inclusión en la muestra, para una
persona perteneciente al estrato h y a la sección i.
La otra parte del factor de expansión corresponde a un ajuste que considera la proyección
de la población del estrato correspondiente.
Un estimador similar es utilizado en la Encuesta de Empleo de Perú. Para que las
estimaciones derivadas de la Encuesta Permanente de Empleo sean representativas de la
población, es necesario multiplicar los datos de cada hogar muestral contenido en los
archivos por el peso o factor de expansión calculado según el diseño muestral. Todo este
proceso es resumido al obtener la probabilidad de selección de cada vivienda, lo cual es
determinado de la siguiente manera:
1. ETAPA I. Se seleccionan un conjunto de conglomerados, su probabilidad de selección
esta dada por:
Nº Conglomerados Seleccionados en la Provincia * Nº Viviendas Ocupadas del i-ésimo Conglomerado
P1 = -----------------------------------------------------------------------------------------------------------------------------Nº Viviendas Ocupadas en la Provincia
9
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
2. ETAPA II. Selección de submuestras (grupo de viviendas) en cada conglomerado
seleccionado, la probabilidad de selección es:
Nº Submuestras Seleccionadas en el Conglomerado * Nº Viviendas Ocupadas en la j-ésima Submuestra
P2 = -----------------------------------------------------------------------------------------------------------------------------Nº Viviendas Ocupadas en el Conglomerado
La probabilidad de selección final es la multiplicación de P1 y P2 (P= P1 * P2). El inverso
a la probabilidad de selección final nos da el factor de expansión básico:
Wi = 1 / P
Wi = Factor de expansión básico para las viviendas seleccionadas dentro de la i–ésima
UPM muestral (conglomerado).
También, es importante ajustar los factores de expansión teniendo en cuenta la magnitud de
la no respuesta en cada UPM (conglomerado) muestral. El factor final de expansión (W´i )
para cada registro tiene dos componentes: el factor de expansión básico (Wi) y el factor de
ajuste por la no respuesta.
Dado que los factores de expansión son calculados al nivel de cada UPM (conglomerado)
seleccionada, es importante ajustar los factores de expansión a este nivel. En este caso el
factor final de expansión (W´i) para las viviendas seleccionadas dentro de la i–ésima UPM
seleccionada se puede expresar como:
W´i = ( Wi ) * (mi / m´i)
Donde:
mi = Total de viviendas seleccionadas dentro de la i – ésima UPM seleccionada, es decir, el
número de entrevistas más el número de no entrevistas.
m´i = Total de viviendas entrevistadas dentro de la i–ésima UPM seleccionada.
La no entrevista, se refiere a unidades de muestreo válidas, es decir, que no pudieron ser
entrevistadas a causa de rechazos y/o ausencia de informantes.
Por otro lado, las no entrevistas no incluyen unidades de muestreo no válidas seleccionadas
como viviendas desocupadas, abandonadas, transitorias, destruidas, etc. Es decir, donde se
sabe concretamente, por las causas que los motivaron, que no existe hogar, es decir, reflejan
problemas de marco.
En la LFS de USA el procedimiento de estimación involucra la ponderación de los datos
de cada persona en la muestra por el inverso de la probabilidad de que la persona esté en la
muestra. A través de una serie de pasos de estimación, las probabilidades de selección son
ajustadas por la no respuesta y subcobertura de la muestra; los datos de meses previos son
incorporados en las estimaciones a través del procedimiento de estimación compuesto.
10
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
1. Ajuste para la no respuesta. Las ponderaciones para todos los hogares entrevistados
son ajustados para tener en cuenta la muestra de hogares ocupados para los cuales la
información no fue obtenida debido a la ausencia de los ocupantes, caminos
inaccesibles, rechazos, o incapacidad de los encuestados por otras razones. Este ajuste
por no respuesta es hecho separadamente de los cluster similares de áreas muestrales
que son usualmente, pero no necesariamente, contenidos en los Estados. La
similaridad de las áreas muestrales se basan en estatus y tamaño del Área Estadística
Metropolitana (MSA). Dentro de cada Cluster, existe un post desglose por residencia.
Cada cluster MSA es dividido en “ciudad central” y “resto de la MSA”. Cada cluster
no MSA es dividido en categorías de residencia “Urbano” y “Rural”. La proporción
de la encuesta no entrevistada varía de 7% a 8%, dependiendo del tiempo, época de
vacaciones y así sucesivamente.
2. Estimaciones de Razón: La distribución de la población seleccionada para la muestra
se diferencia, por azar, del total de la población en las características tales como edad,
raza, sexo, origen étnico, y estado de la residencia.
Ya que estas características son muy correlacionadas con la participación en la fuerza
laboral y otras mediciones principales hechas a partir de la muestra, las estimaciones
de la encuesta pueden ser sustancialmente mejoradas cuando ponderamos
apropiadamente por la distribución conocida de esas características poblacionales.
Esto es realizado a través de un ajuste de razón de dos etapas, como sigue:
a. Estimación de Razón, Primera Etapa: El propósito del ajuste de razón de
primera etapa es reducir la contribución a la varianza de la selección de
muestras de Unidades de muestreo primarias más que seleccionando una
muestra de hogares desde cada unidad de muestra primaria en la Nación. Este
ajuste es hecho para las ponderaciones de la Current Population Survey (CPS)
en dos celdas de raza: Negro y no negro, y dos celdas de edad: 0 a 15 años y
16 años y más; esto sólo aplicado a datos desde las UMP que no son
auto-representativas y para aquellos estados que tienen un número sustancial
de viviendas negras. El procedimiento corrige las diferencias que existieron en
cada celda de Estado al momento del censo 2000 entre 1) la distribución de la
de la población por raza en la muestra de unidades de muestreo primario y 2)
la distribución de la raza para todas las UMP. (Ambos, 1 y 2, de las UMP
auto-representadas).
b. Estimación de Razón, Segunda Etapa: Este procedimiento reduce
sustancialmente la variabilidad de las estimaciones y corrige, en cierto modo,
para las subcoberturas de la CPS. Las ponderaciones de la muestra de la CPS
son ajustadas para asegurar que las estimaciones de la población, basadas en la
muestra, coincidan con las variables poblacionales independientes de control.
Iniciando el 2003, la ponderación de dos etapas tiene nuevos pasos de
cobertura “0A” y “0B” que son seguidos por un proceso ------- iterativo.
California y Nueva York son divididos en áreas subestados, y 53
Estados/áreas son usadas en el Paso 0B y el paso 1 (los Angeles-Long Beach
11
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
área metropolitana; resto de California; Ciudad de Nueva York; resto de
Nueva York; los otros 48 Estados; y el Distrito de Columbia).
El paso 0A de cobertura nacional no iterado es adicionado en primer lugar
para mejorar la eficiencia del ajuste para subpoblaciones que son propensas a
subcoberturas. El paso 0A también provee algún control para la raza Asiática
que podría no ser incluida en los pasos de iteración. El paso 0B de cobertura
de Estados no iterados es diseñado para ajustar por diferencia de coberturas,
para raza/género/edad, entre los Estados. La raza es limitada a negro y no
negro, y no existe componente de origen étnico en el paso.
Los tres pasos iterados ajustan las ponderaciones de la muestra a los siguientes
grupos control:
i.
ii.
iii.
Paso Estado – 6 géneros x celdas de edad definidas para 53
estados/áreas
Paso Origen étnico – 26 hispanos y 26 no hispanos, celdas de
género x edad.
Paso Raza – 34 sólo blancos, 26 sólo negros, y 26 Sólo
asiáticos y el resto, celdas de genero x edad.
Los controles para la población independiente son preparados mediante
proyecciones a largo plazo de la población residente enumerada igual que el 1
de Abril de 2000. Las proyecciones son derivadas mediante la actualización de
los datos del censo demográfico con información de una gran cantidad de
otras fuentes de datos que informan nacimientos, muertes e inmigración neta.
Restando el número de personal de Fuerzas Armadas y personas
institucionalizadas residentes se reduce la población residente a la población
no institucional civil.
3. Procedimiento de Ponderación Compuesto: El último paso en la preparación de
mayoría de las estimaciones de la CPS hace uso de un procedimiento de estimación
compuesto. Estimaciones compuestas son creadas como un promedio ponderado de
dos factores: (1) La estimación de razón de dos etapas basado en los datos de la
muestra completa del mes actual; y, (2) La estimación compuesta para el mes anterior,
ajustado por una estimación del cambio de un mes a otro basado en los seis grupos de
rotación común a ambos meses. Un término de ajuste de sesgo es añadido al promedio
ponderado para reducir la varianza y considerar parcialmente para el sesgo asociado a
estimaciones de las muestra del mes. Este sesgo en la muestra del mes es expuesto
mediante estimaciones de desempleo de personas en su primer y quinto mes en la
CPS que son generalmente más altos que las estimaciones obtenidas para los otros
meses.
Estas estimaciones compuestas luego son usadas como controles en el procedimiento
de ponderación compuesto. Tanto empleados como desempleados son controlados en
cada celda definida, y los no incluidos en la fuerza laboral son controlados como
resto. El procedimiento iterativo es similar al usado para la ponderación de segunda
etapa:
12
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
a) Paso Estado – una sola celda para CPS 16+ es usada para los 53 Estados/áreas.
b) Paso Origen Étnico – 10 hispanos y 10 no hispanos, celdas de genero x edad.
c) Paso Raza – 22 solo blanco, 14 solo negro, y 10 solo asiáticos y el resto,
celdas de genero x edad.
La estimación compuesta da como resultado una reducción en el error muestral más
allá del que se espera a través de la estimación de razón de dos etapas. Para algunos
ítems, la reducción es sustancial. Los aumentos resultantes en confiabilidad son datos
históricos, generalmente por los 5 años más recientes, se hacen solamente al principio
de cada año civil.
Comentarios
En el transcurso de la recopilación de los documentos y datos que dieron origen a este
informe, se detectó una gran falencia en lo que respecta a las encuestas americanas, y en
general a encuestas de países no pertenecientes a la Unión Europea.
Dado que Eurostat intenta armonizar el formato y la información proveniente de las encuestas
de fuerza laboral de sus países miembros y dado que apunta a lograr estadísticas de mejor
calidad, entendiendo por calidad, la definición establecida por Eurostat en su documento
metodológico “Definition of Quality in Statistics”, la información metodológica de la
construcción, tanto de la LFS de la Unión Europea como de las LFS’s nacionales de cada uno
de los Estados Miembros, es de muy fácil acceso y ésta se encuentra bastante detallada.
El problema se presenta cuando nos alejamos del ámbito de la LFS de la Unión Europea.
Particularmente en el caso de las encuestas americanas, es difícil encontrar documentos
metodológicos de alto nivel de elaboración a disposición del público en general (mas
precisamente en formato HTML o bien algún documento electrónico, en los sitios web de los
distintos INE) y con información detallada y relevante. La metodología de USA es la más
completa, en referencia a los países americanos estudiados.
Otro detalle que pude apreciar con respecto a los países analizados, es uno de los pocos que
no tiene registros para la Tasa de Respuesta (y de No Respuesta), aunque en la próximas
versiones de la ENE esta información vendrá codificada en la base de datos y se podrá
determinar. Además actualmente, el departamento de Investigación y Desarrollo está
desarrollando un estudio, con respecto al impacto de la inclusión de la no respuesta, como
parte del factor de expansión de la muestra, en las estadísticas de empleo. Esta política de
incluir un ajuste para la no respuesta dentro del factor de expansión, como aquí se ha
planteado, la utilizan varios países, entre ellos USA, Bélgica, Alemania, Portugal y Reino
Unido, entre otros.
Además dentro de este estudio hubiese resultado muy interesante poder analizar la forma de
cálculo de los estimadores y la precisión de los mismo, en los distintos países de las regiones
analizadas, pero esto no se pudo realizar debido a que dicha información no está disponible
para el público en general, por lo menos no el las paginas web de los sitios visitados.
Para terminar se presentan los cuadros resumen de las encuestas de empleo analizadas, con
la información que se pudo obtener a través de sus respectivos documentos metodológicos.
13
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Cuadros Resumen sobre las Encuestas de Fuerza Laboral de los Estados Miembros
de la Unión Europea, Datos 2004
Cobertura, Frecuencia y Tasa de Respuesta de los Estados Miembros de la Unión Europea
Labour Force Survey 2004
Participación
Población entrevistada
Población en Viviendas
para situación de
Institucionales
empleo
Frecuencia
de los
Resultados
Tasa de
Respuesta
BE
Obligatoria
15+ (2da ronda 15-64)
No
Trimestral
76,0%
DK
Voluntaria
15 - 74
Muestreo
Trimestral
64,8%
DE
Obligatoria. Algunas
Preguntas en la LFS
son Voluntarias
15+
Muestreo
Anual
96 - 97%
EL
NA
15+
No
Trimestral
90,4%
ES
Obligatoria
16+
No
Trimestral
91,0%
FR
Obligatoria
15+
Por medio del Hogar
Trimestral
81,9%
IE
Voluntaria
15+
No
Trimestral
NA
IT
Obligatoria
15+
No
Trimestral
89,5%
LU
Voluntaria
15 - 74
No
Anual
33,4%
NL
Voluntaria
15+
No
Trimestral
64,0%
AT
Obligatoria
15+
No
Trimestral
80,2%
PT
Obligatoria
15+
No
Trimestral
89,3%
FI
Voluntaria
15 - 74
Muestreo
Mensual
84,1%
SE
Voluntaria
15 - 74
Muestreo
Mensual
83,5%
UK
Voluntaria
16+
Por medio del Hogar
(estudiantes)
Trimestral
73,6%
14
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Tamaño y Diseño Muestral de los Estados Miembros de La Unión Europea
Labour Force Survey 2004
Tamaño Muestral Programado
(Promedio Trimestral 2004)
Personas
Hogares
15 - 74
Bases del Marco Muestral
Unidad de
Muestreo
Primaria
Unidad de
Muestreo Final
Fracción de
Muestreo
Total por
Trimestre
BE
Registro de Población
Secciones
Estadísticas
Hogares
0,3%
11.300
22.400
DK
Registro de Población
Central / Registro de
Desempleo
--
Personas
0,4%
--
10.800
DE
Censo 1987 / Registro de
Población / Registro de
Viviendas Nuevas
--
Conglomerados
de Viviendas
(Distritos
Muestrales)
0,5%
149.900
248.100
EL
Censo 2001
Bloque
Hogares
0,9%
32.000
62.200
ES
Censo 2001, Actualizado
con los Registros de
Población
Áreas
Geográficas
Viviendas
0,5%
61.300
134.300
FR
Censo 1999
Conglomerados
Geográficos
(aires)
Viviendas
0,2%
37.300
63.000
IE
Censo 2002
Bloques Censales
(75 viviendas)
Conglomerados
de Viviendas (15
Viviendas)
3,3%
30.400
64.100
IT
Registros Municipales
Municipalidades
Hogares
0,3%
67.900
134.400
LU
Registro de Población
Central
--
Hogares
2,6%
1.900
4.000
NL
Direcciones Postales y
Registro de Población
Municipalidades
--> Direcciones
de Correo
Hogares
0,7%
43.200
87.300
--
Viviendas
0,6%
19.100
36.500
--
Viviendas
0,6%
18.000
38.300
--
Personas
0,9%
--
36.400
--
Personas
1,0%
--
49.200
--
Direcciones /
Números de
Teléfonos en
Norte de Escocia
0,1%
54.000
91.000
AT
PT
FI
Registros de Población
Central
Censo 2001 / Base
Referenciada de
Información Geográfica
(BGRI)
Registro de Población
Central
Registro de Población
Central
Direcciones Postales /
Números telefónicos (Norte
UK
Escocia) / Unidades de
Hogares (Norte de Irlanda)
SE
15
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Estratificación, Esquema de Rotación y Ponderación de los Países Miembros de la Unión Europea
Labour Force Survey 2004
Variables Usadas para la
Estratificación
Esquema de Rotación
Variables de Ponderación
BE
Región
2-
Sexo, Grupo Etareo, Provincia
DK
Desempleados Registrados
2 - (2) - 1
Sexo, Edad, Ingreso, Sector de Actividad,
Educación Profesional, Registro de Desempleo
DE
Región
4 - (Anual)
Sexo, Región, Nacionalidad
EL
Región (NUTS-3) * Urbanización
6-
Sexo, Edad, Región (NUTS-2)
ES
Tamaño de la Población en la
Municipalidad
6-
Sexo, Edad, Región, Nacionalidad
FR
Región Francesa (NUTS-2) y Tipo de
Unidad Urbana
6-
Tamaño de Entidad Urbana, Tamaño y Tipo de
Casas, Número de Nuevas Viviendas, Grupo
Etareo, Sexo, Regiones, Ronda de Encuesta
IE
Región, Urbanización
5-
Sexo, Grupo Etareo, Región
2 - (2) - 2
Sexo, Grupo Etareo, Región
2* -
Clase de Tamaño de Hogar * Grupo Etareo,
Sexo*Grupo Etareo*Ciudadanía
IT
LU
Categorías de Tamaños de
Municipalidades dentro de las
Regiones (NUTS-3)
Cantones, Clases de Tamaño de
Hogares (1, 2, 3, 4+)
NL
Región (Corop), Regiones de
Oficinas de Empleo
5-
Sexo, Grupo Etareo, Región, Grupo Étnico,
Estado Civil
AT
Estados Federados
5-
Sexo, Grupo Etareo, Región, Nacionalidad
PT
Regiones (NUTS-3)
6-
Sexo, Grupo Etareo, Región
FI
Región
3 - (1) - 2
Sexo, Grupo Etareo, Región, Semana de
Referencia, Estado de Busqueda de Trabajo
SE
Sexo, Condado, Nacionalidad, Estado
de Empleo
8-
Sexo, Grupo Etareo, Sector de Actividad
Desempleo Registrado.
UK
Mediante el Marco
5-
Sexo, Grupo Etareo, Región
16
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Cobertura, Frecuencia y Tasa de Respuesta
Encuestas de Empleo Americanas
Participación
Población
entrevistada para
situación de empleo
Población en
Viviendas
Institucionales
Frecuencia de los
Resultados
Tasa de
Respuesta
USA
Voluntaria
16+
No
Mensual
93,0%
Colombia
--
10+ zona rural
12+
zona urbana
No
Mensual, Bimestral,
Trimestral, Semestral y
Anual
--
Perú
Argentina
Chile
--Obligatoria
14+
?
15+
No
No
No
Trimestral
Trimestral
Mensual
95,7%
-?
Tamaño y Diseño Muestral
Encuestas de Empleo Americanas
Unidad de
Muestreo
Primaria
Bases del Marco Muestral
USA
Colombia
Perú
Argentina
Chile
Encuesta de Población Actual
Último Censo de Población
Censo de Población y Vivienda
de 2005
Precenso 2001 y Censo 2002
Fracción de
Muestreo
Total por
Trimestre
Tamaño Muestral Programado
(Promedio Trimestral 2004)
Personas
Hogares
15 - 74
Áreas
Geográficas
--
Hogares
0,05%
60.000
110.000
Segmentos
--
37.500
?
--
Viviendas
--
11.960
?
Viivendas
--
25.000
?
Viviendas
--
34.511
?
Áreas
Geográficas
Secciones
--
Unidad de
Muestreo
Final
Estratificación, Esquema de Rotación y Ponderación
Encuestas de Empleo Americanas
USA
Colombia
Perú
Argentina
Chile
Variables Usadas para la Estratificación
Esquema de
Rotación
Variables de Ponderación
Desempleo, Proporción de Casas con Tres o más Personas,
Número de Personas Empleadas en Diversas Industrias y
Promedio Mensual de Ingresos para Diferentes Industrias
4m - (8m) - 4m
Edad, Género, Origen étnico,
Raza
-----
?
?
2 - (2) - 2
6+
-----
17
RECOPILACIÓN DE INFORMACIÓN ACERCA DE LA CONSTRUCCIÓN DE PRODUCTO ENE
Bibliografía
1. Eurostat. (2006). Labour force survey in the EU, Candidate and EFTA countries:
Main characteristics of the national survey 2004. http://epp.eurostat.ec.europa.eu/
cache/ITY_OFFPUB/KS-BF-06-001/EN/KS-BF-06-001-EN.PDF.
2. Eurostat. (2006). European Union Labour Force Survey:Quality Report 2004.
http://epp.eurostat.ec.europa.eu/pls/portal/docs/PAGE/PGP_DS_QUALITY/PGE_DS
_QUALITY_01/LABOUR%20FORCE%20SURVEY%20QUALITY%20REPORT%
202004%20KS-CC-06-007-EN.PDF.
3. Eurostat. (2004). Labour force survey in the acceding countries: Methods and
definitions – 2002. http://epp.eurostat.ec.europa.eu/cache/ITY_OFFPUB/KS-BF-04001/EN/KS-BF-04-001-EN.PDF.
4. Eurostat. (2003). The European Union labour force survey: Methods and definitions
– 2001. http://epp.eurostat.ec.europa.eu/cache/ITY_OFFPUB/KS-BF-03-002/EN/KSBF-03-002-EN.PDF.
5. Perú, INEI. (2007). Ficha Técnica Encuesta permanente de empleo, Trimestre Móvil:
Febrero – Marzo – Abril 2007. INEI, Encuestas y Registros: http://www.inei.gob.pe/.
6. Colombia, DANE. (2007). Ficha Metodológica: Encuesta Continua de Hogares.
http://www.dane.gov.co/files/investigaciones/fichas/empleo/ficha_ech.pdf.
7. USA, Bureau of Labor Statitics. (2007). Labor force data derived from the Current
Population Survey. BLS Handbook of Methods, Capitulo1. http://www.bls.gov/opub/
hom/homch1_itc.htm.
8. Argentina, INDEC. La nueva encuesta permanente de hogares de Argentina
2003. http://www.indec.mecon.ar/nuevaweb/cuadros/4/Metodologia_EPH
Continua.pdf.
9. Reino Unido. (2007). Eurostat and derived variables. Labour force survey user guide,
Vol. 9, de http://www.statistics.gov.uk/statbase/Product.asp?vlnk=1537.
10. Quatember, A. (2002). A comparison of the five Labour Force Surveys of the
DACSEIS Project from a sampling theory point of view. DACSEIS research paper
series, No 3, de
http://w210.ub.uni-tuebingen.de/dbt/volltexte/2002/547/
pdf/DRPS3.pdf
11. Bour, J y Susmel, N. (Junio de 2007). Las Estadísticas Laborales. Fundación de
Investigaciones Económicas Latinoamericanas. Documento de Trabajo Nº 52.
http://www.fiel.org/publicaciones/Documentos/doc52.pdf.
12. OIT. LABORSTA Internet. Población económicamente active, empleo, desempleo y
horas de trabajo (encuestas de hogares). Fuentes y Métodos: Estadísticas del
Trabajo, Vol. 3. http://laborsta.ilo.org/.
18
Descargar