metodologías para la integración de bases de datos de encuestas

Anuncio
261
METODOLOGÍAS PARA LA INTEGRACIÓN DE BASES
DE DATOS DE ENCUESTAS DE HOGARES
CARLOS E. CALVO
INSTITUTO NACIONAL DE ESTADÍSTICA (INE)
URUGUAY
262
Metodología para la integración de bases...
ÍNDICE
Página
1.
Introducción ......................................................................................................................... 263
2.
Procedimientos de la ECH ................................................................................................... 263
3.
Breve Descripción del Sistema ECH ................................................................................... 264
Metodología para la integración de bases...
263
El presente documento resume los aspectos principales del manejo de la información de la Encuesta
Continua de Hogares (ECH) del Uruguay. Al considerar más conveniente e ilustrativo, realizar en el
Taller, una demostración real del sistema utilizado por la Encuesta, solo se hace aquí una breve reseña
del mismo. Por otra parte es posible acceder a la documentación completa de la Encuesta en el sitio web
WWW.INE.GUB.UY1; así como en intranet del Instituto se encuentran todos los manuales de
procedimiento; en el marco de la definición del sistema de gestión de calidad del INE.
1. Introducción
Es importante, a los efectos de ilustrar la capacidad de este sistema, realizar una breve descripción de la
ECH.
En el Uruguay desde el año 1968 se releva en forma ininterrumpida una encuesta a hogares, de
propósitos múltiples (si bien sus objetivos básicos son el aportar información sobre la condición de
actividad de la población y el nivel de ingresos familiar), de carácter continua (es decir se recoge
información durante los 365 días del año), que divulga resultados mensualmente bajo la modalidad de
trimestre móvil.
A pesar de que su ámbito geográfico es solo urbano, dado la distribución espacial de la población
uruguaya, la información obtenida por la Encuesta Continua de Hogares (ECH) es representativa del 81
por ciento de la población total del país, tal cual se muestra a continuación:
Población total proyectada año 2002 del Uruguay ............................................ 3.384.700
Población proyectada año 2002 en localidades de 5000 o + habitantes ........... 2.731.194
El tamaño efectivo anual de la muestra es de 18.500 viviendas y 56.300 personas (cada persona
entrevistada representó en el año 2002 a 48 habitantes).
El personal afectado a la Encuesta suma 56 personas distribuidas de la siguiente manera:
Preparación de material y control administrativo de la encuesta .............
Relevamiento capital nacional ...................................................................
Relevamiento resto del país ........................................................................
Supervisión de campo..................................................................................
Consistencia, codificación e ingreso de encuestas .....................................
Análisis y generación de información ........................................................
5 funcionarios
12 funcionarios
21 funcionarios
7 funcionarios
8 funcionarios
3 funcionarios
Como se ve, el 70 por ciento del mismo se destina a la recolección en campo de la información y tan solo
el 30 por ciento a todo el resto de las tareas incluyendo también dentro de éstas la elaboración y análisis
de resultados.
La difusión de la información, de acuerdo con el cronograma general del INE, se hace a los 30 días de
finalizado el período de referencia.
2. Procedimientos de la ECH.
La Encuesta Continua de Hogares trabaja, a partir de la reformulación 2001 de su cuestionario, con un
sistema integrando las actividades de relevamiento, administración, consistenciación, codificación y
obtención de resultados básicos, lo que permitió mejorar la operativa general del trabajo en todas sus
etapas, así como dar una total transparencia al mismo. La mejora se vio especialmente reflejada además,
en un aumento sustantivo de la calidad ya que en su confección se puso el énfasis en las normas de
control.
1
"Biblioteca en línea, Series Monográficas, Metodologías, Metodología de la ECH".
264
Metodología para la integración de bases...
Esquemáticamente el flujo de trabajo se muestra en la siguiente figura, donde las tareas encerradas en
rombos se encuentran programadas en el sistema.
generación
de la muestra
administración
de las cargas
de trabajo
entrevista
cuestionario papel
supervisión en
campo
recepción de
entrevistas
control
global de
calidad
ingreso,
consistencia
codificación
obtención de
resultados
3.
Breve Descripción del Sistema ECH
Tal como se indicó anteriormente el sistema ECH abarca las tareas desde la generación de la muestra
hasta la tabulación de resultados; por lo que hace una integración total de las acciones.
La generación de la muestra se hace a partir del marco de viviendas del Censo General de Población y
Viviendas. Esta operación se encuentra programada atendiendo a las especificaciones definidas de
diseño, tamaño, confiabilidad, etc., y se dispara automáticamente.
Metodología para la integración de bases...
265
Resumidamente, el sistema se conecta con la base ORACLE, que contiene el marco del Censo
(actualizado permanentemente por la Unidad de Cartografía), y de acuerdo con las especificaciones
definidas, selecciona zonas censales dentro de las localidades participantes, y dentro de estas viviendas.
En esta operación además se conecta con la base que contiene la muestra del año anterior, comparándola
a efectos de que no exista duplicaciones. También calcula para cada vivienda su expansor mensual, anual
y semestral, así como determina el mes y semana en que se debe relevar la misma.
A partir de esa muestra se ubican espacialmente las viviendas a encuestar (esta tarea es la única manual
ya que los directorios de edificios detallados con que cuenta el Instituto actualmente no están en soporte
magnético2 ) y automáticamente se genera e imprime una etiqueta autoadhesiva (que se pega a cada
cuestionario) con los datos de identificación desplegados y en código de barras que permitirá realizar el
seguimiento particular de cada cuestionario, es decir que funcionarios realizaron las distintas etapas, en
que fechas, situación del mismo, etc.
La asignación de cuestionarios a distintas tareas y funcionarios, así como la administración de la encuesta
ocupa poco tiempo gracias a la utilización del código de barras. La siguiente figura muestra las pantallas
para tales tareas.
2
ya está el proyecto de digitación del directorio de edificios que surja del nuevo Censo.
266
Metodología para la integración de bases...
pantalla: ADMINISTRACION
MANTENIMIENTO
El sistema cuenta con una serie de reportes administrativos que permiten conocer en tiempo real la
marcha del trabajo, así como efectuar la consulta en particular de cualquier entrevista.
La generación de cada uno de ellos puede realizarse para un período de tiempo en particular, así como
para un área geográfica determinada.
Metodología para la integración de bases...
267
pantalla: ADMINISTRACIÓN
pantalla: ADMINISTRACIÓN
LISTADOS
LISTADOS
LISTADOS
LISTADOS
Seleccione su listado
268
Metodología para la integración de bases...
Estos reportes, se complementan con listados que detallan entrevista por entrevista, generados a través de
la pantalla que muestra la figura siguiente. Por ejemplo con ellos se puede conocer el detalle de
entrevistas que integra cada lote, etc.
Pantalla: ADMINISTRACION
LISTADOS
ETAPAS
Mediante la aplicación VER MUESTRA, se puede realizar un seguimiento de todas las entrevistas en
todas sus etapas, para analizar tiempos de trabajo, re-salidas a campo, etc. Es muy utilizada para ubicar
entrevistas que puedan haber quedado sin digitar por traspapelarse en un lote. Como los listados se
pueden generar en excel y para un período en particular, el manejo resulta muy simple.
Metodología para la integración de bases...
Pantalla: ADMINISTRACION
269
LISTADOS
VER MUESTRA
Esta aplicación puede realizarse para una entrevista en particular, utilizando la opción CONSULTA del
sub-menú ADMINISTRACIÖN.
Una vez relevada la información, los cuestionarios son ingresados por un crítico-codificador mediante un
programa inteligente que cuenta con un importante número (superior a 150) de reglas de consistencia
(errores y alertas) que impide el ingreso de información con errores, omisiones, etc. Es muy importante
aclarar que la ECH en Uruguay no permite la omisión en ninguna de sus preguntas por tanto no hay
imputación alguna. En otro orden merece destacar, que el tiempo promedio de ingreso de toda la
información de una persona es de 2 minutos y medio.
En esta misma operación se codifica la información de rama de actividad, tipo de ocupación, área
geográfica, y educación. A tales efectos se cuenta con una base de datos de alimentación continua que
permite codificar automáticamente o en su defecto en forma asistida la información.
Esta base de datos de codificadores no solo es utilizada por la ECH sino por todas las investigaciones que
realiza el Instituto y necesiten codificar información de rama, ocupación, etc. Se debe destacar que esta
base de datos cuenta con el nomenclator oficial de cada uno de los codificadores internacionales y de un
diccionario (carteles o descripciones habituales) que se va incrementando permanentemente a través de la
digitación de las descripciones anotadas por el encuestador, que quedan asociadas a los códigos
asignados y controlados con el nomenclator oficial.
Además también en esta operación se valora, con parámetros estándar (los que deben cargarse, a través
de la opción valores, todos los meses antes del ingreso del primer cuestionario para garantizar su
actualización), ingresos en especie y se generan variables agregadas, tales como condición de actividad
de la persona, inserción laboral (subempleo, registrado en la seguridad social, etc.), nivel de educación,
ingreso de la ocupación principal, ingreso del hogar, etc., etc. variables que quedan adosadas al registro
de cada persona u hogar según corresponda.
Algunas de las variables agregadas se presenta a continuación:
a. variables agregadas en registro de hogar.
⇒ cantidad de hombres.
⇒ cantidad de mujeres.
⇒ cantidad de menores de 14 años.
270
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
Metodología para la integración de bases...
cantidad de mayores de 60 años.
cantidad de ocupados.
cantidad de desocupados.
cantidad de desocupados propiamente dichos.
cantidad de desocupados buscan trabajo primera vez.
cantidad de inactivos.
cantidad servicio doméstico.
cantidad de personas sin servicio doméstico.
cantidad de personas perceptores de ingresos.
b. variables de ingresos agregadas en el registro de hogar.
⇒
⇒
⇒
⇒
⇒
⇒
⇒
ingreso del hogar con valor locativo sin servicio doméstico.
ingreso del servicio doméstico.
valor locativo.
valor del alquiler.
ingreso del jefe de hogar.
ingreso del cónyuge.
ingreso otros miembros del hogar.
c. variables de ingresos agregadas en el registro de personas.
⇒
⇒
⇒
⇒
total de ingresos.
total de ingresos por trabajo
ingreso de la ocupación principal
ingreso de otras ocupaciones
d. determinación de la condición de actividad económica de la persona.
e. determinación de grupos especiales de ocupados.
f.
determinación del nivel educativo de la persona
Una vez ingresadas todas las encuestas de un período determinado, el sistema cuenta con un módulo de
crítica que realiza una consistenciación global de la base de datos seleccionada, emitiendo los reportes
respectivos. Este procedimiento se completa con una serie de controles que se encuentran programados
en SPSS, es decir por fuera del sistema, para extremar las medidas de calidad de la información, que
exige, si es necesario la vista particular de entrevistas que se alejen de determinados patrones.
Aceptada la calidad de la base el sistema tiene programado un conjunto de cuadros que brinda la
información, en planillas Excel, que de forma habitual difunde el Instituto sobre mercado de trabajo e
ingresos familiares.
La nómina de estos cuadros se presenta a continuación:
1.
2.
3.
4.
5.
Tasa de actividad, empleo y desempleo, por sexo, según área geográfica.
Distribución de la población ocupada, por sector de actividad, según área geográfica.
Distribución de la población ocupada, por sector de actividad, según área geográfica.
Promedio de horas trabajadas en la semana, por sector de actividad, según área geográfica.
Población ocupada por cantidad de empleos (%) y número medio de empleos por persona ocupada,
según área geográfica.
Metodología para la integración de bases...
271
6. Contribución a la tasa de desempleo, por componentes, sexo, edad y relación con la jefatura del
hogar, según área geográfica.
7. Tasa específica de desempleo por grupo de edades, sexo y relación con la jefatura del hogar, según
área geográfica.
8. Distribución del desempleo, por sector de actividad, según área geográfica.
9. Estimaciones de algunas medidas descriptivas del ingreso (en pesos corrientes) y la población, según
área geográfica.
10. Distribución porcentual de desocupados, según área geográfica.
11. Tasa de actividad, empleo y desempleo, e ingreso medio del hogar, según gran área geográfica.
12. Personas desocupadas por condiciones de empleo requeridas (en porcentaje) y duración media del
desempleo, según área geográfica.
13. Ingreso promedio (en pesos uruguayos) de la ocupación principal por categoría de la ocupación,
según área geográfica y sexo.
14. Ingreso promedio (en pesos uruguayos) de la ocupación principal por sector de actividad, según área
geográfica y sexo.
15. Distribución de la población ocupada por nivel más alto de educación alcanzado, según área
geográfica.
Adicionalmente es posible la obtención de bases de microdatos para determinada área geográfica y
período de tiempo, en formato Excel o DBF para trabajar en este último caso en SPSS y realizar todas las
tablas a medida necesarias, en breves plazos.
Pantalla: ADMINISTRACION
LISTADOS
GENERAR ARCHIVOS
Como se puede ver en la figura anterior, la generación de bases de microdatos contempla el destino de la
misma, INE o Terceros. La diferencia fundamental que presentan estas es sobre la identificación de
272
Metodología para la integración de bases...
registros para salvaguardar el secreto estadístico, así como inclusión de carteles o algunas variables
generadas con el solo fin de control interno.
Como se desprende de lo anterior los usuarios tienen libre acceso a las bases de microdatos de la
encuesta, lo que les permite realizar los cruces u obtener la información a su medida. Simplemente deben
comprometerse a utilizarlas con los fines y en las condiciones que ellas permiten.
La figura siguiente intenta ilustrar el sistema ECH:
Base marco CPV
ORACLE
módulo de
cuadros XLS
Base de Datos
ECH
ORACLE
interfaz del usuario
VISUAL FOX PRO
Base de Datos
CODIFICADORES
nomenclator oficial
tabla de carteles
ORACLE
OTRAS
ENCUESTAS
archivos
EXCEL
archivos
DBF
Tablas
SPSS
cuadros finales
EXCEL
Descargar