261 METODOLOGÍAS PARA LA INTEGRACIÓN DE BASES DE DATOS DE ENCUESTAS DE HOGARES CARLOS E. CALVO INSTITUTO NACIONAL DE ESTADÍSTICA (INE) URUGUAY 262 Metodología para la integración de bases... ÍNDICE Página 1. Introducción ......................................................................................................................... 263 2. Procedimientos de la ECH ................................................................................................... 263 3. Breve Descripción del Sistema ECH ................................................................................... 264 Metodología para la integración de bases... 263 El presente documento resume los aspectos principales del manejo de la información de la Encuesta Continua de Hogares (ECH) del Uruguay. Al considerar más conveniente e ilustrativo, realizar en el Taller, una demostración real del sistema utilizado por la Encuesta, solo se hace aquí una breve reseña del mismo. Por otra parte es posible acceder a la documentación completa de la Encuesta en el sitio web WWW.INE.GUB.UY1; así como en intranet del Instituto se encuentran todos los manuales de procedimiento; en el marco de la definición del sistema de gestión de calidad del INE. 1. Introducción Es importante, a los efectos de ilustrar la capacidad de este sistema, realizar una breve descripción de la ECH. En el Uruguay desde el año 1968 se releva en forma ininterrumpida una encuesta a hogares, de propósitos múltiples (si bien sus objetivos básicos son el aportar información sobre la condición de actividad de la población y el nivel de ingresos familiar), de carácter continua (es decir se recoge información durante los 365 días del año), que divulga resultados mensualmente bajo la modalidad de trimestre móvil. A pesar de que su ámbito geográfico es solo urbano, dado la distribución espacial de la población uruguaya, la información obtenida por la Encuesta Continua de Hogares (ECH) es representativa del 81 por ciento de la población total del país, tal cual se muestra a continuación: Población total proyectada año 2002 del Uruguay ............................................ 3.384.700 Población proyectada año 2002 en localidades de 5000 o + habitantes ........... 2.731.194 El tamaño efectivo anual de la muestra es de 18.500 viviendas y 56.300 personas (cada persona entrevistada representó en el año 2002 a 48 habitantes). El personal afectado a la Encuesta suma 56 personas distribuidas de la siguiente manera: Preparación de material y control administrativo de la encuesta ............. Relevamiento capital nacional ................................................................... Relevamiento resto del país ........................................................................ Supervisión de campo.................................................................................. Consistencia, codificación e ingreso de encuestas ..................................... Análisis y generación de información ........................................................ 5 funcionarios 12 funcionarios 21 funcionarios 7 funcionarios 8 funcionarios 3 funcionarios Como se ve, el 70 por ciento del mismo se destina a la recolección en campo de la información y tan solo el 30 por ciento a todo el resto de las tareas incluyendo también dentro de éstas la elaboración y análisis de resultados. La difusión de la información, de acuerdo con el cronograma general del INE, se hace a los 30 días de finalizado el período de referencia. 2. Procedimientos de la ECH. La Encuesta Continua de Hogares trabaja, a partir de la reformulación 2001 de su cuestionario, con un sistema integrando las actividades de relevamiento, administración, consistenciación, codificación y obtención de resultados básicos, lo que permitió mejorar la operativa general del trabajo en todas sus etapas, así como dar una total transparencia al mismo. La mejora se vio especialmente reflejada además, en un aumento sustantivo de la calidad ya que en su confección se puso el énfasis en las normas de control. 1 "Biblioteca en línea, Series Monográficas, Metodologías, Metodología de la ECH". 264 Metodología para la integración de bases... Esquemáticamente el flujo de trabajo se muestra en la siguiente figura, donde las tareas encerradas en rombos se encuentran programadas en el sistema. generación de la muestra administración de las cargas de trabajo entrevista cuestionario papel supervisión en campo recepción de entrevistas control global de calidad ingreso, consistencia codificación obtención de resultados 3. Breve Descripción del Sistema ECH Tal como se indicó anteriormente el sistema ECH abarca las tareas desde la generación de la muestra hasta la tabulación de resultados; por lo que hace una integración total de las acciones. La generación de la muestra se hace a partir del marco de viviendas del Censo General de Población y Viviendas. Esta operación se encuentra programada atendiendo a las especificaciones definidas de diseño, tamaño, confiabilidad, etc., y se dispara automáticamente. Metodología para la integración de bases... 265 Resumidamente, el sistema se conecta con la base ORACLE, que contiene el marco del Censo (actualizado permanentemente por la Unidad de Cartografía), y de acuerdo con las especificaciones definidas, selecciona zonas censales dentro de las localidades participantes, y dentro de estas viviendas. En esta operación además se conecta con la base que contiene la muestra del año anterior, comparándola a efectos de que no exista duplicaciones. También calcula para cada vivienda su expansor mensual, anual y semestral, así como determina el mes y semana en que se debe relevar la misma. A partir de esa muestra se ubican espacialmente las viviendas a encuestar (esta tarea es la única manual ya que los directorios de edificios detallados con que cuenta el Instituto actualmente no están en soporte magnético2 ) y automáticamente se genera e imprime una etiqueta autoadhesiva (que se pega a cada cuestionario) con los datos de identificación desplegados y en código de barras que permitirá realizar el seguimiento particular de cada cuestionario, es decir que funcionarios realizaron las distintas etapas, en que fechas, situación del mismo, etc. La asignación de cuestionarios a distintas tareas y funcionarios, así como la administración de la encuesta ocupa poco tiempo gracias a la utilización del código de barras. La siguiente figura muestra las pantallas para tales tareas. 2 ya está el proyecto de digitación del directorio de edificios que surja del nuevo Censo. 266 Metodología para la integración de bases... pantalla: ADMINISTRACION MANTENIMIENTO El sistema cuenta con una serie de reportes administrativos que permiten conocer en tiempo real la marcha del trabajo, así como efectuar la consulta en particular de cualquier entrevista. La generación de cada uno de ellos puede realizarse para un período de tiempo en particular, así como para un área geográfica determinada. Metodología para la integración de bases... 267 pantalla: ADMINISTRACIÓN pantalla: ADMINISTRACIÓN LISTADOS LISTADOS LISTADOS LISTADOS Seleccione su listado 268 Metodología para la integración de bases... Estos reportes, se complementan con listados que detallan entrevista por entrevista, generados a través de la pantalla que muestra la figura siguiente. Por ejemplo con ellos se puede conocer el detalle de entrevistas que integra cada lote, etc. Pantalla: ADMINISTRACION LISTADOS ETAPAS Mediante la aplicación VER MUESTRA, se puede realizar un seguimiento de todas las entrevistas en todas sus etapas, para analizar tiempos de trabajo, re-salidas a campo, etc. Es muy utilizada para ubicar entrevistas que puedan haber quedado sin digitar por traspapelarse en un lote. Como los listados se pueden generar en excel y para un período en particular, el manejo resulta muy simple. Metodología para la integración de bases... Pantalla: ADMINISTRACION 269 LISTADOS VER MUESTRA Esta aplicación puede realizarse para una entrevista en particular, utilizando la opción CONSULTA del sub-menú ADMINISTRACIÖN. Una vez relevada la información, los cuestionarios son ingresados por un crítico-codificador mediante un programa inteligente que cuenta con un importante número (superior a 150) de reglas de consistencia (errores y alertas) que impide el ingreso de información con errores, omisiones, etc. Es muy importante aclarar que la ECH en Uruguay no permite la omisión en ninguna de sus preguntas por tanto no hay imputación alguna. En otro orden merece destacar, que el tiempo promedio de ingreso de toda la información de una persona es de 2 minutos y medio. En esta misma operación se codifica la información de rama de actividad, tipo de ocupación, área geográfica, y educación. A tales efectos se cuenta con una base de datos de alimentación continua que permite codificar automáticamente o en su defecto en forma asistida la información. Esta base de datos de codificadores no solo es utilizada por la ECH sino por todas las investigaciones que realiza el Instituto y necesiten codificar información de rama, ocupación, etc. Se debe destacar que esta base de datos cuenta con el nomenclator oficial de cada uno de los codificadores internacionales y de un diccionario (carteles o descripciones habituales) que se va incrementando permanentemente a través de la digitación de las descripciones anotadas por el encuestador, que quedan asociadas a los códigos asignados y controlados con el nomenclator oficial. Además también en esta operación se valora, con parámetros estándar (los que deben cargarse, a través de la opción valores, todos los meses antes del ingreso del primer cuestionario para garantizar su actualización), ingresos en especie y se generan variables agregadas, tales como condición de actividad de la persona, inserción laboral (subempleo, registrado en la seguridad social, etc.), nivel de educación, ingreso de la ocupación principal, ingreso del hogar, etc., etc. variables que quedan adosadas al registro de cada persona u hogar según corresponda. Algunas de las variables agregadas se presenta a continuación: a. variables agregadas en registro de hogar. ⇒ cantidad de hombres. ⇒ cantidad de mujeres. ⇒ cantidad de menores de 14 años. 270 ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ Metodología para la integración de bases... cantidad de mayores de 60 años. cantidad de ocupados. cantidad de desocupados. cantidad de desocupados propiamente dichos. cantidad de desocupados buscan trabajo primera vez. cantidad de inactivos. cantidad servicio doméstico. cantidad de personas sin servicio doméstico. cantidad de personas perceptores de ingresos. b. variables de ingresos agregadas en el registro de hogar. ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ingreso del hogar con valor locativo sin servicio doméstico. ingreso del servicio doméstico. valor locativo. valor del alquiler. ingreso del jefe de hogar. ingreso del cónyuge. ingreso otros miembros del hogar. c. variables de ingresos agregadas en el registro de personas. ⇒ ⇒ ⇒ ⇒ total de ingresos. total de ingresos por trabajo ingreso de la ocupación principal ingreso de otras ocupaciones d. determinación de la condición de actividad económica de la persona. e. determinación de grupos especiales de ocupados. f. determinación del nivel educativo de la persona Una vez ingresadas todas las encuestas de un período determinado, el sistema cuenta con un módulo de crítica que realiza una consistenciación global de la base de datos seleccionada, emitiendo los reportes respectivos. Este procedimiento se completa con una serie de controles que se encuentran programados en SPSS, es decir por fuera del sistema, para extremar las medidas de calidad de la información, que exige, si es necesario la vista particular de entrevistas que se alejen de determinados patrones. Aceptada la calidad de la base el sistema tiene programado un conjunto de cuadros que brinda la información, en planillas Excel, que de forma habitual difunde el Instituto sobre mercado de trabajo e ingresos familiares. La nómina de estos cuadros se presenta a continuación: 1. 2. 3. 4. 5. Tasa de actividad, empleo y desempleo, por sexo, según área geográfica. Distribución de la población ocupada, por sector de actividad, según área geográfica. Distribución de la población ocupada, por sector de actividad, según área geográfica. Promedio de horas trabajadas en la semana, por sector de actividad, según área geográfica. Población ocupada por cantidad de empleos (%) y número medio de empleos por persona ocupada, según área geográfica. Metodología para la integración de bases... 271 6. Contribución a la tasa de desempleo, por componentes, sexo, edad y relación con la jefatura del hogar, según área geográfica. 7. Tasa específica de desempleo por grupo de edades, sexo y relación con la jefatura del hogar, según área geográfica. 8. Distribución del desempleo, por sector de actividad, según área geográfica. 9. Estimaciones de algunas medidas descriptivas del ingreso (en pesos corrientes) y la población, según área geográfica. 10. Distribución porcentual de desocupados, según área geográfica. 11. Tasa de actividad, empleo y desempleo, e ingreso medio del hogar, según gran área geográfica. 12. Personas desocupadas por condiciones de empleo requeridas (en porcentaje) y duración media del desempleo, según área geográfica. 13. Ingreso promedio (en pesos uruguayos) de la ocupación principal por categoría de la ocupación, según área geográfica y sexo. 14. Ingreso promedio (en pesos uruguayos) de la ocupación principal por sector de actividad, según área geográfica y sexo. 15. Distribución de la población ocupada por nivel más alto de educación alcanzado, según área geográfica. Adicionalmente es posible la obtención de bases de microdatos para determinada área geográfica y período de tiempo, en formato Excel o DBF para trabajar en este último caso en SPSS y realizar todas las tablas a medida necesarias, en breves plazos. Pantalla: ADMINISTRACION LISTADOS GENERAR ARCHIVOS Como se puede ver en la figura anterior, la generación de bases de microdatos contempla el destino de la misma, INE o Terceros. La diferencia fundamental que presentan estas es sobre la identificación de 272 Metodología para la integración de bases... registros para salvaguardar el secreto estadístico, así como inclusión de carteles o algunas variables generadas con el solo fin de control interno. Como se desprende de lo anterior los usuarios tienen libre acceso a las bases de microdatos de la encuesta, lo que les permite realizar los cruces u obtener la información a su medida. Simplemente deben comprometerse a utilizarlas con los fines y en las condiciones que ellas permiten. La figura siguiente intenta ilustrar el sistema ECH: Base marco CPV ORACLE módulo de cuadros XLS Base de Datos ECH ORACLE interfaz del usuario VISUAL FOX PRO Base de Datos CODIFICADORES nomenclator oficial tabla de carteles ORACLE OTRAS ENCUESTAS archivos EXCEL archivos DBF Tablas SPSS cuadros finales EXCEL