117 INFORME TÉCNICO DEL DISEÑO DE LA MUESTRA MAESTRA DE HOGARES FERNANDO RIVERO Y FERNANDO MOLLINEDO INSTITUTO NACIONAL DE ESTADÍSTICA (INE) BOLIVIA 118 Informe técnico del diseño de la muestra maestra... ÍNDICE Página 1.- Introducción y Objetivos de la Muestra Maestra ................................................................. 119 2.- Actividades a Desarrollarse.................................................................................................. 119 3.- ¿Qué es una Muestra Maestra (MM) para Bolivia? ............................................................. 119 4.- ¿Por Qué una MM? .............................................................................................................. 120 5.- Construcción de la Muestra Maestra.................................................................................... 120 6.- Tipo de Muestreo ................................................................................................................. 121 7.- Tareas para la Muestra Maestra ........................................................................................... 121 8.- Las Unidades Primarias de Muestreo (UPMs)..................................................................... 122 9.- Selección de las UPM’s ....................................................................................................... 122 10.- Construcción de Estratos...................................................................................................... 122 11. El Tamaño de la MM ........................................................................................................... 123 12. El Marco para la Muestra Maestra ....................................................................................... 123 13.- Afijación de las UPMs ......................................................................................................... 123 14. Actualización de la Muestra Maestra ................................................................................... 124 15. Selección de una Nueva Muestra Maestra ........................................................................... 124 16. Estimación y Factores de Expansión.................................................................................... 124 17. Muestras de Rotación, Paneles............................................................................................. 125 18. Selección de las Muestras y Asignación a Paneles .............................................................. 126 19. Unidades de Observación que no Permanecen en la Muestra.............................................. 127 Informe técnico del diseño de la muestra maestra... 119 UNA MUESTRA MAESTRA PARA BOLIVIA 1. Introducción y objetivo de la Muestra Maestra El Instituto Nacional de Estadística de Bolivia (INE) ha realizado un Censo de Población y Vivienda en Septiembre de 2001. A partir de la información recolectada por este censo se pretende construir una Muestra Maestra para todas las encuestas de hogares que el INE tiene previsto realizar. Objetivo Principal El Objetivo principal es proponer una metodología para la construcción de la Muestra Maestra, que sirva de marco para todas las encuestas de hogares que tiene previsto realizar el INE en los próximos 10 años, dividido en dos partes de 5 años cada uno, teniendo como insumo principal la información cartográfica y la base de datos del Censo de Población y Vivienda de 2001. 2. Actividades a Desarrollarse Definido el objetivo principal, se plantea las siguientes actividades: a. Desarrollar la metodología para la construcción de la Muestra Maestra. b. Preparar y construir el Marco Muestral para la selección de dicha muestra. c. Conformar la metodología de estimación para las encuestas continuas bajo un esquema de rotación de muestras que sea sostenible en el tiempo. d. Proponer formas de actualización de la Muestra Maestra, en relación a las áreas de nueva creación de viviendas. 3. ¿Qué es una Muestra Maestra (MM) para Bolivia? Una Muestra Maestra en términos generales es: definir un tamaño de muestra, plantear un tipo de muestreo, una forma de selección y finalmente definir una metodología de estimación de parámetros y de sus varianzas, a partir de seleccionar una muestra de la cual se obtienen sub muestras para cada una de las encuestas a realizarse, durante un periodo de tiempo. Por tanto no se seleccionan muestras independientes para cada encuesta, como se hace cotidianamente, cuando no se tiene una muestra maestra. La Muestra Maestra de Bolivia, es una muestra de Unidades Primarias de Muestreo (UPMs), donde las UPMs son áreas geográficas que contienen entre 150 y 300 viviendas ocupadas. La división de las áreas geográficas, respetan los límites de las divisiones político administrativo del país y los límites censales de sector y segmento. Además, es importante definir dicha delimitación en base a las Organizaciones Comunitarias que tiene el área rural dispersa y que en su mayoría son reconocidas como tal por los pobladores del área para evitar problemas de mala delimitación. Las UPMs estarán constituidas por una Organización Comunitaria, un grupo de organizaciones comunitarias o de una parte de ella. En el área urbana, una posibilidad es el Sector Censal que es una agrupación de manzanos y que contiene en su interior en promedio 120 viviendas. El tamaño de la UPM, está en función a la cantidad de encuestas que el INE tiene planificado ejecutar el los próximos cinco años, y del diseño de la muestra planteado. Definidas y seleccionadas las Unidades Primarias de Muestreo de la MM, se seleccionarán las Unidades Secundarias de Muestreo (USMs) que en nuestro caso serán segmentos censales, manzanos o directamente viviendas. En cada UPM seleccionada de la Muestra Maestra, se efectuará un listado de una parte de la misma, para contar con un dato actualizado en el momento del operativo de la encuesta. Donde este listado viene de la 120 Informe técnico del diseño de la muestra maestra... aplicación del Formulario 1, implementado en el censo 2001, donde se recoge información del jefe de hogar. Para la selección de USMs se pueden aplicar criterios de estratificación diferentes a los de las UPMs; por ejemplo el nivel socio-económico (pobreza). En esta selección, es recomendable introducir un período de descanso para los hogares que participaron ya en una encuesta. 4. ¿Por qué una MM? Una Muestra Maestra concentra la preparación de muestras y el trabajo de campo en un número limitado de UPMs. La ventaja más importante, es la reducción de costos, el reconocimiento permanente del área muestreada y la reducción de los listados de actualización. Las mismas UPMs (o una parte de ellas) se usan para todas las encuestas y un listado se puede normalmente considerar actual por un año aproximadamente. Otra ventaja es la reducción del trabajo de muestreo. En vez de un marco de todos los sectores y segmentos del Censo, basta un marco de las UPMs en la muestra. Otra ventaja es la correlación de la información de varias encuestas lo que facilita la complementariedad de temas de investigación evitando la duplicidad de esfuerzos. El número de viviendas ocupadas en Bolivia, es de 2.2 millones; la Muestra Maestra propone seleccionar alrededor de 125.000 viviendas, que hacen aproximadamente una cantidad de 1.200 UPM’s, para 5 años de trabajo de encuestas, esta muestra es suficiente para cubrir todas las encuestas que el INE tiene planificado realizar. La desagregación de la Muestra Maestra se describe en el siguiente cuadro: Distribución de la Muestra Maestra (viviendas) Año 2002 Año 2003 Año 2004 15.000 50.000 20.000 Año 2005 20.000 Año 2006 20.000 Total 125.000 Para el año 2003, la muestra es 50.000 viviendas, ya que se tiene prevista una Encuesta de Mortalidad Materna introducida en la Encuesta Nacional de Demografía y Salud (ENDSA), con desagregaciones a nivel departamental. Una desventaja eventual es que la MM es una muestra general. Ella no puede ser óptima en cada encuesta, particularmente se precisará una estratificación especial. Pero la MM es muy flexible, y se adapta a exigencias diversas. Para el cálculo de los estimadores, se plantea introducir estimadores de regresión, que usa información auxiliar o adicional de las mismas UPMs, a partir de la información censal. Si bien los estimadores de regresión no son estimadores insesgados, generalmente estos estimadores presentan una precisión muy elevada que otros estimadores por la utilización de la información auxiliar. 5. Construcción de la Muestra Maestra Insumos - La cartografía de la Actualización del Censo del 2001, corregida con los datos censales finales. - La base de datos Censal desagregados tanto a nivel de vivienda como de población, para luego hacer las agrupaciones pertinentes para la construcción de UPMs . Informe técnico del diseño de la muestra maestra... 121 Para la construcción de las UPM’s, todas las operaciones son realizadas en base a la información proveniente del Censo, específicamente la información de las viviendas y de la población en cada una de ellas. La información de la Actualización Cartográfica del Censo es la información que permite fijar los límites geográficos de las UPM’s en términos de la cantidad de viviendas ocupadas que tiene cada una de ellas. También permite medir posibles cambios entre la actualización y el censo. 6. Tipo de Muestreo Se tiene previsto un diseño de muestra de tipo trietápico para la Muestra Maestra. Es decir que: Las Unidades de Primera Etapa (UPM’s), en su generalidad, son las Organizaciones Comunitarias para el área rural dispersa, sin embargo en algunos casos se deben realizar agregaciones o particiones respetando límites de cantón, sector y segmento censal para contar con cierto número de viviendas en cada UPM . Los manzanos establecidos en un sector censal, son las UPM’s para el área urbana, de igual forma, será importante contar con cierta cantidad de viviendas que respondan a los requerimientos de la Muestra Maestra. La selección de dichas UPM’s están en base a la probabilidad proporcional al tamaño de viviendas que cuente. Las Unidades de Segunda Etapa serán los segmentos censales para el área dispersa y el manzano para el área urbana. Su selección está en base a un muestreo aleatorio simple con igual probabilidad ya que presentan una estandarización en el número de viviendas que tiene. Y finalmente las Unidades Ultimas de Muestreo son las viviendas con ocupantes presentes. Su selección es sistemática con arranque aleatorio. La definición del número optimo de viviendas por UPM se obtendrá una vez consolidada la base censal y la construcción del marco muestral. Donde se precisarán la cantidad de UPM’s y la cantidad de viviendas a encuestarse en cada UPM, distribuidas en todo el país de acuerdo a los resultados del análisis de correlación intraclásico que se haga. 7. Tareas para la Muestra Maestra La MM debe servir para las siguientes encuestas y otras que se actualizarán. El detalle viene en el siguiente cuadro: Año Encuesta 2002 2003- Encuesta de Hogar MECOVI Departamento, Urbana/rural, Ampliada (con modulo empleo) 3 pisos ecológicos Demografía y Salud (ENDSA) Departamento, Urbana/rural, 3 pisos 30.000 ecológicos, 5 niveles de pobreza - Encuesta de Hogares MECOVI Urbana/rural, 3 pisos ecológicos 6.000 2004- - Encuesta de Hogares MECOVI Urbana/rural, 3 pisos ecológicos 6.000 2005 - Encuesta de Hogares MECOVI Urbana/rural, 3 pisos ecológicos 6.000 2006 - Encuesta de Hogares MECOVI Urbana/rural, 3 pisos ecológicos 6.000 2002 Desagregación de los resultados Número previsto de viviendas 12.000 Estas son las encuestas planificadas para los próximos 5 años, y para este número de encuestas se tiene una muestra de 125.000 viviendas aproximadamente. 122 Informe técnico del diseño de la muestra maestra... De haber otros requerimiento como las encuestas municipales, podrían determinar un tamaño distinto para la MM. 8. Las Unidades Primarias de Muestreo (UPMs) En general, las unidades primarias de muestreo deben reflejar la variación en cada estrato (de las variables de las encuestas). La agrupación de las UPM’s deben contener correlaciones intraclásicas pequeñas que pueda aumentar la precisión de las estimaciones. Es por ese motivo, se hace una diferenciación entre áreas geográficas, tomando como delimitaciones en el área urbana los Sectores Censales y las Organización Comunitarias para el área dispersa. También permitirá identificar las UPM’s fácilmente en el terreno, y que además formen áreas conectadas preferiblemente compactas, para optimizar el uso de los recursos económicos y otras actividades relacionadas al trabajo del campo. 9. Selección de las UPM’s La selección en la primera etapa es proporcional al tamaño de viviendas que tenga (ppt), como anteriormente se había dicho. Las UPM’s conformadas en el marco de muestreo tienden a ser Organizaciones Comunitarias en su mayoría lo que genera una dispersión en la cantidad de viviendas entre 150 y 300. En algunos casos, las UPM’s están constituidas por un grupo de Organizaciones Comunitarias que juntas hacen entre el rango de viviendas establecido anteriormente y lo mismo si se trata de una organización comunitaria demasiado grande a la cual se la debe dividir por el mismo concepto. En el caso de una división, es importante respetar los límites de cantón, sector y segmento censal. 10. Construcción de Estratos Los estratos para la MM deben seleccionarse considerando, en parte, las desagregaciones deseadas en las encuestas. Es preferible crear estratos correspondientes a las subdivisiones geográficas del país. Para Bolivia las estratificaciones mas importantes son: Area Urbano y Rural. Regional Altiplano Valle y Llano. Departamentos Las desagregaciones anteriores también son utilizadas como Dominios de Estudio. Otras posibilidades de estratificación se debe a la desagregación de población : Ciudades capitales Otras ciudades con 10.000 habitantes o más Ciudades con 2.000 a 10.000 habitantes Ciudades y aglomeraciones con 250 - 2.000 habitantes Otras áreas denominadas áreas dispersas. Los tres primeros estratos son considerados urbanos, los otros rurales. También se puede estratificar por categorías de pobreza u otros indicadores socio-económicos, para lo cual se estudiará la posibilidad de emplear los métodos univariados de Dalenius y Hodges o para métodos multivariados mediante Cluster Análisis. Informe técnico del diseño de la muestra maestra... 123 11. El tamaño de la MM El tamaño de la Muestra Maestra, está en relación con las encuestas que el INE tiene previsto ejecutar en los próximos cinco años. En base a esto, se ha fijado una muestra de 125.000 viviendas ocupadas. Si se plantea una cantidad de 50 a 60 viviendas por unidad primaria de muestreo (USM), se tendrá aproximadamente un total de 2.500 UPM’s. Una alternativa a definir, es el cupo de encuestas por USM, que puede establecerse entre 8 a 10 viviendas en el área amanzanada, y 12 a 16 viviendas en el área dispersa. Esto dependerá de cuán dispersa se quiere la muestra o cuán agregada debe ser. Esto está también en función de costos y tiempo. 12. El Marco para la Muestra Maestra El Censo del 2001 proporciona datos a nivel: Departamento Provincia Sección municipal Cantón Localidad Organización Comunitaria Zona Sector Segmento Manzano Descripción de área urbano / rural. Tipo de vivienda Número de personas por vivienda A partir de esta información se construirá el Marco Muestral para las encuestas de hogares y para la selección de la Muestra Maestra. La descripción de la Unidades de Muestreo que ya han sido mencionadas anteriormente, serán incorporadas en el marco elaborado. De igual manera, las UPM’s serán incorparadas en la cartografía. A la fecha, el trabajo de la delimitación de UPM’s está en plena ejecución. Cabe mencionar que para producir este marco, se precisan datos definitivos del censo de todos los sectores y segmentos censales, con sus correspondientes identificadores, número de viviendas y los mapas ya consolidados que compatibilicen entre la cartográfica y la base de datos censal. La lista de las Unidades de Muestreo con la descripción de estratos y el número de viviendas en cada uno, forman el Marco Muestral para la selección de la Muestra Maestra. 13. Afijación de las UPMs Se propone un método de afijación potencial, con un número de UPMs en cada estrato proporcional a Mhα, donde Mh = el número de viviendas en el estrato h, y α es un parámetro a seleccionar – con α = 0.5. Este método ha sido implementado en varias encuestas de hogares en el país, con resultados satisfactorios. 124 Informe técnico del diseño de la muestra maestra... La afijación potencial aumenta el tamaño de la muestra en los estratos con pocas viviendas, lo que produce buenas estimaciones en los estratos pequeños sin perder la precisión en los estratos grandes. Sin embargo no está demás discutir otro método de afijación que mejore las estimaciones. 14. Actualización de la Muestra Maestra Para la actualización de la Muestra Maestra, se empleará el método de listado de actualización de las Unidades de Segunda Etapa seleccionadas en primera instancia, hasta que esta sea agotada con las primeras encuestas. Posteriormente se seleccionará una nueva USM y así sucesivamente hasta tener cubierta toda la UPM seleccionada y que su actualización sea total. Los listados de las UPMs darán nuevos totales de viviendas. Los nuevos resultados se anotan en el registro y se usan para recalcular los factores de expansión. El uso de listados en una MM no es diferente a una muestra tradicional. 15. Selección de una Nueva Muestra Maestra La primera Muestra Maestra no se incluye para la selección de una segunda, en esta situación se crea una nueva Muestra Maestra independiente de la primera, y esta se basa en una actualización del total del marco muestral. Para esto se utilizan los listados y resultados de la primera muestra y la posibilidad de realizar una nueva actualización cartográfica. En el caso de no poder lograr una nueva actualización cartográfica, se propone actualizar solamente las zonas de crecimiento, especialmente del área urbana. Esto dependerá de los recursos económicos disponibles para levantar un trabajo operativo de actualización. 16. Estimación y Factores de Expansión La estimación en una encuesta que utiliza una Muestra Maestra es similar a las estimaciones de otras encuestas, donde los factores de expansión requieren de una atención especial. Un total T se estima por Tˆ = ∑hji whji x hji donde xhji = valor observado en el hogar i (o la persona i) en la UPM j del estrato h whji = factor de expansión de la observación i en la UPM j del estrato h (ver abajo), y la suma se extiende sobre los estratos h relevantes, incluyendo todas las UPMs y todos los hogares (personas) en estos estratos. El promedio se obtiene en la manera usual, dividiendo con N̂ = Σ whji. La tasas se obtienen como promedios, con xhji = 0 o 1. En el cálculo de la varianza de un promedio o una tasa, el estimador es una razón de dos cantidades aleatorias, ya que el numerador N̂ es un estimador también. La fórmula para la varianza aproximada de una razón Rˆ = Tˆ / Nˆ es Var ( Rˆ ) = Var (Tˆ ) + Rˆ 2Var ( Nˆ ) − 2 Rˆ Cov(Tˆ , Nˆ ) Informe técnico del diseño de la muestra maestra... Definiendo x hj + = ∑ nhj i =1 125 whji x hji , la varianza de Tˆ = ∑hji whji x hji se puede estimar con [ n H n n Var (Tˆ ) = ∑h =1 h ∑ jh=1 x hj2 + − (∑ jh=1 x hj + ) 2 / n h nh − 1 ] donde H = el número de estratos, y nh = el número de UPMs seleccionadas en el estrato h. La covarianza se estima de una manera análoga: [ n H n n n Cov(Tˆ , Yˆ ) = ∑h =1 h ∑ jh=1 x hj + y hj + − (∑ j h=1 x hj + )(∑ jh=1 y hj + ) / nh nh − 1 ] donde “y” es otra variable, Yˆ es el total estimado y y hj + se define como x hj + . Las estimaciones y varianzas pueden ser calculadas mediante los programas Pccarp, Cluster o Stata. Si la selección de USMs es aleatoria, el factor de expansión es whji (F1) N hj' Nh , = n h N hj nhj donde Nh = número de viviendas en el estrato h nh = número de UPMs seleccionadas (con ppt) en el estrato h Nhj = número de viviendas en la UPM j del estrato h si fue seleccionada la UPM N'hj = número de viviendas al último listado en la UPM j del estrato h nhj = número de viviendas seleccionadas para la muestra en la UPM j del estrato h En el factor de expansión se puede incluir también: o Una corrección de no-respuesta - a menudo el factor nhj/n*hj, donde n*hj es el número de respuestas obtenidas o Una corrección, o calibración, para el cambio (crecimiento) en la población total de viviendas en el estrato - usando el factor N*h/Nh, donde N*h es la población total estimada o proyectada al tiempo de la encuesta En el área dispersa, donde se trabaja con segmentos (componentes), basta utilizar Nhj y N'hj como poblaciones del segmento. Si la UPM es seleccionada (con PPT) en un estrato, en la actualización de la MM, todos los factores de expansión en el estrato cambian. La fórmula (F1) se aplica, con nh igual a todas las UPMs seleccionadas (entonces, nh nuevo = nh viejo + b). 17. Muestras con Rotación, Paneles Una posibilidad para muestras con rotación son usadas cuando una encuesta se repite cada año (o cada trimestre, cada mes) y cuando hay un interés particular de estimar los cambios entre las encuestas. Cada vivienda permanece en la muestra un determinado número de rondas, sea 2, 3, 4 o más. Una fracción de la 126 Informe técnico del diseño de la muestra maestra... muestra sale cada vez y el mismo número de viviendas entran. La fracción corresponde al número de rondas de permanencia - con dos rondas de permanencia, ½ de la muestra sale cada vez, con 3 rondas, 1/3 sale etc. La tasa de rotación en estos casos es 50%, 33%, etc. En la situación de las encuestas de hogares en Bolivia, sería más natural realizar la rotación al nivel de las UPMs. En cada ronda, saldría un grupo de UPMs de la muestra, y otro grupo entraría. En cada UPM, las viviendas participantes son las mismas durante todo el período que la UPM permanece en la muestra. Un grupo de UPMs, y las viviendas seleccionadas en aquellas, que permanecen durante las mismas rondas se puede llamar un panel. Por ejemplo, con una tasa de rotación de 25 % (o sea 4 rondas de participación), se puede representar las muestras de las primeras 5 rondas así: Muestra de la primera ronda P1 P2 P3 P4 Muestra de la segunda ronda P2 P3 P4 P5 (el panel P1 sale, y P5 entra) Muestra de la tercera ronda P3 P4 P5 P6 (el panel P2 sale, y P6 entra) Muestra de la cuarta ronda P4 P5 P6 P7 Muestra de la quinta ronda P5 P6 P7 P8 (aquí, no queda ningún panel de la primera ronda) Como un caso extremo, es posible trabajar con una encuesta de un panel fijo, con una tasa de rotación de 0 %. No es recomendable para encuestas de hogares, porque un panel fijo pierde muy rápidamente la representatividad. Las ventajas más importantes de las muestras de rotación son: a) Posibilidades de estimar cambios (entre rondas de la encuesta) con mayor precisión b) Reducción del trabajo del campo, ya sea en listados, o en buscar los hogares o en solicitar las respuestas - las personas que participan conocen las preguntas (y los encuestadores) desde la primera vez c) La boleta o el número de preguntas de la segunda ronda y rondas posteriores puede ser reducida Algunas desventajas son: a) La estimación de agregados (por ejemplo un promedio o un total anual) es menos precisa b) Los participantes se cansan y no permanecen en la muestra todo el tiempo previsto, lo que significa que se pierde una parte de las ventajas c) Deben ser establecidos procedimientos para salidas no planificadas de la muestra, así como para entradas en la muestra El parámetro más importante a determinar es la fracción de rotación, o el número de rondas de participación de cada hogar. Hay dos consideraciones contrarias. Una es la importancia de las estimaciones de cambio versus las de niveles - si los cambios son muy importantes, una gran parte de los hogares deben permanecer en la muestra, es decir cada hogar debe participar muchas veces. Otra es la atención a los hogares, y el riesgo de perder hogares en entrevistas repetidas. Esto resulta en un número bajo de rondas de participación. 18. Selección de las muestras y asignación a paneles La primera muestra se selecciona como cualquier muestra. Normalmente se selecciona las UPMs con ppt (viviendas). Si hay una MM, y si precisa una selección de la misma, esta selección debe ser sistemática o Informe técnico del diseño de la muestra maestra... 127 aleatoria. Asumiendo que queremos una tasa de rotación de 25 %, la muestra debe ser dividida en cuatro paneles. Por eso, cada UPM seleccionada será asignada a uno de los paneles P1,..., P4. Esto se realiza con una lista de las UPMs seleccionadas en orden de los estratos. Empezando con un panel aleatorio (por ejemplo P3), la primera UPM de la lista es asignada a P3, la segunda UPM a P4, la tercera a P1, etc. En un estrato nuevo, se continúa con la secuencia. El número del panel debe ser incluido en la lista de las UPMs de la muestra. Para la selección de la segunda muestra, precisa sólo el panel P5, que debe sustituir al panel P1. Los otros paneles, con todas las UPMs y viviendas que contengan, permanecen en la muestra. El número de UPMs en P5 y la distribución por estratos es completamente determinado por P1. Basta seleccionar el mismo número de UPMs, en los mismos estratos. Si hay una MM, las UPMs se seleccionan de la MM como antes. Si no hay una MM, la selección debe ser con ppt. Se propone que la reselección de una UPM que sale con P1, sea permisible inmediatamente, mas que las viviendas a seleccionar en la UPM puedan gozar de un período de descanso de 2 años. Por lo contrario, no se permite que una UPM entre en dos o más paneles que son usados simultáneamente. Entonces, en la selección de P5, las UPMs de P2-P4 no son permisibles. En una encuesta trimestral, será conveniente seleccionar todos los paneles necesarios durante un año, a decir cuatro paneles, simultáneamente en una sola operación. En este caso se propone que todas las UPMs seleccionadas sean diferentes (sin reposición). Con esta regla, la reselección de una UPM será posible solo después de un año. 19. Unidades de observación que no permanecen en la muestra Por varias razones, hogares y personas no permanecerán en la muestra por todo el período previsto. Sin experiencia de la probable frecuencia, es necesario seguir el desenvolvimiento con mucha atención, particularmente en la segunda ronda de la encuesta. En principio, se prefiere trabajar sin substituciones. Si el problema es muy grande, precisa entonces pensar en términos de un aumento de la muestra bruta (o posiblemente todavía una substitución). Si un hogar transfiere a otro lugar, o a cualquier vivienda no incluida en la muestra, se propone no seguir más este hogar. Por lo contrario, si un nuevo hogar entrara en una vivienda de la muestra, se propone que ello sea incluido en la muestra. Se debe evaluar el efecto de esta regla después de la segunda y tercera ronda, para decidir definitivamente si se quiere o no conservarla. El efecto de una muestra de rotación es reducir el error estándar de diferencias, dado que se crea una correlación entre los valores de dos años. Los promedios de dos o tres años pueden ser indicadores interesantes para desagregación en áreas como los departamentos, donde el número de observaciones en un año no es suficiente para estimaciones con precisión deseada. Estos promedios sufren de la muestra de rotación, en cuanto aumenta el error estándar. Se nota que es necesario hacer suposiciones del tamaño de las correlaciones ρ1 y ρ2 para las variables diferentes. No hay ninguna información, pero es probable que sean altas, y en los cálculos son supuestos valores de 0,8 - 0,95 para ρ1 y 0,6 - 0,9 para ρ2. Se nota que el error estándar para la diferencia de dos rondas consecutivas es siempre igual al error en una ronda, multiplicado por (2 − 2 β 1 ρ 1 ) . Si tr = la tasa de rotación, β1 = 1 - tr, y β1 es la proporción de la muestra que permanece en las dos rondas consecutivas. (Además, tr = 100% (o β1 = 0) corresponde al caso de muestras independientes, todos los hogares salen de la muestra después de una ronda.) Es interesante estudiar la tasa de reducción del error estándar en relación al caso de muestras independientes. Si D denota el error estándar, esta tasa es 128 Informe técnico del diseño de la muestra maestra... Dcon rot (t i +1 − t i ) Dsin rot (t i +1 − t i ) = Var (t ) (2 − 2 β 1 ρ 1 ) Var (t ) 2 = 1 − β 1 ρ1 . El error estándar de una diferencia, con muestras de rotación, es 60 - 70 % del error para muestras independientes. Si la correlación ρ1 es muy alta, la diferencia de tasas diferentes es importante. Por el contrario, cuando se consideran promedios de dos o tres años, se pierde de precisión con muestras de rotación. La razón de los errores estándar Var (t ) (1 + β 1 ρ 1 ) / 2 Dconrot ((t i +1 + t i ) / 2) = = 1 + β 1 ρ1 Dsin rot ((t i +1 + t i ) / 2) Var (t ) / 2 Si el error estándar aumenta de 20 a 30 %. Las alternativas (combinaciones de Tasa y ρ1) no son muy diferentes. Para un promedio de tres años, precisan dos correlaciones. La razón relevante es (3 + 4 β 1 ρ1 + 2 β 2 ρ 2 ) / 9 / 1 / 3 .