informe técnico del diseño de la muestra maestra de hogares

Anuncio
117
INFORME TÉCNICO DEL DISEÑO DE LA MUESTRA
MAESTRA DE HOGARES
FERNANDO RIVERO Y FERNANDO MOLLINEDO
INSTITUTO NACIONAL DE ESTADÍSTICA (INE)
BOLIVIA
118
Informe técnico del diseño de la muestra maestra...
ÍNDICE
Página
1.-
Introducción y Objetivos de la Muestra Maestra ................................................................. 119
2.-
Actividades a Desarrollarse.................................................................................................. 119
3.-
¿Qué es una Muestra Maestra (MM) para Bolivia? ............................................................. 119
4.-
¿Por Qué una MM? .............................................................................................................. 120
5.-
Construcción de la Muestra Maestra.................................................................................... 120
6.-
Tipo de Muestreo ................................................................................................................. 121
7.-
Tareas para la Muestra Maestra ........................................................................................... 121
8.-
Las Unidades Primarias de Muestreo (UPMs)..................................................................... 122
9.-
Selección de las UPM’s ....................................................................................................... 122
10.-
Construcción de Estratos...................................................................................................... 122
11.
El Tamaño de la MM ........................................................................................................... 123
12.
El Marco para la Muestra Maestra ....................................................................................... 123
13.-
Afijación de las UPMs ......................................................................................................... 123
14.
Actualización de la Muestra Maestra ................................................................................... 124
15.
Selección de una Nueva Muestra Maestra ........................................................................... 124
16.
Estimación y Factores de Expansión.................................................................................... 124
17.
Muestras de Rotación, Paneles............................................................................................. 125
18.
Selección de las Muestras y Asignación a Paneles .............................................................. 126
19.
Unidades de Observación que no Permanecen en la Muestra.............................................. 127
Informe técnico del diseño de la muestra maestra...
119
UNA MUESTRA MAESTRA PARA BOLIVIA
1.
Introducción y objetivo de la Muestra Maestra
El Instituto Nacional de Estadística de Bolivia (INE) ha realizado un Censo de Población y Vivienda en
Septiembre de 2001. A partir de la información recolectada por este censo se pretende construir una
Muestra Maestra para todas las encuestas de hogares que el INE tiene previsto realizar.
Objetivo Principal
El Objetivo principal es proponer una metodología para la construcción de la Muestra Maestra, que sirva
de marco para todas las encuestas de hogares que tiene previsto realizar el INE en los próximos 10 años,
dividido en dos partes de 5 años cada uno, teniendo como insumo principal la información cartográfica y
la base de datos del Censo de Población y Vivienda de 2001.
2.
Actividades a Desarrollarse
Definido el objetivo principal, se plantea las siguientes actividades:
a.
Desarrollar la metodología para la construcción de la Muestra Maestra.
b.
Preparar y construir el Marco Muestral para la selección de dicha muestra.
c.
Conformar la metodología de estimación para las encuestas continuas bajo un esquema de rotación
de muestras que sea sostenible en el tiempo.
d.
Proponer formas de actualización de la Muestra Maestra, en relación a las áreas de nueva creación
de viviendas.
3.
¿Qué es una Muestra Maestra (MM) para Bolivia?
Una Muestra Maestra en términos generales es: definir un tamaño de muestra, plantear un tipo de
muestreo, una forma de selección y finalmente definir una metodología de estimación de parámetros y de
sus varianzas, a partir de seleccionar una muestra de la cual se obtienen sub muestras para cada una de las
encuestas a realizarse, durante un periodo de tiempo.
Por tanto no se seleccionan muestras independientes para cada encuesta, como se hace cotidianamente,
cuando no se tiene una muestra maestra.
La Muestra Maestra de Bolivia, es una muestra de Unidades Primarias de Muestreo (UPMs), donde las
UPMs son áreas geográficas que contienen entre 150 y 300 viviendas ocupadas. La división de las áreas
geográficas, respetan los límites de las divisiones político administrativo del país y los límites censales de
sector y segmento. Además, es importante definir dicha delimitación en base a las Organizaciones
Comunitarias que tiene el área rural dispersa y que en su mayoría son reconocidas como tal por los
pobladores del área para evitar problemas de mala delimitación. Las UPMs estarán constituidas por una
Organización Comunitaria, un grupo de organizaciones comunitarias o de una parte de ella. En el área
urbana, una posibilidad es el Sector Censal que es una agrupación de manzanos y que contiene en su
interior en promedio 120 viviendas. El tamaño de la UPM, está en función a la cantidad de encuestas que
el INE tiene planificado ejecutar el los próximos cinco años, y del diseño de la muestra planteado.
Definidas y seleccionadas las Unidades Primarias de Muestreo de la MM, se seleccionarán las Unidades
Secundarias de Muestreo (USMs) que en nuestro caso serán segmentos censales, manzanos o
directamente viviendas.
En cada UPM seleccionada de la Muestra Maestra, se efectuará un listado de una parte de la misma, para
contar con un dato actualizado en el momento del operativo de la encuesta. Donde este listado viene de la
120
Informe técnico del diseño de la muestra maestra...
aplicación del Formulario 1, implementado en el censo 2001, donde se recoge información del jefe de
hogar.
Para la selección de USMs se pueden aplicar criterios de estratificación diferentes a los de las UPMs; por
ejemplo el nivel socio-económico (pobreza). En esta selección, es recomendable introducir un período de
descanso para los hogares que participaron ya en una encuesta.
4.
¿Por qué una MM?
Una Muestra Maestra concentra la preparación de muestras y el trabajo de campo en un número limitado
de UPMs. La ventaja más importante, es la reducción de costos, el reconocimiento permanente del área
muestreada y la reducción de los listados de actualización. Las mismas UPMs (o una parte de ellas) se
usan para todas las encuestas y un listado se puede normalmente considerar actual por un año
aproximadamente.
Otra ventaja es la reducción del trabajo de muestreo. En vez de un marco de todos los sectores y
segmentos del Censo, basta un marco de las UPMs en la muestra.
Otra ventaja es la correlación de la información de varias encuestas lo que facilita la complementariedad
de temas de investigación evitando la duplicidad de esfuerzos.
El número de viviendas ocupadas en Bolivia, es de 2.2 millones; la Muestra Maestra propone seleccionar
alrededor de 125.000 viviendas, que hacen aproximadamente una cantidad de 1.200 UPM’s, para 5 años
de trabajo de encuestas, esta muestra es suficiente para cubrir todas las encuestas que el INE tiene
planificado realizar.
La desagregación de la Muestra Maestra se describe en el siguiente cuadro:
Distribución de la Muestra Maestra (viviendas)
Año 2002
Año 2003
Año 2004
15.000
50.000
20.000
Año 2005
20.000
Año 2006
20.000
Total
125.000
Para el año 2003, la muestra es 50.000 viviendas, ya que se tiene prevista una Encuesta de Mortalidad
Materna introducida en la Encuesta Nacional de Demografía y Salud (ENDSA), con desagregaciones a
nivel departamental.
Una desventaja eventual es que la MM es una muestra general. Ella no puede ser óptima en cada
encuesta, particularmente se precisará una estratificación especial. Pero la MM es muy flexible, y se
adapta a exigencias diversas.
Para el cálculo de los estimadores, se plantea introducir estimadores de regresión, que usa información
auxiliar o adicional de las mismas UPMs, a partir de la información censal.
Si bien los estimadores de regresión no son estimadores insesgados, generalmente estos estimadores
presentan una precisión muy elevada que otros estimadores por la utilización de la información auxiliar.
5.
Construcción de la Muestra Maestra
Insumos
-
La cartografía de la Actualización del Censo del 2001, corregida con los datos censales finales.
-
La base de datos Censal desagregados tanto a nivel de vivienda como de población, para luego hacer
las agrupaciones pertinentes para la construcción de UPMs .
Informe técnico del diseño de la muestra maestra...
121
Para la construcción de las UPM’s, todas las operaciones son realizadas en base a la información
proveniente del Censo, específicamente la información de las viviendas y de la población en cada una de
ellas.
La información de la Actualización Cartográfica del Censo es la información que permite fijar los límites
geográficos de las UPM’s en términos de la cantidad de viviendas ocupadas que tiene cada una de ellas.
También permite medir posibles cambios entre la actualización y el censo.
6.
Tipo de Muestreo
Se tiene previsto un diseño de muestra de tipo trietápico para la Muestra Maestra. Es decir que:
Las Unidades de Primera Etapa (UPM’s), en su generalidad, son las Organizaciones Comunitarias para el
área rural dispersa, sin embargo en algunos casos se deben realizar agregaciones o particiones respetando
límites de cantón, sector y segmento censal para contar con cierto número de viviendas en cada UPM .
Los manzanos establecidos en un sector censal, son las UPM’s para el área urbana, de igual forma, será
importante contar con cierta cantidad de viviendas que respondan a los requerimientos de la Muestra
Maestra. La selección de dichas UPM’s están en base a la probabilidad proporcional al tamaño de
viviendas que cuente.
Las Unidades de Segunda Etapa serán los segmentos censales para el área dispersa y el manzano para el
área urbana. Su selección está en base a un muestreo aleatorio simple con igual probabilidad ya que
presentan una estandarización en el número de viviendas que tiene.
Y finalmente las Unidades Ultimas de Muestreo son las viviendas con ocupantes presentes. Su selección
es sistemática con arranque aleatorio.
La definición del número optimo de viviendas por UPM se obtendrá una vez consolidada la base censal y
la construcción del marco muestral. Donde se precisarán la cantidad de UPM’s y la cantidad de viviendas
a encuestarse en cada UPM, distribuidas en todo el país de acuerdo a los resultados del análisis de
correlación intraclásico que se haga.
7.
Tareas para la Muestra Maestra
La MM debe servir para las siguientes encuestas y otras que se actualizarán. El detalle viene en el
siguiente cuadro:
Año
Encuesta
2002
2003-
Encuesta de Hogar MECOVI Departamento, Urbana/rural,
Ampliada (con modulo empleo)
3 pisos ecológicos
Demografía y Salud (ENDSA)
Departamento, Urbana/rural, 3 pisos 30.000
ecológicos, 5 niveles de pobreza
- Encuesta de Hogares MECOVI Urbana/rural, 3 pisos ecológicos
6.000
2004-
- Encuesta de Hogares MECOVI
Urbana/rural, 3 pisos ecológicos
6.000
2005
- Encuesta de Hogares MECOVI
Urbana/rural, 3 pisos ecológicos
6.000
2006
- Encuesta de Hogares MECOVI
Urbana/rural, 3 pisos ecológicos
6.000
2002
Desagregación de los resultados
Número previsto
de viviendas
12.000
Estas son las encuestas planificadas para los próximos 5 años, y para este número de encuestas se tiene
una muestra de 125.000 viviendas aproximadamente.
122
Informe técnico del diseño de la muestra maestra...
De haber otros requerimiento como las encuestas municipales, podrían determinar un tamaño distinto para
la MM.
8.
Las Unidades Primarias de Muestreo (UPMs)
En general, las unidades primarias de muestreo deben reflejar la variación en cada estrato (de las variables
de las encuestas). La agrupación de las UPM’s deben contener correlaciones intraclásicas pequeñas que
pueda aumentar la precisión de las estimaciones. Es por ese motivo, se hace una diferenciación entre áreas
geográficas, tomando como delimitaciones en el área urbana los Sectores Censales y las Organización
Comunitarias para el área dispersa.
También permitirá identificar las UPM’s fácilmente en el terreno, y que además formen áreas conectadas
preferiblemente compactas, para optimizar el uso de los recursos económicos y otras actividades
relacionadas al trabajo del campo.
9.
Selección de las UPM’s
La selección en la primera etapa es proporcional al tamaño de viviendas que tenga (ppt), como
anteriormente se había dicho. Las UPM’s conformadas en el marco de muestreo tienden a ser
Organizaciones Comunitarias en su mayoría lo que genera una dispersión en la cantidad de viviendas
entre 150 y 300.
En algunos casos, las UPM’s están constituidas por un grupo de Organizaciones Comunitarias que juntas
hacen entre el rango de viviendas establecido anteriormente y lo mismo si se trata de una organización
comunitaria demasiado grande a la cual se la debe dividir por el mismo concepto. En el caso de una
división, es importante respetar los límites de cantón, sector y segmento censal.
10. Construcción de Estratos
Los estratos para la MM deben seleccionarse considerando, en parte, las desagregaciones deseadas en las
encuestas. Es preferible crear estratos correspondientes a las subdivisiones geográficas del país.
Para Bolivia las estratificaciones mas importantes son:
Area Urbano y Rural.
Regional Altiplano Valle y Llano.
Departamentos
Las desagregaciones anteriores también son utilizadas como Dominios de Estudio.
Otras posibilidades de estratificación se debe a la desagregación de población :
Ciudades capitales
Otras ciudades con 10.000 habitantes o más
Ciudades con 2.000 a 10.000 habitantes
Ciudades y aglomeraciones con 250 - 2.000 habitantes
Otras áreas denominadas áreas dispersas.
Los tres primeros estratos son considerados urbanos, los otros rurales.
También se puede estratificar por categorías de pobreza u otros indicadores socio-económicos, para lo
cual se estudiará la posibilidad de emplear los métodos univariados de Dalenius y Hodges o para métodos
multivariados mediante Cluster Análisis.
Informe técnico del diseño de la muestra maestra...
123
11. El tamaño de la MM
El tamaño de la Muestra Maestra, está en relación con las encuestas que el INE tiene previsto ejecutar en
los próximos cinco años. En base a esto, se ha fijado una muestra de 125.000 viviendas ocupadas.
Si se plantea una cantidad de 50 a 60 viviendas por unidad primaria de muestreo (USM), se tendrá
aproximadamente un total de 2.500 UPM’s.
Una alternativa a definir, es el cupo de encuestas por USM, que puede establecerse entre 8 a 10 viviendas
en el área amanzanada, y 12 a 16 viviendas en el área dispersa. Esto dependerá de cuán dispersa se quiere
la muestra o cuán agregada debe ser. Esto está también en función de costos y tiempo.
12. El Marco para la Muestra Maestra
El Censo del 2001 proporciona datos a nivel:
Departamento
Provincia
Sección municipal
Cantón
Localidad
Organización Comunitaria
Zona
Sector
Segmento
Manzano
Descripción de área urbano / rural.
Tipo de vivienda
Número de personas por vivienda
A partir de esta información se construirá el Marco Muestral para las encuestas de hogares y para la
selección de la Muestra Maestra.
La descripción de la Unidades de Muestreo que ya han sido mencionadas anteriormente, serán
incorporadas en el marco elaborado. De igual manera, las UPM’s serán incorparadas en la cartografía.
A la fecha, el trabajo de la delimitación de UPM’s está en plena ejecución.
Cabe mencionar que para producir este marco, se precisan datos definitivos del censo de todos los
sectores y segmentos censales, con sus correspondientes identificadores, número de viviendas y los mapas
ya consolidados que compatibilicen entre la cartográfica y la base de datos censal.
La lista de las Unidades de Muestreo con la descripción de estratos y el número de viviendas en cada uno,
forman el Marco Muestral para la selección de la Muestra Maestra.
13. Afijación de las UPMs
Se propone un método de afijación potencial, con un número de UPMs en cada estrato proporcional a
Mhα, donde Mh = el número de viviendas en el estrato h, y α es un parámetro a seleccionar – con α = 0.5.
Este método ha sido implementado en varias encuestas de hogares en el país, con resultados
satisfactorios.
124
Informe técnico del diseño de la muestra maestra...
La afijación potencial aumenta el tamaño de la muestra en los estratos con pocas viviendas, lo que
produce buenas estimaciones en los estratos pequeños sin perder la precisión en los estratos grandes.
Sin embargo no está demás discutir otro método de afijación que mejore las estimaciones.
14. Actualización de la Muestra Maestra
Para la actualización de la Muestra Maestra, se empleará el método de listado de actualización de las
Unidades de Segunda Etapa seleccionadas en primera instancia, hasta que esta sea agotada con las
primeras encuestas.
Posteriormente se seleccionará una nueva USM y así sucesivamente hasta tener cubierta toda la UPM
seleccionada y que su actualización sea total.
Los listados de las UPMs darán nuevos totales de viviendas. Los nuevos resultados se anotan en el
registro y se usan para recalcular los factores de expansión. El uso de listados en una MM no es diferente
a una muestra tradicional.
15. Selección de una Nueva Muestra Maestra
La primera Muestra Maestra no se incluye para la selección de una segunda, en esta situación se crea una
nueva Muestra Maestra independiente de la primera, y esta se basa en una actualización del total del
marco muestral. Para esto se utilizan los listados y resultados de la primera muestra y la posibilidad de
realizar una nueva actualización cartográfica.
En el caso de no poder lograr una nueva actualización cartográfica, se propone actualizar solamente las
zonas de crecimiento, especialmente del área urbana. Esto dependerá de los recursos económicos
disponibles para levantar un trabajo operativo de actualización.
16. Estimación y Factores de Expansión
La estimación en una encuesta que utiliza una Muestra Maestra es similar a las estimaciones de otras
encuestas, donde los factores de expansión requieren de una atención especial.
Un total T se estima por
Tˆ = ∑hji whji x hji
donde
xhji = valor observado en el hogar i (o la persona i) en la UPM j del estrato h
whji = factor de expansión de la observación i en la UPM j del estrato h (ver abajo),
y la suma se extiende sobre los estratos h relevantes, incluyendo todas las UPMs y todos los hogares
(personas) en estos estratos.
El promedio se obtiene en la manera usual, dividiendo con N̂ = Σ whji.
La tasas se obtienen como promedios, con xhji = 0 o 1.
En el cálculo de la varianza de un promedio o una tasa, el estimador es una razón de dos cantidades
aleatorias, ya que el numerador N̂ es un estimador también. La fórmula para la varianza aproximada de
una razón Rˆ = Tˆ / Nˆ es
Var ( Rˆ ) = Var (Tˆ ) + Rˆ 2Var ( Nˆ ) − 2 Rˆ Cov(Tˆ , Nˆ )
Informe técnico del diseño de la muestra maestra...
Definiendo x hj + =
∑
nhj
i =1
125
whji x hji , la varianza de Tˆ = ∑hji whji x hji se puede estimar con
[
n
H
n
n
Var (Tˆ ) = ∑h =1 h ∑ jh=1 x hj2 + − (∑ jh=1 x hj + ) 2 / n h
nh − 1
]
donde H = el número de estratos, y nh = el número de UPMs seleccionadas en el estrato h.
La covarianza se estima de una manera análoga:
[
n
H
n
n
n
Cov(Tˆ , Yˆ ) = ∑h =1 h ∑ jh=1 x hj + y hj + − (∑ j h=1 x hj + )(∑ jh=1 y hj + ) / nh
nh − 1
]
donde “y” es otra variable, Yˆ es el total estimado y y hj + se define como x hj + .
Las estimaciones y varianzas pueden ser calculadas mediante los programas Pccarp, Cluster o Stata.
Si la selección de USMs es aleatoria, el factor de expansión es
whji
(F1)
N hj'
Nh
,
=
n h N hj nhj
donde
Nh = número de viviendas en el estrato h
nh = número de UPMs seleccionadas (con ppt) en el estrato h
Nhj = número de viviendas en la UPM j del estrato h si fue seleccionada la UPM
N'hj = número de viviendas al último listado en la UPM j del estrato h
nhj = número de viviendas seleccionadas para la muestra en la UPM j del estrato h
En el factor de expansión se puede incluir también:
o
Una corrección de no-respuesta - a menudo el factor nhj/n*hj, donde n*hj es el número de
respuestas obtenidas
o
Una corrección, o calibración, para el cambio (crecimiento) en la población total de
viviendas en el estrato - usando el factor N*h/Nh, donde N*h es la población total estimada
o proyectada al tiempo de la encuesta
En el área dispersa, donde se trabaja con segmentos (componentes), basta utilizar Nhj y N'hj como
poblaciones del segmento.
Si la UPM es seleccionada (con PPT) en un estrato, en la actualización de la MM, todos los factores de
expansión en el estrato cambian. La fórmula (F1) se aplica, con nh igual a todas las UPMs seleccionadas
(entonces, nh nuevo = nh viejo + b).
17. Muestras con Rotación, Paneles
Una posibilidad para muestras con rotación son usadas cuando una encuesta se repite cada año (o cada
trimestre, cada mes) y cuando hay un interés particular de estimar los cambios entre las encuestas. Cada
vivienda permanece en la muestra un determinado número de rondas, sea 2, 3, 4 o más. Una fracción de la
126
Informe técnico del diseño de la muestra maestra...
muestra sale cada vez y el mismo número de viviendas entran. La fracción corresponde al número de
rondas de permanencia - con dos rondas de permanencia, ½ de la muestra sale cada vez, con 3 rondas,
1/3 sale etc. La tasa de rotación en estos casos es 50%, 33%, etc.
En la situación de las encuestas de hogares en Bolivia, sería más natural realizar la rotación al nivel de las
UPMs. En cada ronda, saldría un grupo de UPMs de la muestra, y otro grupo entraría.
En cada UPM, las viviendas participantes son las mismas durante todo el período que la UPM permanece
en la muestra.
Un grupo de UPMs, y las viviendas seleccionadas en aquellas, que permanecen durante las mismas
rondas se puede llamar un panel. Por ejemplo, con una tasa de rotación de 25 % (o sea 4 rondas de
participación), se puede representar las muestras de las primeras 5 rondas así:
Muestra de la primera ronda
P1 P2 P3 P4
Muestra de la segunda ronda
P2 P3 P4 P5
(el panel P1 sale, y P5 entra)
Muestra de la tercera ronda
P3 P4 P5 P6
(el panel P2 sale, y P6 entra)
Muestra de la cuarta ronda
P4 P5 P6 P7
Muestra de la quinta ronda
P5 P6 P7 P8 (aquí, no queda ningún panel de la primera ronda)
Como un caso extremo, es posible trabajar con una encuesta de un panel fijo, con una tasa de rotación de
0 %. No es recomendable para encuestas de hogares, porque un panel fijo pierde muy rápidamente la
representatividad.
Las ventajas más importantes de las muestras de rotación son:
a) Posibilidades de estimar cambios (entre rondas de la encuesta) con mayor precisión
b) Reducción del trabajo del campo, ya sea en listados, o en buscar los hogares o en solicitar las
respuestas - las personas que participan conocen las preguntas (y los encuestadores) desde la
primera vez
c) La boleta o el número de preguntas de la segunda ronda y rondas posteriores puede ser reducida
Algunas desventajas son:
a) La estimación de agregados (por ejemplo un promedio o un total anual) es menos precisa
b) Los participantes se cansan y no permanecen en la muestra todo el tiempo previsto, lo que
significa que se pierde una parte de las ventajas
c) Deben ser establecidos procedimientos para salidas no planificadas de la muestra, así como para
entradas en la muestra
El parámetro más importante a determinar es la fracción de rotación, o el número de rondas de
participación de cada hogar. Hay dos consideraciones contrarias. Una es la importancia de las
estimaciones de cambio versus las de niveles - si los cambios son muy importantes, una gran parte de los
hogares deben permanecer en la muestra, es decir cada hogar debe participar muchas veces. Otra es la
atención a los hogares, y el riesgo de perder hogares en entrevistas repetidas. Esto resulta en un número
bajo de rondas de participación.
18. Selección de las muestras y asignación a paneles
La primera muestra se selecciona como cualquier muestra. Normalmente se selecciona las UPMs con ppt
(viviendas). Si hay una MM, y si precisa una selección de la misma, esta selección debe ser sistemática o
Informe técnico del diseño de la muestra maestra...
127
aleatoria. Asumiendo que queremos una tasa de rotación de 25 %, la muestra debe ser dividida en cuatro
paneles. Por eso, cada UPM seleccionada será asignada a uno de los paneles P1,..., P4. Esto se realiza con
una lista de las UPMs seleccionadas en orden de los estratos. Empezando con un panel aleatorio (por
ejemplo P3), la primera UPM de la lista es asignada a P3, la segunda UPM a P4, la tercera a P1, etc. En
un estrato nuevo, se continúa con la secuencia. El número del panel debe ser incluido en la lista de las
UPMs de la muestra.
Para la selección de la segunda muestra, precisa sólo el panel P5, que debe sustituir al panel P1. Los otros
paneles, con todas las UPMs y viviendas que contengan, permanecen en la muestra. El número de UPMs
en P5 y la distribución por estratos es completamente determinado por P1. Basta seleccionar el mismo
número de UPMs, en los mismos estratos. Si hay una MM, las UPMs se seleccionan de la MM como
antes. Si no hay una MM, la selección debe ser con ppt.
Se propone que la reselección de una UPM que sale con P1, sea permisible inmediatamente, mas que las
viviendas a seleccionar en la UPM puedan gozar de un período de descanso de 2 años. Por lo contrario,
no se permite que una UPM entre en dos o más paneles que son usados simultáneamente. Entonces, en la
selección de P5, las UPMs de P2-P4 no son permisibles.
En una encuesta trimestral, será conveniente seleccionar todos los paneles necesarios durante un año, a
decir cuatro paneles, simultáneamente en una sola operación. En este caso se propone que todas las UPMs
seleccionadas sean diferentes (sin reposición). Con esta regla, la reselección de una UPM será posible
solo después de un año.
19. Unidades de observación que no permanecen en la muestra
Por varias razones, hogares y personas no permanecerán en la muestra por todo el período previsto. Sin
experiencia de la probable frecuencia, es necesario seguir el desenvolvimiento con mucha atención,
particularmente en la segunda ronda de la encuesta. En principio, se prefiere trabajar sin substituciones. Si
el problema es muy grande, precisa entonces pensar en términos de un aumento de la muestra bruta (o
posiblemente todavía una substitución).
Si un hogar transfiere a otro lugar, o a cualquier vivienda no incluida en la muestra, se propone no seguir
más este hogar. Por lo contrario, si un nuevo hogar entrara en una vivienda de la muestra, se propone que
ello sea incluido en la muestra. Se debe evaluar el efecto de esta regla después de la segunda y tercera
ronda, para decidir definitivamente si se quiere o no conservarla.
El efecto de una muestra de rotación es reducir el error estándar de diferencias, dado que se crea una
correlación entre los valores de dos años. Los promedios de dos o tres años pueden ser indicadores
interesantes para desagregación en áreas como los departamentos, donde el número de observaciones en
un año no es suficiente para estimaciones con precisión deseada. Estos promedios sufren de la muestra de
rotación, en cuanto aumenta el error estándar.
Se nota que es necesario hacer suposiciones del tamaño de las correlaciones ρ1 y ρ2 para las variables
diferentes. No hay ninguna información, pero es probable que sean altas, y en los cálculos son supuestos
valores de 0,8 - 0,95 para ρ1 y 0,6 - 0,9 para ρ2.
Se nota que el error estándar para la diferencia de dos rondas consecutivas es siempre igual al error en una
ronda, multiplicado por (2 − 2 β 1 ρ 1 ) . Si tr = la tasa de rotación, β1 = 1 - tr, y β1 es la proporción de la
muestra que permanece en las dos rondas consecutivas. (Además, tr = 100% (o β1 = 0) corresponde al
caso de muestras independientes, todos los hogares salen de la muestra después de una ronda.) Es
interesante estudiar la tasa de reducción del error estándar en relación al caso de muestras independientes.
Si D denota el error estándar, esta tasa es
128
Informe técnico del diseño de la muestra maestra...
Dcon rot (t i +1 − t i )
Dsin rot (t i +1 − t i )
=
Var (t ) (2 − 2 β 1 ρ 1 )
Var (t ) 2
= 1 − β 1 ρ1 .
El error estándar de una diferencia, con muestras de rotación, es 60 - 70 % del error para muestras
independientes. Si la correlación ρ1 es muy alta, la diferencia de tasas diferentes es importante.
Por el contrario, cuando se consideran promedios de dos o tres años, se pierde de precisión con muestras
de rotación. La razón de los errores estándar
Var (t ) (1 + β 1 ρ 1 ) / 2
Dconrot ((t i +1 + t i ) / 2)
=
= 1 + β 1 ρ1
Dsin rot ((t i +1 + t i ) / 2)
Var (t ) / 2
Si el error estándar aumenta de 20 a 30 %. Las alternativas (combinaciones de Tasa y ρ1) no son muy
diferentes.
Para un promedio de tres años, precisan dos correlaciones. La razón relevante es
(3 + 4 β 1 ρ1 + 2 β 2 ρ 2 ) / 9 / 1 / 3 .
Descargar