diseños muestrales utilizados en algunas de las encuestas de

Anuncio
301
DISEÑOS MUESTRALES UTILIZADOS EN ALGUNAS
DE LAS ENCUESTAS DE HOGARES REALIZADAS EN
LA ÚLTIMA DÉCADA EN CUBA
OFICINA NACIONAL DE ESTADÍSTICA (ONE)1
1
Documento elaborado por Mildred Iglesias Linares.
302
Diseños muestrales utilizados en algunas...
ÍNDICE
Página
1.
Disponibilidad de un Marco Muestral para el Levantamiento de las
Encuestas de Hogares ........................................................................................................... 303
2.
Diseños Muestrales Realizados por la Oficina Nacional de Estadística
en los Últimos Años para el Levantamiento de las Encuestas de Hogares........................... 305
2.1 Diseño muestral general o muestra maestra................................................................. 306
2.2 Diseño muestral de la encuesta sobre indicadores de prevención
de infección por el VIH/SIDA ..................................................................................... 306
2.3 Diseño muestral de la encuesta de hogares del año 2001 ............................................ 308
2.4 Diseño muestral de la encuesta sobre el uso del tiempo .............................................. 310
2.5 Diseño muestral de la encuesta estudio de mercados .................................................. 314
2.6 Diseño muestral de la encuesta nacional de factores de riesgo
para la salud y enfermedades no transmisibles............................................................ 317
Diseños muestrales utilizados en algunas...
1.
303
Disponibilidad de un Marco Muestral Maestro para el Levantamiento de las Encuestas de
Hogares
Desde que se instituyó, a inicios de la década de los 70, la Oficina Nacional de Estadística (ONE) como
órgano independiente de la Junta Central de Planificación, comenzaron a realizarse de forma oficial
encuestas por muestreo en el país. Al principio eran solo Encuestas Eventuales para luego, a partir de
1977, comenzar a realizar algunas, como la de Presupuesto Familiar, de forma permanente.
Con el levantamiento del Censo de Población y Viviendas de 1981 y tomando en cuenta los precedentes
que apuntaban a la necesidad de disponer de un listado de unidades, a partir del cual se pudieran
seleccionar las muestras de hogares requeridas para las encuestas a nivel nacional, se dio inicio, en el
año1982, a la organización de lo que luego se denominó Marco Muestral Maestro.
Dicho marco quedó estructurado según la División Político Administrativa (DPA) del país en 14
provincias y 169 municipios por debajo de los cuales se encontraban conglomerados de 180 viviendas en
promedio que constituían los Distritos Censales y conformaban las Unidades de Primera Etapa de
selección.
A posteriori, una vez organizado el Marco Muestral Maestro, se elaboró el Diseño Muestral General
(DMG) también identificado como Muestra Maestra (MM) que, organizado en tres bloques, los dos
primeros destinados para la selección de las muestras, mediante un Muestreo por Listas, de las encuestas
de carácter continuo y el tercero para el desarrollo de encuestas eventuales, sirvió de base en general al
Sistema de Encuestas de Hogares.
En el año 1990, para garantizar, ante las dificultades económicas, materiales y energéticas del país, la
continuidad del DMG y con ello la selección de las muestras de las encuestas a la población, se decidió
transformar el Muestreo por Listas que se venía aplicando en un Muestreo por Áreas.
La implementación del marco de áreas resultó ser mucho mas conveniente y ventajosa para llevar a cabo
la selección de viviendas ya que permite asociar las viviendas con un área geográfica determinada, ya sea
una manzana, segmento o sección, debidamente definida por límites físicos. Esto garantiza una mayor
estabilidad en la identificación de las áreas de muestreo que la que ofrece el muestreo por listas, al tiempo
que refleja de manera automática el crecimiento natural de la población. A lo anterior expuesto pudiera
añadirse la obtención de una simplificación notable en el proceso de selección, porque se concentra la
muestra en bloques compactos de viviendas próximas denominados secciones. Además, luego de realizar
una primera selección se puede establecer un orden de rotación de las secciones que integran el territorio
quedando seleccionadas las viviendas de manera automática.
Ya implementado el Muestreo por Áreas y en ausencia de recursos para levantar el Censo de la ronda de
los 90´ se hizo necesario actualizar la distritación del país. Fue entonces que, en el año 1995, dentro del
DMG, se definió una nueva división territorial por debajo del municipio denominada Área Geográfica
Muestral (AGEM), que sustituyó a los Distritos Censales que se venían utilizando hasta ese momento.
En ese entonces, sólo fue posible realizar la división de los planos municipales en AGEM y confeccionar
los expedientes cartográficos de las AGEM seleccionadas para participar en la Encuesta Nacional de
Migraciones Internas de Cuba. Posteriormente en el período de Septiembre 1998 - Junio 1999, al
disponerse de los recursos necesarios se confeccionaron los expedientes cartográficos de todas las AGEM
del país. Estos expedientes, confeccionados a partir de la actualización en el terreno del Marco Muestral
Maestro, contienen los mapas o planos con la subdivisión en manzanas y secciones de las AGEM
urbanas, así como en segmentos y secciones en el caso de las rurales, los derroteros y los listados de las
viviendas contenidas en cada AGEM.
De este modo la Oficina Nacional de Estadísticas dispone de un Marco Muestral estructurado según la
DPA vigente en 14 provincias y 169 municipios. Los municipios a su vez se encuentran particionados en
AGEM urbanas y/o rurales, conglomerados que tienen en promedio 180 viviendas. Por su parte las
304
Diseños muestrales utilizados en algunas...
AGEM dentro de la parte urbana se encuentran divididas en Manzanas de 30 viviendas como mínimo y
las correspondientes a la parte rural en Segmentos de 90 viviendas como promedio. Finalmente, tanto las
manzanas como los segmentos se dividen en secciones que tienen en promedio 5 viviendas.
Considerándose como estratos geográficos las provincias y los municipios en que está dividido el
territorio según la División Político Administrativa entonces las Unidades Maestrales que conforman el
marco quedan resumidas en:
Tabla 1. Unidades Muestrales que conforman en Marco
Unidades Muestrales
Unidad de Primera Etapa
Unidad de Segunda Etapa
Unidad de Tercera Etapa
Urbano
AGEM
Manzana
Sección
Viviendas
Promedio
180
30 como mínimo
5
Rural
AGEM
Segmento
Sección
Viviendas
Promedio
180
90
5
Destaca el hecho que dentro de cada estrato se realizó una estratificación implícita de las AGEM que
comprende dos criterios de clasificación, que se aplican para proporcionarles un ordenamiento antes del
proceso de selección de la muestra.
Primer criterio: Asentamiento Poblacional.
Se ordenaron las AGEM según los códigos de los asentamientos poblacionales a que pertenecen, que
comienzan por la ciudad cabecera municipal con el código 001.
Segundo Criterio: se utilizó la doble clasificación por zona urbana y rural y las características de la
distribución de las viviendas que radican en cada AGEM, de los cuales resultaron 8 niveles de
clasificación:
Urbano
Rural - Llano
Rural - Montaña
Llano
Montaña
Concentrado
Mixto
Disperso
Concentrado
Mixto
Disperso
Con respecto a la identificación de límites de las unidades de selección en la parte urbana se recomendó
que las fronteras de las manzanas fueran las calles y en la periferia de las ciudades, los ríos, las líneas de
ferrocarril, etc. Estos deberían quedar reflejados en los mapas y derroteros junto a las señalizaciones, los
letreros, los semáforos pudiendo servir de puntos de referencia para la ubicación más fácil en el terreno.
En la parte rural, los límites pueden ser caminos, carreteras, canales de riego o de drenaje, vías de
ferrocarril, ríos, lagos, presas, arboledas, sembrados u otros accidentes físicos reconocibles y
relativamente estables en el tiempo.
La numeración de las AGEM se realizó dentro de los Municipios/Parte. En la parte urbana, las manzanas
se numeraron dentro de las AGEM y la numeración de las secciones se realizó dentro de cada manzana.
De forma similar se realizó en la parte rural, numerándose los Segmentos dentro de las AGEM y las
secciones dentro de los Segmentos.
Desde el punto de vista de su contenido, la estructuración del Marco Muestral, contempla desde la
formación del listado de unidades a muestrear, hasta las medidas de tamaño de las diferentes
subdivisiones o unidades de muestreo que lo conforman. Es decir ofrece la información necesaria para
Diseños muestrales utilizados en algunas...
305
permitir una clasificación, selección, e identificación de las unidades muestrales que conlleve a mejorar
los procesos de selección, estratificación o estimación a partir de una muestra.
2.
Diseños Muestrales Rrealizados por la Oficina Nacional de Estadísticas en los Últimos Años
para el Levantamiento de las Encuestas de Hogares
En la mayoría de las investigaciones NO es factible obtener información de todas las unidades de la
población, o lo que es lo mismos, realizar un censo, por la gran cantidad de recursos materiales y
humanos que se requiere o por lo complejo de los estudios. En estos casos, las observaciones se limitan a
un subconjunto de las unidades de la población que es lo que se denomina Muestra.
Las muestras pueden ser de dos tipos, probabilísticas y no probabilísticas. Ahora bien, si se quiere que la
investigación tenga rigor técnico y permita dar respuesta a los requerimientos de la investigación estas no
se deben escoger arbitrariamente.
Es requisito indispensable para seleccionar una muestra:
-
conocer cuales son los objetivos de la investigación así como el alcance territorial y temático.
-
Definir claramente quien conforma a la población objeto de estudio, cual es la unidad de visita y
de enumeración, el método de enumeración y el periodo de enumeración.
-
Definir el marco muestral que servirá de base para la selección de las unidades a muestrear, las
unidades a muestrear y el método de muestreo que se aplicará.
-
Identificar quienes conformarán los estratos y los dominios de estudio y como se realizará la
afijación o distribución de la muestra por estratos.
-
Precisar según los objetivos del estudio y la disponibilidad de recursos, la confiabilidad y el nivel
de error admisible para los resultados
-
Determinar el tamaño de muestra necesario para lograr cumplimentar los objetivos propuestos así
como los procedimientos de estimación que se emplearán para realizar inferencias a la población.
-
Determinar, en caso de tratarse de una encuesta continua, la periodicidad en la realización de la
investigación así como el esquema de rotación que garantice la comparabilidad de los resultados
en cada etapa.
Lo anteriormente expuesto pudiera resumirse en plantear que para realizar una investigación por muestreo
se requiere definir a priori un Diseño Muestral.
En los últimos años, en la Oficina Nacional de Estadística se han realizado diseños maestrales para
distintas encuestas de hogares. Pudiera citarse en primer lugar el Diseño Muestral General o Muestra
Maestra, que no es mas que el diseño de una muestra compleja de gran alcance en el espacio y el tiempo,
que sirve de base para garantizar tanto las encuestas periódicas con el estudio de sus indicadores y de la
dinámica de los mismos, como, dada su flexibilidad, la aplicación de encuestas eventuales sobre
submuestras seleccionadas con ese fin.
A continuación se describirá brevemente en primer lugar, el Diseño Muestral de la Muestra Maestra para
a posteriori pasar a describir, de forma concisa también, los diseños maestrales que se han empleado en
algunas de las encuestas realizadas en los últimos años: la Encuesta Nacional de Ocupación, la Encuesta
de Ingresos y Gastos, la Encuesta sobre Indicadores de Prevención de Infección por el VIH/SIDA, la
Encuesta sobre Salud y Bienestar del Adulto Mayor (SABE), la Encuesta sobre el Mercado Negro, la
Encuesta Nacional de Migraciones Internas, la Encuesta sobre Uso del Tiempo, la Encuesta sobre
Factores de Riesgo para la Salud y Enfermedades No Transmisibles, la Encuesta sobre Hábitos
Culturales, la Encuesta sobre Comportamientos y Creencias Sexuales y Reproductivas de los Hombres
Cubanos, la Encuesta de Evaluación de la Cobertura y la Calidad del Contenido Censal entre otras.
306
Diseños muestrales utilizados en algunas...
2.1 Diseño muestral general o muestra maestra
El Marco Maestro de Muestreo de la ONE, dispone de toda la información necesaria para cubrir los
requerimientos de una MM previendo en su organización las labores de actualización periódica que
incluyen el pateo de terreno y el reajuste de los expedientes cartográficos de las Unidades Muestrales que
comprende.
La Muestra Maestra, como se expuso anteriormente, no es mas que el diseño de una muestra compleja de
gran alcance en el espacio y el tiempo, que sirve de base para garantizar tanto las encuestas periódicas con
el estudio de sus indicadores y la dinámica de los mismos, así como también, dada su flexibilidad, la
aplicación de encuestas eventuales sobre submuestras seleccionadas con ese fin.
Apoyados en el Marco Muestral Maestro de Cuba se realizó el Diseño Muestral General que dio origen
mediante la aplicación de un método de Muestreo Probabilístico por Conglomerados Trietápico con
estratificación de las Unidades Muestrales de Primera etapa, a la Muestra Maestra.
A partir de este diseño, como se mencionó previamente, se obtuvo la Muestra Maestra que comprende un
total de 4000 AGEM. Dichas AGEM, conforman las Unidades de Primera Etapa en el diseño y se
seleccionaron con Probabilidad Proporcional al Tamaño dado este por el número de viviendas particulares
con residentes permanentes que existen en el área geográfica en cuestión.
Las Unidades de Segunda Etapa dentro de la parte urbana están constituidas por las Manzanas o Unidades
de manzana (de 30 viviendas o más) y en la parte rural por los Segmentos (con 90 viviendas como
promedio). Tanto las manzanas urbanas como los segmentos rurales se seleccionaron dentro de las
AGEM con Probabilidad Proporcional al Tamaño, dado este por el número de viviendas particulares con
residentes permanentes que las conforman.
Finalmente las Unidades de Tercera Etapa o sea las Secciones, se seleccionaron de forma sistemática con
Probabilidades Iguales.
Este diseño dio lugar a una muestra autoponderada a nivel de Municipio/Parte, es decir, a una muestra
dentro de la cual las unidades elementales tienen la misma probabilidad de aparecer en la muestra, dentro
de cada Municipio/Parte.
Para generar las estimaciones se definieron estimadores de razón utilizando como variable auxiliar las
Estimaciones de la Población emitidas de manera oficial por el Departamento de Demografía de la
Oficina Nacional de Estadísticas debido a que no disponía de estadísticas confiables sobre la cantidad de
viviendas del país.
La Distribución de la muestra por provincias/parte y municipios/parte se realizó a partir de una
Afijación de Compromiso entre una Afijación Proporcional al Tamaño, dado este por el total de
población, una Afijación Uniforme y el cálculo del tamaño de muestra necesario para los requerimientos
de las encuestas periódicas del país, que son, la Encuesta Nacional de Ocupación y la Encuesta de
Situación Económica de los Hogares.
2.2 Diseño muestral de la encuesta sobre indicadores de prevención de infección por el VIH/SIDA
La investigación se realizó en dos momentos. Una primera encuesta en 1995 que formaba parte de un
proyecto regional de la OPS y una segunda que se levantó del 22 de Junio al 20 de Julio del 2001, de la
cual se describirá brevemente el diseño muestral.
Esta última encuesta del 2001 se realizó con el propósito de evaluar los avances en cuanto al
conocimiento de la población sobre los métodos para prevenir las Infecciones de Transmisión Sexual y
el VIH/SIDA, así como el impacto de los programas de difusión en la reducción de las conductas de
riesgo.
Diseños muestrales utilizados en algunas...
307
Para desarrollar este estudio, se diseñó y aplicó un cuestionario a la población objetivo, comprendida por
las personas de 15 a 49 años de edad residentes permanentes en viviendas particulares, en el cual se
abordaron las temáticas necesarias para cumplimentar los propósitos del mismo.
Teniendo en cuenta que la disponibilidad de recursos era limitada y se deseaba obtener resultados a nivel
de Cuba y provincias lo cual era muy costoso, se consideró seleccionar por provincias al municipio
cabecera e incluir además a todos los de la capital Ciudad de La Habana, por ser estos los lugares donde
más se reportan las incidencias del SIDA. A partir de ello se decidió agrupar las provincias en cuatro
regiones: Ciudad Habana, Región Occidental, Región Central y Región Oriental y diseñar la muestra de
forma tal que fuera representativa de Cuba, Ciudad de La Habana y las tres restantes regiones.
En el desarrollo de la encuesta la unidad de visita fue la vivienda seleccionada y la unidad de
enumeración la persona seleccionada de 15 a 49 años residente permanentemente en la misma, a quien
se le llenó el cuestionario mediante una entrevista directa.
La muestra para desarrollar la encuesta se insertó dentro de la Muestra Maestra actualizada de que
dispone la ONE y el método de muestreo empleado respondió a un muestreo probabilístico del tipo
correspondiente a un Muestreo por Conglomerados Cuatrietápico Estratificado donde los estratos
geográficos lo constituyeron la parte urbana de los municipios cabeceras provinciales seleccionados para
participar en la investigación. Las unidades muestrales y sus probabilidades de selección por municipio se
registran en la Tabla 2.
Tabla 2. Unidades Muestrales y Probabilidades de Selección por Municipio
Etapa de
Selección
Primera
Unidad
Muestral
AGEM
Segunda
Manzana
Tercera
Cuarta
Sección
Persona
Probabilidad de Selección
Proporcional al Tamaño PPT (Cantidad de viviendas particulares con residentes
permanentes)
Proporcional al Tamaño PPT (Cantidad de viviendas particulares con residentes
permanentes)
Probabilidades Iguales PI
Probabilidades Iguales PI
La distribución de la muestra por estrato se realizó con Afijación Proporcional al Tamaño, dada la medida
de tamaño por el total de población de 15 a 49 años residentes en la parte urbana de los municipios
seleccionados según cifras oficiales del Departamento de Demografía de la ONE.
Para determinar el tamaño de muestra necesario para cumplimentar los propósitos de la encuesta se
consideraron tanto los resultados obtenidos en la encuesta realizada en 1995 como los devenidos del
ensayo efectuado en el municipio de Centro Habana de la capital de país en febrero del 2001, así como
también el comportamiento de las caídas de muestra que se obtuvo en los municipios que intervienen en
la investigación en la última Encuesta Nacional de Ocupación perteneciente al Sistema de Encuesta de
Hogares implantado en el país se llegó al siguiente consenso:
1. Determinar tamaños de muestra similares para la Región Occidental, Región Central y Región
Oriental e incrementar el de Ciudad de la Habana.
2. Esperar un mínimo de 300 personas por municipio con el objetivo de obtener los indicadores
fundamentales.
3. Incrementar el mínimo de personas requeridos para obtener los indicadores, con los por cientos
de caídas de muestra previstos para cada municipio según su comportamiento en las encuestas
previas analizadas.
Los tamaños de muestra teóricos y su distribución por regiones se muestran en la siguiente tabla.
308
Diseños muestrales utilizados en algunas...
Tabla 3. Distribución de la Muestra
Estratos
Región Occidental
Ciudad Habana
Región Central
Región Oriental
CUBA
AGEM
143
160
144
142
589
Viviendas
Teóricas
5720
6400
5760
5680
23560
Estos tamaños de muestra se lograron seleccionando con probabilidades iguales 8 secciones de 5
viviendas como promedio por AGEM y entrevistando, en cada vivienda perteneciente a esas secciones y
que tuviera persona elegible, a una sola persona, seleccionada por el entrevistador con probabilidades
iguales utilizando una tabla de Kish, en el momento de llegar a la vivienda.
a)
Procedimiento de estimación
Teniendo como premisa fundamental No obtener diferencias con las estimaciones oficiales por sexo y
grupos de edades (15–19, 20-29, 30-39, 40-49) se determinó realizar el procedimiento de estimación por
post estratificación de estos dos indicadores.
El estimador utilizado fue el de Razón Separada, empleándose como variable auxiliar el Total de
personas correspondiente a cada estrato de ponderación.
Por su parte el cálculo de los errores maestrales y el coeficiente de variación (CV) de los estimadores de
los indicadores fundamentales de la encuesta se realizó utilizando el paquete de programas PC CARP
Se señaló además que dado que los errores calculados se refieren a las estimaciones de los indicadores
básicos de la encuesta, en las tablas donde aparecieran estimaciones de varios indicadores cruzados, estos
estarían afectados por niveles de error superiores en magnitud; es decir; que tendrían menor precisión.
2.3 Diseño muestral de la encuesta de hogares del año 2001
En el año 2000 se unificaron la Encuesta Nacional de Ocupación y la de Ingresos y Gastos que se venían
desarrollando de forma independiente hasta la fecha, en una sola encuesta dividida por módulos que se
denominó Encuesta de Hogares.
Consecuente con ello, La Encuesta de Hogares del año 2001 es una encuesta por módulos compuesta por
un módulo fijo, un módulo de ocupación, un módulo de ingresos y un módulo de gastos. El módulo fijo,
el de ocupación y el de ingresos son similares a los aplicados en la Encuesta de Hogares del año 2000.
A continuación se explicará brevemente el diseño muestral creado para la implementación de esta
encuesta durante el periodo de marzo, abril y mayo del 2001.
La Encuesta de Hogares del año 2001 es una encuesta nacional que tiene por población objeto de
estudio a las personas que residen permanentemente en viviendas particulares. Se realiza a una muestra
de viviendas particulares representativas de todo el país tanto de la parte urbana como de la rural
excluyendo la Base Naval de Guantánamo. Fue diseñada para continuar los estudios sobre la ocupación y
la situación económica de los hogares permitiendo poder caracterizar a los mismos de acuerdo a un
conjunto de variables socioeconómicas.
La muestra para desarrollar la encuesta se seleccionó del Diseño Muestral General o Muestra Maestra del
Sistema de Encuesta de Hogares que tuvo como Marco Muestral Maestro el elaborado por la ONE para la
realización de encuestas de hogares en 1995 y que fue actualizado en 1999.
Diseños muestrales utilizados en algunas...
a)
309
Método de muestreo
El método de muestreo que se utilizó corresponde con un muestreo por conglomerados trietápico, con
estratificación de las unidades primarias. Las provincias y dentro de ellas los municipios constituyeron los
estratos.
Las Unidades Muestrales de Primera Etapa fueron las AGEM (Areas Geográficas Muestrales), que
tienen 180 viviendas en promedio. Como Unidades de segunda etapa, en el caso de la parte urbana se
seleccionaron manzanas o unidades de manzanas, y para la parte rural segmentos. Las Unidades de
tercera y última etapa fueron las secciones, con 5 viviendas como promedio.
Dentro de cada estrato se hizo un ordenamiento de las unidades primarias de muestreo por asentamientos,
previamente clasificados en grandes, medianos y pequeños según su población, garantizando así una
estratificación implícita de las unidades de muestreo antes de aplicar el procedimiento de selección.
b)
Procedimientos de selección
Las unidades de muestreo se seleccionaron a través de procedimientos probabilísticos: las unidades de
primera y segunda etapa, las AGEM, las manzanas urbanas y los segmentos rurales, se seleccionaron con
probabilidades proporcionales al tamaño, siendo la medida de tamaño considerada en todos los casos el
total de viviendas particulares con residentes permanentes, y las secciones se seleccionaron con
probabilidades iguales.
c)
Rotación de la muestra
Como se planteó en los inicios, en el año 2001 al igual que en el 2000 se realizó una sola vez en el año, en
el periodo (marzo abril y mayo) el levantamiento de la Encuesta de Hogares que vino a unificar las
encuestas continuas (Encuesta Nacional de Ocupación y Encuesta sobre la Situación Económica de los
Hogares).
En ambos momentos, los indicadores de Ingresos se ubicaron en el módulo de ingresos y los de
Ocupación en el de ocupación y se aplicaron por igual a la muestra completa de 40000 hogares. El
módulo de gastos, por su parte, se le aplicó a una submuestra de 8000 hogares de la parte urbana.
La muestra para el año 2001 se aplicó con un solapamiento del 50% de la muestra del año 2000 para el
módulo fijo, el de ingresos y el de ocupación permitiendo así que los indicadores fundamentales pudieran
ser comparables con una buena precisión. O sea, se levantaron nuevamente 40000 viviendas
correspondientes a las mismas 4000 AGEM, solo que 20000 de ellas ya habían participado en el año
anterior y las 20000 restantes entraron nuevas ese año para repetirse entonces en el 2002.
Con relación a la submuestra de 800 AGEM a la que se le aplicó el módulo de gastos, se mantuvo
también la rotación del 50% de la muestra de 8000 hogares que participaron en el estudio, lográndose
también buena precisión en la comparabilidad.
d)
Período de levantamiento
El levantamiento de la encuesta se realizó en los meses de Marzo, Abril y Mayo. La submuestra de 800
AGEM, a la que se le aplicó el módulo de GASTOS (además de los módulos Fijo, de Ocupación y de
Ingresos), se levantó en el mes de Mayo con una duración de cuatro semanas.
e)
Tamaño de la muestra
El tamaño de la muestra se determinó de manera tal que permitiera obtener resultados de los indicadores
más importantes al nivel de provincias y nación, con una caída de muestra esperada promedio de un 10%
y con un nivel de error inferior al 5%. Todo esto permitiría hacer a posteriori un análisis de indicadores
con cierto grado de desagregación. El tamaño teórico para Cuba fue de 40000 viviendas.
310
Diseños muestrales utilizados en algunas...
La distribución de la muestra por estratos (provincias, municipios, partes) se realizó con una Afijación de
Compromiso. En el caso de la submuestra de 8000 viviendas, dentro de cada provincia los hogares fueron
distribuidos aleatoriamente por semanas, de forma tal que tuviese cada semana un tamaño similar en
número de viviendas.
f)
Estimación.
Los estratos de ponderación fueron los municipios parte urbana y rural dentro de cada provincia, la
muestra se diseñó de forma tal que se obtuvo una muestra autoponderada a ese nivel.
Para las estimaciones se aplicaron estimadores de razón que utilizaron como variable auxiliar el Total de
Población que ofrecen los cálculos demográficos de la ONE.
Para las variables de Ocupación e Ingresos se aplicó además una post-estratificación por sexo y grupos de
edad (15-29, 30-54, 55 y más para las mujeres, y 15-29, 30-59, 60 y más para los Hombres)
Se calcularon los errores muestrales de algunos de los principales indicadores utilizando el sistema PCCARP. Estos errores relativos ó coeficientes de variación permitieron calcular los intervalos de confianza
de las estimaciones obtenidas. Estos intervalos se calcularon siguiendo la fórmula:
(
(
)
(
I . C. (Yest ) = Yest − t * Yest * C.V . (Yest ) ; Yest + t * Yest * C.V . (Yest )
))
(1)
donde t es el percentil de la distribución normal, que a un nivel del 95% de confiabilidad toma el valor de
1.96. Se debe recordar que las estimaciones no están referidas a valores puntuales, sino a valores
que se mueven dentro de un intervalo de confianza como el descrito anteriormente, lo que
significa que la muestra se diseñó de forma tal que si se tomaran 100 muestras de igual tamaño y
diseño, en 95 de ellas el verdadero valor del indicador quedaría dentro de ese intervalo.
La interpretación del Error Relativo o Coeficiente de Variación (C.V.) de las estimaciones se realizó de la
siguiente forma:
! C.V. menor del 5%, la estimación del indicador es muy Buena.
! C.V. entre el 5% y el 10%, la estimación del indicador es Buena.
! C.V. entre el 10% y el 15%, la estimación del indicador es Aceptable.
! C.V. entre el 15% y el 20%, la estimación hay que utilizarla con precaución.
! C.V. mayor del 20%, la estimación del indicador NO es buena y sólo se tomará como cifra
indicativa para el análisis del indicador obtenido en momentos distintos.
2.4 Diseño muestral de la encuesta sobre el uso del tiempo
La Encuesta sobre el Uso del Tiempo se realizó a principios del año 2002 bajo el financiamiento de la
UNIFEM y PDHL con el propósito de evaluar cómo utilizan su tiempo las personas de 15 años y más, por
sexos y grupos de edades.
La población objeto de estudio estuvo constituida por aquellas personas de 15 años y más residentes de
manera permanente en viviendas particulares de la parte urbana y rural de los municipios Pinar del Río,
San Juan y Martínez, Habana Vieja, Bayamo y Guisa.
a)
Marco muestral
La Encuesta se montó sobre el Diseño Muestral General, también conocido como Muestra Maestra, del
Sistema de Encuestas de Hogares de la Oficina Nacional de Estadísticas. El mismo está organizado de
Diseños muestrales utilizados en algunas...
311
acuerdo a la División Político Administrativa del país en 14 provincias y 169 municipios y además
contiene la estructura requerida para el trabajo de terreno, donde cada municipio quedó dividido en las
llamadas Áreas Geográficas Muestrales (AGEM). Este Marco Muestral Maestro fue objeto de una
exhaustiva actualización a partir de 1998 con motivo de los trabajos de organización del Censo de
Población y Viviendas de septiembre del 2002.
La Muestra fue seleccionada especialmente para esta investigación y se utilizó un grupo de
entrevistadores, supervisores y oficinistas especialmente entrenados para el desarrollo de este tipo de
encuesta.
b)
Tipo de muestreo
El tipo de muestreo utilizado en el presente estudio es un Muestreo por Conglomerados Trietápico con
estratificación de las unidades primarias. Los estratos estuvieron constituidos por los municipios, parte
urbana y parte rural.
c)
Unidades de muestreo y probabilidades de selección
Las unidades muestrales de primera etapa fueron las AGEM que se seleccionaron con probabilidad
proporcional al tamaño dado este por la cantidad de viviendas que las conforman, como unidades de
segunda etapa se seleccionaron Manzanas en la parte urbana y segmentos en la parte rural, ambos también
con probabilidades proporcionales al tamaño. Finalmente las Secciones constituyeron las unidades de
tercera etapa y fueron seleccionadas con probabilidades iguales. Dentro de cada sección se entrevistó un
promedio de 5 viviendas y dentro de cada vivienda se tomó información de todas las personas residentes
permanentes.
d)
Afijación de la muestra
La distribución de la muestra por estratos se realizó por el método de afijación uniforme.
Desde el punto de vista geográfico la muestra se distribuyó de acuerdo al diseño muestral y además
también fue repartida en el tiempo. Se establecieron 14 días de trabajo y la muestra fue repartida en 7
grupos conformados por parejas de días. La metódica de distribución de los días comprendidos en el
período de captación estableció siete parejas de días. En cada pareja de días trabajaron dos AGEM
distintas para lograr similares tamaños de muestra en cada día de la encuesta.
Esta encuesta tuvo en su desarrollo, diversos aspectos novedosos:
!
En el proceso de toma de información, se utilizaron dos métodos: de una parte la entrevista cara a
cara para recoger información relacionada con el hogar, condiciones de la vivienda, composición del
núcleo familiar, e información socioeconómica de las personas, y por otro lado la autoenumeración
que se empleó para registrar el uso del tiempo en dos diarios asignados a cada persona, los que debían
ser llenados en los días determinados para cada hogar y no en otros días de la semana.
!
Se clasificaron los días en dos tipos: día típico y día no típico. En cada diario la persona debía marcar
si el día en cuestión era para la misma un día típico o no típico. A los efectos del procesamiento de la
encuesta, existieron tres alternativas de clasificación de las parejas de días:
!
-
Dos días típicos
-
Un día típico y otro no típico
-
Dos días no típicos
Se previó que no todas las personas tuvieran la posibilidad de llenar los dos diarios, por lo que en la
encuesta aparecen individuos con solo un diario lleno.
312
Diseños muestrales utilizados en algunas...
!
De manera general las personas residentes en las viviendas involucradas en la encuesta, llenaron los
cuestionarios en los dos días que se les señaló con anterioridad. En la primera semana las parejas de
días tenían dos días intermedios y en la segunda semana solo uno. En los casos en que en la primera
visita no se logró acceder a la vivienda, o no se logró la entrevista individual con las personas objeto
de investigación, fue necesario repetir la visita en los días intermedios a fin de poder lograr las
entrevistas individuales, dejar los diarios de cada persona y tener al menos lleno, el diario
correspondiente al segundo día.
!
Los diarios terminados, debían ser recogidos por los entrevistadores en las viviendas de cada AGEM
al día siguiente de haberse llenado.
e)
Tamaño de la muestra
Para la captación de la información se seleccionaron un total de 28 AGEM por municipio, 14 en el área
urbana y 14 en el área rural, a fin de conformar una muestra que satisficiera los requerimientos de la
encuesta, la cual debía ofrecer resultados a nivel municipal, por sexos y por parte urbana y rural.
En cada municipio/parte se le asignaron 2 AGEM a cada grupo (GR1, GR2, etc.) y por cada AGEM se
asignaron 4 secciones, para un promedio de 20 viviendas por AGEM.
Con el objetivo de obtener una buena calidad en la información captada y además un por ciento de caída
de muestra lo más pequeño posible, se garantizó que cada entrevistador de la encuesta conociera de
antemano las AGEM, secciones y viviendas que le correspondían y los días en que las mismas debían
participar en la encuesta.
f)
Estimadores de la encuesta
Como ya se hizo referencia anteriormente la estrategia de Muestreo desarrollada corresponde con un
Muestreo por Conglomerados Trietápico Estratificado. Las unidades muestrales y sus probabilidades de
selección permiten obtener la probabilidad final de selección del diseño muestral de cada elemento de la
población que se calcula como:
a V i V ij 4
1
=
F
V
V i S ij
1
1
=
S ij Vij
n
(2)
(3)
donde
a: Número de AGEM en la muestra
Vi: Total de viviendas en la AGEM i-ésima
Vij :Total de viviendas en la manzana o segmento j-ésima/o de la AGEM i-ésima
V : Total de viviendas en la Población
Sij: Número de secciones en la manzana o segmento j-ésima/o de la AGEM i-ésima
n: Promedio de viviendas por sección.
El inverso del producto de las probabilidades de selección es el factor de expansión, que para el diseño
elaborado (Muestra Autoponderada) resulta constante dentro de cada estrato.
Diseños muestrales utilizados en algunas...
g)
313
Estimadores
!
Variables de Personas: Se utilizaron estimadores de razón, considerando para ello como variable
auxiliar la población emitida por las estadísticas oficiales de la ONE. Además de una
postestratificación por sexo y grupos de edad: 15-19, 20-24, 25-29,30-34, 35-39, 40-44, 45-49, 50-54,
55-59, y 60 años o más, lo que dio lugar a 20 categorías.
!
Variables de Núcleos: Se utilizaron estimadores de razón, empleando como variable auxiliar el total
de viviendas de cada estrato que se obtiene a partir de la igualdad de las proporciones siguientes
P/p = V/v
h)
(4)
Estimadores de tiempo y participación en las actividadesPromedio de Minutos diarios para la
actividad z (promediado sobre toda la población): Es el tiempo promedio empleado por el total de
la población (tanto participantes como no participantes) en una actividad z específica y se calcula
como:
n
TZ =
di
∑ wi ∑ tijz
i
j
(5)
n
∑w d
i
i
i
donde:
t i j z es el número de minutos reportados por el respondiente i, el día j, en la actividad z.
di
es el número de días-diario reportados por el respondiente i (nota: este número debe ser igual a 2,
aunque podría ser igual a 1 en algunos casos)
wI
es el peso asociado al respondiente i.
n
es el número de respondientes elegibles en la muestra.
Promedio de Minutos diarios para la actividad z (promediado sobre la población que participa en
la actividad ): Significa, en un día cuando ciertas personas realizan la actividad z, cuántos minutos estas
personas emplean en la actividad z, como promedio, y se calcula como:
d iz
nz
∑w ∑t
i
TP Z =
i
ijz
j
(6)
nz
∑w d
i
z
i
i
donde:
t i j z es el número de minutos reportados por el respondiente i, el día j, en la actividad z.
d zi es el número de días-diario en los que el respondiente i reportó que empleó un tiempo distinto de cero
en la actividad z.
w i es el peso asociado al respondiente i.
n z es el número de respondientes elegibles en la muestra que reportaron emplear algún tiempo en la
actividad z.
314
i)
Diseños muestrales utilizados en algunas...
Precisión en los resultados
Para el cálculo de las estimaciones de los errores muestrales, coeficientes de variación y efectos de diseño
se utilizó el Método del “Ultimate Cluster” a través del sistema PC- CARP. En los cuadros de salida se
incluyeron los coeficientes de variación.
Estos errores relativos o coeficientes de variación permiten calcular los intervalos de confianza de las
estimaciones obtenidas. Estos intervalos se calculan siguiendo la fórmula:
(
(
)
(
I . C. (Yest ) = Yest − t * Yest * C.V . (Yest ) ; Yest + t * Yest * C.V . (Yest )
))
(7)
donde t es el percentil de la distribución normal, que a un nivel del 95% de confiabilidad toma el valor de
1.96.
Se debe recordar que las estimaciones no están referidas a valores puntuales, sino a valores que se
mueven dentro de un intervalo de confianza como el descrito anteriormente, lo que significa que la
muestra se diseñó de forma tal que si se tomaran 100 muestras de igual tamaño y diseño, en 95 de ellas el
verdadero valor del indicador quedaría dentro de ese intervalo.
2.5 Diseño muestral de la encuesta estudio de mercados
La presente encuesta se levantó en enero del 2001 con el propósito de captar las opiniones y percepciones
de la población acerca de los diferentes mercados que se desarrollan en el país. Especialmente sobre el
mercado negro. El período de levantamiento fue de 10 días, considerando días hábiles y no hábiles.
a)
Alcance geográfico y población objeto de estudio
La investigación tuvo un carácter territorial y se realizó en Ciudad de La Habana, capital del país y en la
parte urbana del municipio Santiago de Cuba. Ambas zonas fueron seleccionadas, por la incidencia de
delitos e infracciones vinculadas al mercado negro que en ellas se detectan.
Dentro de esas áreas, el estudio se centró en la población de 15 años o más residente en viviendas
particulares, que se encontraba ocupada, fuera estudiante, jubilada o pensionada, o que se dedicara a los
quehaceres del hogar. Resultaba de interés además, poder disponer de resultados concernientes a la
población de 15 años o más según sexo, así como desglosada según tres grupos de edades: de 15 a 30
años, de 31 a 59 años y de 60 años o más.
b)
Marco muestral
Se tomo como marco muestral, la Muestra Maestra del Sistema de Encuestas de hogares.
c)
Método de muestreo y selección de la muestra
Tratándose de un sondeo de opinión sobre mercados se empleó un muestreo por cuotas, aplicado sobre un
muestreo por conglomerados cuatrietápicos para el caso de Ciudad de La Habana, con estratificación de
las unidades primarias, y sobre un muestreo por conglomerados trietápico en el caso del municipio
Santiago de Cuba.
Solo se explicará, para abreviar, el caso de Ciudad de la Habana.
!
Para Ciudad de La Habana
Las unidades muestrales de primera etapa (UPE) fueron los municipios, los cuales se seleccionaron de
manera no probabilística atendiendo a determinados criterios. Las unidades de segunda etapa (USE) la
formaron las AGEM que tienen en promedio 180 viviendas y se seleccionaron dentro de cada municipio
Diseños muestrales utilizados en algunas...
315
con probabilidades proporcional al tamaño, dado este por el total de viviendas que las conforman. Las
unidades de tercera etapa (UTE) fueron las manzanas. Se seleccionó dentro de las AGEM aquella
manzana que más viviendas poseía, (dato que se obtuvo del muestreo por áreas), con el propósito de hacer
más factible el cumplimiento de las cuotas. Las manzanas escogidas, se fueron barriendo vivienda por
vivienda hasta saturar la cuota establecida para la AGEM a que pertenecía. El recorrido de las manzanas
se hizo comenzando por el punto noroeste y continuando siempre hacia la derecha. Por último, las
personas formaron las unidades de cuarta etapa (UCE). Dentro de la manzana seleccionada se
entrevistaron aquellas personas que respondían a las características de la cuota que le fue establecida a
cada enumerador. Solo se entrevistó una persona por vivienda, y dejó de recorrerse la manzana en el
momento en que se completó la norma establecida. De no poder completarse la norma en la manzana, se
debió escoger la que le siguiera en cantidad de viviendas y en ella continuar muestreando.
Esquema del Recorrido de las Manzanas
manzana
Teniendo en cuenta la limitación de recursos del proyecto, se consideró oportuno realizar una selección de
municipios con determinado nivel de compromiso. Los diferentes criterios a considerar para conformar la
muestra de municipios se acogieron a juicios de valor de los especialistas y se ofrecen a continuación.
Un primer requisito consistía en considerar dentro de la muestra municipios periféricos y centrales. Un
segundo requisito fue incluir municipios con diferentes niveles de ingresos medios. Además, aunque no
se asumió directamente como criterio para realizar la estratificación, se presto atención a que quedaran
implícitos dentro de la selección, aquellos municipios con mayor movimiento de mercado según criterio
de expertos, así como también los más poblados.
A partir de estos criterios se seleccionaron en la capital del país ocho municipios para incluir en la
muestra.
Posterior a la selección de los municipios y las AGEM, se distribuyó la muestra dentro de ellos según
estratos de actividad: ocupados, estudiantes, jubilados o pensionados y quehaceres del hogar, así como
también sexo y grupos de edades.
d)
Afijación de la muestra
La distribución de la muestra por municipios y dentro de cada estrato socioeconómico: ocupados,
estudiantes, pensionados y quehaceres del hogar, fue uniforme dentro de la provincia. Sin embargo, la
distribución por sexo y grupos de edades se realizó de acuerdo con la estructura poblacional de estas
variables, garantizando reproducir las proporciones que tienen dentro de la población de 15 años o más de
cada provincia.
e)
Tamaño de la muestra
Luego de valorar tres variantes de tamaños de muestra, dada la disponibilidad de recursos del proyecto,
así como las características del estudio en cuestión, se consideró oportuno admitir resultados con un
margen de error de hasta un 10 por ciento a un grado de confiabilidad del 95 por ciento.
316
Diseños muestrales utilizados en algunas...
Para garantizar representatividad de cada uno de los cuatro estratos de actividad dentro de la provincia a
ese nivel de precisión, fue necesario para Ciudad de La Habana, seleccionar teóricamente 104 personas
por estrato, o sea 104 estudiantes, 104 ocupados, 104 dedicados a los quehaceres del hogar y 104
jubilados o pensionados. De esta forma se entrevistaron 416 personas. A su vez, estas personas fueron
distribuidas por sexo y grupos de edad dentro de cada situación de actividad a que estuvieran vinculadas,
logrando así submuestras representativas de las proporciones en que esas variables se encuentran dentro
de la población mayor de 14 años de la provincia.
f)
Distribución de la muestra para Ciudad Habana.
La Tabla 4 ofrece un desglose de la muestra para Ciudad de la Habana por municipios, estratos
socioeconómicos, sexo y grupos de edad. Estos tamaños de muestra permiten realizar tabulados de
proporciones y frecuencias por cada tipo de actividad, por sexo o por grupos de edad. Es necesario no
perder de vista que el tamaño de muestra no permite obtener cruces de estos indicadores.
Tabla 4. Distribución de la Muestra para Ciudad Habana
Municipio
T Pers.
T AGEM
Ocupados
Hombres
15-30
31-59
60 o más
Mujeres
15-30
31-59
60 o más
Estudiantes
Hombres
15-30
31-59
60 o más
Mujeres
15-30
31-59
60 o más
Q. Hogar
Hombres
Mujeres
15-30
31-59
60 o más
J/Pensionad
Hombres
15-30
31-59
60 o más
Mujeres
15-30
31-59
60 o más
San
Miguel
52
3
13
8
1
7
5
5
13
8
8
5
5
13
13
13
13
8
8
5
2
3
C.
Habana
52
3
13
8
1
7
5
5
13
8
8
5
5
13
13
13
13
8
8
5
2
3
La Lisa
52
3
13
8
1
7
5
5
13
8
8
5
5
13
13
13
13
8
8
5
2
3
Playa
10 de
Oct.
52
3
13
8
1
7
5
5
13
8
8
5
5
13
13
13
13
8
8
5
3
2
52
3
13
9
1
8
4
1
3
13
8
8
5
5
13
13
13
13
8
8
5
2
3
H. Este
52
3
13
8
1
7
5
1
4
13
8
8
5
5
13
13
13
13
8
8
5
3
2
Plaza
52
3
13
8
1
7
5
1
4
13
8
8
5
5
13
13
13
13
8
8
5
2
3
Habana
Vieja
52
3
13
8
1
7
5
5
13
8
8
5
5
13
13
13
13
8
8
5
2
3
Total
416
24
104
65
8
57
39
3
36
104
64
64
40
40
104
104
104
104
64
64
40
18
22
Diseños muestrales utilizados en algunas...
317
Posteriormente estos tamaños de muestra fueron distribuidos por municipios y AGEM seleccionadas,
quedando con ello establecidas las cuotas que debía completar cada entrevistador.
Realizándose 52 entrevistas por municipio durante el transcurso de 10 días, si se repartieran
uniformemente entre los días que dura el levantamiento quedarían entre 5 y 6 entrevistas diarias por
municipio. Para realizar esto se necesitó asignar un enumerador por municipio que debía entrevistar entre
5 y 6 personas diarias hasta completar su cuota.
Sugerencia a los enumeradores
Aunque el personal designado como enumerador tenía la instrucción de continuar muestreando hasta
tanto completara la cuota establecida, a fines de aligerar el trabajo de campo se le sugirió:
Comenzar el levantamiento intentando localizar a las mujeres pensionadas de 31 a 59 años que hayan
caído en su muestra, por ser estos los casos menos frecuentes de encontrar. Posteriormente tratar de captar
a los ocupados y estudiantes, ya que aunque no es difícil identificar viviendas donde ellos radiquen, si
costara trabajo contactarlos, pues las entrevistas casi siempre coinciden con horarios en que estas
personas se encuentran fuera de su domicilio.
En la práctica, sería recomendable intentar avanzar los primeros días, para en los días finales del
levantamiento disponer de mayor cobertura de tiempo para localizar a las personas que les falten. Las
cuotas establecidas no deben bajo ningún concepto dejar de captarse, siempre recordando que aunque en
una vivienda aparezcan dos personas con características a muestrear, solo entrevistarán una. Nunca más
de una persona por vivienda.
g)
Estimaciones
La estructura por sexo y edad se respeto en el diseño muestral, y por tanto no se requiere utilizar factor de
corrección para trabajar con ella. Sin embargo, para realizar las estimaciones correspondientes a los
estratos socioeconómicos ocupados, estudiantes, jubilados o pensionados, y quehaceres del hogar con la
idea de comparar resultados entre ellos, entonces sí será necesario emplear un factor de corrección para
cada uno, garantizando así, que respondan a la estructura que ellos representan dentro del universo
muestral.
Los factores a emplear aparecen en la siguiente tabla.
Tabla 5. Factores de Corrección según actividad. Ciudad de la Habana
Pob. /Actividad
Población
Ocupados
Estudiantes
Q. del Hogar
Jub o Pensionados
Total
974.557
118.213
266.972
305.248
1.664.990
Estructura en la
Población
59
7
16
18
100
Muestra proporcional a la
estructura en la población.
245
29
67
75
416
Factor de
Corrección
2.36
0.28
0.63
0.72
2.6 Diseño muestral de la encuesta nacional de factores de riesgo para la salud y enfermedades no
trasmisibles
Durante los dos últimos meses del año 2000 se realizó en el país la II Encuesta Nacional de Factores de
Riesgo para la Salud y Enfermedades No Trasmisibles. La misma constituye un proyecto conjunto del
Instituto Nacional de Higiene, Epidemiología y Microbiología (INHEM) y la Oficina Nacional de
Estadísticas, representada por el Centro de Estudios de Población y Desarrollo (CEDPE) y la Dirección de
Estadísticas Sociales. Debido a las limitaciones económicas que confronta el país, su levantamiento se
realizó sólo en el área urbana del territorio nacional.
318
Diseños muestrales utilizados en algunas...
La Encuesta tuvo como objetivo fundamental, realizar a partir de una muestra probabilística, un estudio
acerca de las características epidemiológicas de los principales factores que afectan la salud de las
personas y el conocimiento de las mismas sobre esta temática. Su levantamiento se realizó en el
transcurso de los meses de noviembre y diciembre del año 2000.
a)
Alcance geográfico y población objeto de estudio
El alcance territorial de la investigación comprende todo el territorio nacional, excluyendo el territorio de
la Base Naval de Guantánamo. La población a estudiar estará conformada por aquellas personas de 15
años y más que residen de forma permanente en las viviendas particulares de la parte urbana del país.
b)
Marco muestral
Se tomó como Marco Muestral, la Muestra Maestra del Sistema de Encuestas de Hogares de la Oficina
Nacional de Estadísticas, que fue actualizada en el transcurso del año 1999.
c)
Método de muestreo
El método de muestreo se corresponde con un muestreo por conglomerados trietápico con
estratificación de las unidades primarias.
A fin de poder obtener resultados a nivel provincial se consideraron como estratos las catorce provincias,
conjuntamente con el Municipio Especial Isla de la Juventud, de acuerdo con la División Político
Administrativa vigente.
Las unidades muestrales de primera etapa fueron las AGEM, las cuales tienen 180 viviendas como
promedio. Como unidades de segunda etapa se seleccionaron las manzanas o uniones de manzanas que
tienen 30 viviendas como mínimo. Las unidades de tercera y última etapa fueron las secciones, con 5
viviendas como promedio.
d)
Tamaño de la muestra
El tamaño de la muestra fue determinado de manera tal que permita obtener resultados de los principales
indicadores de la encuesta, tanto a nivel nacional como para las catorce provincias del país con un nivel
de error inferior al 5 % y una confiabilidad del 95 %, además se tuvo en cuenta un cierto nivel de caída de
muestra esperado.
En el cálculo del tamaño teórico de personas a incluir en la encuesta se tuvo en cuenta los siete grupos de
edades para los que se quería ofrecer información, así como también la desagregación de la población por
sexos y además ciertos porcentajes de prevalencia en la población de los principales indicadores objeto de
análisis tales como el tabaquismo, ingestión de bebidas alcohólicas, hipertensión arterial, asma, diabetes
mellitus, entre otros.
El tamaño teórico de la muestra asciende a 914 AGEM y se seleccionaron dos secciones por AGEM lo
que equivale a incorporar a la muestra 9140 viviendas en todo el país.
La distribución de la muestra por provincias, se realizó de manera proporcional al tamaño tomando como
magnitud de referencia, el total de población de 15 años y más.
Además de los estudios antes descritos, otro de los requerimientos de la encuesta era realizar un conjunto
de análisis más especializados a partir de la toma de muestras de sangre a la población, realización de
pruebas de esfuerzo, electrocardiogramas, y encuesta dietética, etc. Teniendo en cuenta que este
procedimiento resulta extremadamente costoso, debido a que implica la utilización de equipos, reactivos y
otros materiales, se determinó conformar una submuestra que incluyó aproximadamente la sexta parte de
las AGEM seleccionadas para participar en la encuesta, esto fue equivalente a un total de 1490 viviendas.
Diseños muestrales utilizados en algunas...
e)
319
Procedimiento de selección
Con el fin de garantizar la autoponderación de la muestra, o sea, que todos los individuos tengan igual
probabilidad final de selección en cada estrato, las unidades de primer etapa, es decir las AGEM fueron
objeto de una selección sistemática con probabilidad proporcional al tamaño, al igual que las manzanas
tomando como medida de tamaño la cantidad de viviendas con residentes permanentes con que contaban
las mismas. Las secciones se seleccionaron con probabilidades iguales.
En cada AGEM se seleccionó una manzana y de cada manzana fueron seleccionadas dos secciones con 5
viviendas como promedio.
f)
Estimación
Como estratos de ponderación se considerarán las provincias del país, realizando posteriormente una post
estratificación por sexo y edad. Las estimaciones de la encuesta se realizaron utilizando estimadores de
razón los cuales emplearon como variable auxiliar los totales de personas de 15 años y más
correspondientes a cada estrato de ponderación, información que se tomo de los datos estimados por el
Departamento de Estadísticas Demográficas del CEPDE con cierre de diciembre del 2000.
Como medida de evaluar la calidad de los datos de la encuesta se calcularon los errores de muestreo,
efecto de diseño y los intervalos de confianza de los indicadores básicos obtenidos.
Descargar