Subido por Mauricio Castro

Muestreo en Poblaciones Finitas - Diseños Muestrales Complejos

Anuncio
Muestreo en Poblaciones Finitas
Diseños Muestrales Complejos
José A. Mayor Gallego
Departamento de Estadística e Investigación Operativa
Universidad de Sevilla
Curso 2014-2015
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 1/35
Contenidos
1
Introducción
2
Diseños muestrales complejos y muestras complejas
3
Cálculo de los pesos
Muestreo Aleatorio Simple Básico
Muestreo con Probabilidades Variables Básico
Muestreo Aleatorio Simple Estratificado
Muestreo por Conglomerados en Una Etapa. M.A.S.
Muestreo por Conglomerados en Dos Etapa. M.A.S. + M.A.S.
Muestreo por Conglomerados en Dos Etapa. ΠPS + M.A.S.
4
Variables de Estructura. Error de Muestreo. Efecto del Diseño
Variables de Estructura
Error de Muestreo
Efecto del Diseño
5
Bibliografía
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 2/35
Introducción. Objetivos
Vamos a describir los diseños muestrales complejos, como diseños
generados por la composición de otros, y lo haremos en paralelo a la
descripción del “software” existente para generar estos diseños y
procesar los datos muestrales obtenidos. Estos procesos están
íntimamente relacionados con,
El diseño de una encuesta por muestreo: Se parte de una serie
de objetivos y condiciones poblacionales para decidir como se
obtendrá la muestra.
El análisis de los datos: A partir de los datos obtenidos en la
muestra, se obtienen las estimaciones de los parámetros. Es el
objetivo final en este tipo de investigaciones.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 3/35
“Sofware para Diseños Complejos
SPSS. Módulo de Muestras Complejas.
R. Librería Survey.
SAS. Rutinas surveyselect, surveymeans, surveyfrec,
surveyreg y surveylogistic.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 4/35
Muestras Complejas
Los programas que realizan las tareas relacionadas con el
muestreo se denomina genéricamente de procesamiento de
Muestras Complejas, lo que es una traducción de la
terminología inglesa Complex Samples, es decir, muestras
complejas.
Para justificar esta denominación y también a modo de revisión
de los conceptos de la Teoría del Muestreo en Poblaciones
Finitas que se van a manejar en relación a este programa,
vamos a ver a continuación una descripción genérica,
empleando ejemplos conectados con la realidad, de los diseños
muestrales complejos.
Dedicaremos la máxima atención a las probabilidades de
inclusión, pues a partir de ellas se derivará el concepto de
peso, que como veremos es fundamental para la aplicación de
los distintos programas.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 5/35
Diseños muestrales complejos y muestras complejas
Diseño Muestral. Definición formal
Un conjunto de muestras potenciales, y una distribución de
probabilidad sobre las mismas.
Diseño Muestral. Concepto aplicado
Un conjunto de especificaciones y reglas para seleccionar una
muestra (aleatoria) de una población.
Diseño Muestral Complejo
Es un diseño muestral, o sea, un procedimiento aleatorio para
seleccionar una muestra a partir de una población, en el cual
intervienen distintas estructuras poblacionales, ya sean naturales,
artificiales de tipo administrativo, etc.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 6/35
Diseños muestrales básicos
En su aspecto más básico, el proceso de muestreo y estimación
comienza seleccionando de una población, U, un conjunto de
elementos que determinan una muestra m. Esta selección es
aleatoria y se puede hacer de muchas formas,
Muestreo Aleatorio Simple.
Muestreo de Bernoulli.
Muestreo Sistemático Uniforme.
Muestreos con Probabilidades Variables: Sampford, Madow, etc.
Y un largo etcétera.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 7/35
La iniciación al Muestreo y la realidad
En su forma más simple, los muestreos se estudian como si la
muestra se extrajera directamente de la población, es decir, como si
la población U fuera un marco directamente accesible, y los
elementos de la muestra se seleccionaran de dicho marco mediante
un procedimiento que se aplica directamente sobre este.
Esto que puede ser factible en algunas ocasiones, y de hecho se
hace a veces, es problemático, difícil o imposible en muchas otras.
Veamos dos situaciones paradigmáticas.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 8/35
Situación 1: Gran variabilidad o dispersión
Los elementos de la población presentan mucha variabilidad en
relación a la característica que se estudia, lo que produce que las
estimaciones presenten un ELEVADO ERROR DE MUESTREO. Una
forma de disminuir este error es dividir la población en partes más
homogéneas y realizar muestreos en todas y cada una de estas
partes.
Las muestras obtenidas se unen o juntan para producir una única
muestra final, m. Como puede verse, aquí los elementos no se
seleccionan directamente, mediante un muestreo, de la población
original, sino que esta se estructura en partes, y la selección se
realiza en cada parte. Como vemos, en esta situación lo que se
pretende es disminuir el error.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 9/35
Situación 2: Accesibilidad a los elementos
De forma directa, los elementos de la población no son fácilmente
accesibles, no dándose las circunstancias adecuadas para construir
una muestra pues no necesariamente se dispone de un marco o
ámbito bien definido de los elementos de los que se quiere
seleccionar aquella.
Ejemplo
Si un encuestador es enviado a una urbanización formada por M
bloques de apartamentos, para hacer una encuesta a las familias
que allí habitan, puede tener problemas para seleccionar la muestra
ya que con seguridad no va a disponer de una lista bien elaborada de
las unidades familiares.
Una solución sería seleccionar previamente mediante un muestreo
en el conjunto de bloques, por ejemplo tres de los mismos, y a
continuación estudiar cada uno de estos tres bloques seleccionados,
ya sea mediante un análisis exhaustivo de los mismos, ya sea
realizando nuevamente muestreos en cada uno.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 10/35
Situación 1: Muestreo Estratificado
En una provincia geográfica dividida en siete se quiere realizar un
estudio de la producción de cereal mediante la selección de una
muestra de granjas en toda la provincia. Para ello, en cada comarca
se realiza un muestreo seleccionando 10 granjas por comarca. Al
final, tenemos una muestra de 70 granjas formada por la unión de las
muestras obtenidas en cada comarca. Se supone que los siete
muestreos básicos son independientes.
Esto es un caso típico de MUESTREO ESTRATIFICADO y las
mencionadas divisiones se denominan ESTRATOS. El muestreo se
lleva a cabo de forma que en todas y cada una de las divisiones o
estratos se realiza un muestreo.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 11/35
Situación 2: Muestreo por Conglomerados. Una Etapa
En un distrito municipal de una gran ciudad se desea realizar una
encuesta entre la población joven de entre 16 y 25 años, para
estudiar sus hábitos de lectura. Dicho distrito está dividido en 47
secciones censales no muy extensas.
Indiquemos que las secciones censales de un municipio son areas
geográficas de tipo administrativo delimitadas o definidas por ejemplo
por ciertas calles o plazas. Por ejemplo, el Distrito Sur de Sevilla
cuenta con 82 secciones censales.
Para seleccionar la muestra de jóvenes, se selecciona previamente
una muestra de cuatro secciones censales. A continuación, esas
cuatro secciones se estudian de forma exhaustiva o completa, es
decir, todos los jovenes de las mismas son entrevistados. Así, si las
secciones censales de la muestra tienen respectivamente 200, 350,
120 y 250 jóvenes, la muestra final tendrá 920 jóvenes.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 12/35
Situación 2 :Muestreo por Conglomerados. Dos
Etapas
Es una variación del ejemplo anterior. En un distrito municipal de una
gran ciudad se desea realizar una encuesta entre la población joven
de entre 16 y 25 años, para estudiar sus hábitos de lectura. Dicho
distrito está dividido en 75 secciones censales cada una de las
cuales con un número considerable de jóvenes.
Para seleccionar la muestra de jóvenes, se selecciona previamente
una muestra de seis secciones censales. A continuación, en cada
una de esas seis secciones se realiza un muestreo para seleccionar
un conjunto de jóvenes.
Nótese que ahora el muestreo global está compuesto de 1 + 6 = 7
muestreos distintos. En una primera fase o etapa se obtiene la
muestra de secciones, y en una segunda fase o etapa, en cada
sección de la muestra anterior, se obtienen muestras de jóvenes.
Aquí tenemos un caso típico de lo que se denomina MUESTREO
POR CONGLOMERADOS EN DOS ETAPAS, pues hay dos etapas o
fases de muestreo, como se describe en el párrafo anterior.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 13/35
Ideas Fundamentales de los Diseños Complejos
Primera Idea Fundamental.
Existen dos estructuras básicas: ESTRATOS y
CONGLOMERADOS
Segunda Idea Fundamental.
Estructuralmente, los ESTRATOS y los CONGLOMERADOS son las
mismas cosas: PARTES DE LA POBLACIÓN. La diferencia consiste
en:
Su diferente tratamiento muestral. Se hace muestreo en TODOS
Y CADA UNO DE LOS ESTRATOS. Por contra, Se seleccionan
sólo ALGUNOS CONGLOMERADOS a partir de los existentes.
Su diferente finalidad. Los ESTRATOS, supuestos más
homogéneos, REDUCEN ERROR DE ESTIMACIÓN. Los
CONGLOMERADOS PERMITEN y/o FACILITAN el acceso a los
elementos que se van a estudiar.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 14/35
Ideas Fundamentales de los Diseños Complejos
Tercera Idea Fundamental
En la práctica no nos vamos a encontrar, usualmente, con un
muestreo básico o directo de los elementos.
Pero tenemos que decir que ni siquiera nos vamos a encontrar con
situaciones menos simples como un muestreo estratificado o un
muestreo por conglomerados.
Muy al contrario, lo más usual será tener una COMBINACIÓN O
MEZCLA DE DIFERENTES ESTRUCTURAS Y DISEÑOS
MUESTRALES.
Además, a todo esto, hay que añadirle las múltiples posibilidades que
hay al realizar los muestreos básicos, en los que podemos emplear
Muestreo Aleatorio Simple, Muestreo Sistemático Uniforme,
Muestreo con probabilidades variables en sus variadas formas, y un
largo etcétera
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 15/35
Algunos Ejemplos de Mezclas de Diseños
Un muestreo estratificado, en el cual, en cada estrato, se realiza
un muestreo por conglomerados en dos etapas, seleccionando
los conglomerados mediante Probabilidades Variables, y los
elementos posteriores con Muestreo Aleatorio Simple.
Un muestreo por conglomerados en dos etapas, en el cual, la
segunda etapa se realiza mediante Muestreo Aleatorio Simple
estratificado en cada conglomerado.
Un muestreo por conglomerados en dos etapas, en el cual, en la
primera etapa se seleccionan los conglomerados Muestreo
Sistemático, y la segunda etapa es a su vez un muestreo por
conglomerados en dos etapas, ambas mediante Muestreo
Aleatorio Simple.
Un muestreo estratificado, en el cual, en cada estrato, se realiza
un muestreo por conglomerados en dos etapas, y en el cual, a
su vez, la segunda etapa se realiza mediante muestreo
estratificado en cada conglomerado.
Y un largo etcétera de muchas más combinaciones.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 16/35
Diseños Muestrales Complejos
En cualquiera de estas situaciones, sea cual sea la combinación de
procedimientos, al final tenemos como resultante UN DISEÑO
MUESTRAL que es el producto final de la mezcla de todos los
diseños muestrales que intervienen.
Un diseño muestral de este tipo se denomina diseño muestral
complejo. Las muestras obtenidas con tales diseños se pueden por
ello denominar muestras complejas. Los programas de
procesamiento de muestras complejas nos permiten,
Construir este tipo de muestras, mediante distintas opciones de
muestreo, y suponiendo que intervienen diferentes estructuras,
posiblemente combinadas: estratos y conglomerados.
Analizar los datos muestrales para obtener estimaciones de
parámetros.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 17/35
Conceptos Fundamentales: Probabilidades de Inclusión y Pesos
Probabilidades de Inclusión
Si queremos estimar parámetros a partir de un muestreo realizado
con un diseño complejo, por complicado que sea, al final nos vamos
a encontrar con una muestra de elementos, y la clave consiste,
básicamente, en calcular las probabilidades de inclusión.
Estimación de un Total Poblacional
Si queremos estimar el total de la variable Y a partir de una muestra
m, aplicamos el estimador de Horvitz-Thompson,
bty π =
X yi
X
=
ωi yi
πi
i∈m
siendo
i∈m
ωi =
1
πi
∀i ∈ m
Pesos o Ponderaciones
ωi =
1
πi
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 18/35
Estimación de la Media Poblacional
Si lo que queremos estimar es la media poblacional de la variable, es
decir, el parámetro y , podemos emplear nuevamente el estimador de
Horvitz-Thompson,
1 X yi
ybUπ =
N
πi
i∈m
o también el estimador de Hájek,
X
yi /πi
i∈m
ybUHH = X
1/πi
i∈m
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 19/35
Estimadores empleados.
Los programas realizan la estimación de un total poblacional
mediante el estimador de HorvitzThompson,
bty π (Y ) =
X yi
X
=
ωi yi
πi
i∈m
i∈m
siendo yi la variable que se estudia, y ωi = 1/πi los pesos que
suministraremos al programa.
La media poblacional y las proporciones, mediante el estimador
de Hájek,
X
X
ωi yi
yi /πi
i∈m
i∈m
= X
ybUHJ = X
1/πi
ωi
i∈m
i∈m
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 20/35
Cuarta Idea Fundamental
Para realizar estimaciones tenemos que,
Calcular las Probabilidades de Inclusión
y a partir de las mismas Calcular los Pesos
IMPORTANTE
Cuando la muestra a analizar ha sido previamente diseñada y
obtenida mediante SPSS u otro programa, es usual que contenga
información sobre los pesos. Si no tenemos los pesos, ya sea por
que la muestra ha sido obtenida por otros medios, o por otras
razones, tendremos que calcularlos. A continuación vemos algunas
situaciones.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 21/35
Muestreo Aleatorio Simple Básico
Si N es el tamaño de la población, y n es el tamaño de la muestra,
las probabilidades de inclusión son,
πi =
n
N
ωi =
N
n
por lo que los pesos son,
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 22/35
Muestreo con Probabilidades Variables Básicos
Estos muestreos se realizan empleando una variable de TAMAÑO,
de tal forma que los elementos “MÁS GRANDES” tengan más
probabilidad de ser seleccionados. Si denotamos Xi a dicha variable,
T (X ) a la suma, sobre la población, de todos los tamaños, y n al
tamaño de la muestra, las probabilidades de inclusión son,
πi =
nXi
T (X )
por lo que los pesos son
ωi =
T (X )
nXi
Uno de los procedimientos de este tipo más empleados es el método
de Sampford. Dicho método permite obtener n elementos
muestrales sin reemplazamiento y con probabilidades de inclusión
variables y proporcionales a Xi . SPSS tiene implementado este
método.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 23/35
Muestreo Aleatorio Simple Estratificado
Para simplificar supongamos dos estratos, de tamaños N1 y N2 , en
los que se seleccionan respectivamente n1 y n2 elementos mediante
sendos muestreos aleatorios simples en cada estrato. Las
probabilidades de inclusión son,
πi =
n1
n2
en el estrato 1 y πi =
en el estrato 2
N1
N2
por lo que los pesos son,
ωi =
N1
N2
en el estrato 1 y ωi =
en el estrato 2
n1
n2
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 24/35
Muestreo por Conglomerados en Una Etapa. Selección de
Conglomerados mediante Muestreo Aleatorio Simple
Supongamos que hay M conglomerados, y se seleccionan g. La
probabilidad de inclusión de un elementos será la del conglomerados
al que pertenece, es decir,
πi =
g
M
ωi =
M
g
por lo que los pesos son,
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 25/35
Muestreo por Conglomerados en Dos Etapas. Selección de
Conglomerados y Elementos mediante Muestreo Aleatorio Simple
Supongamos que hay M conglomerados, y se seleccionan g. En
cada conglomerado k , con Nk elementos, seleccionamos nk
elementos finales también mediante muestreo aleatorio simple. La
probabilidad de inclusión de un elementos será la del conglomerados
al que pertenece multiplicada por la del elemento dentro del
conglomerado, es decir,
g nk
πi =
M Nk
por lo que los pesos son,
ωi =
M Nk
g nk
En general, habrá tantos pesos distintos como conglomerados.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 26/35
Muestreo por Conglomerados en Dos Etapa. Selección de
conglomerados con Probabilidades Variables, y de Elementos
mediante Muestreo Aleatorio Simple
Supongamos que hay M conglomerados, y se seleccionan g. La
selección se hace, por ejemplo mediante el método de Sampford,
empleando el tamaño de los conglomerados como variable tamaño.
Supongamos que la suma de todos los tamaños es N
En el conglomerado k , con Nk elementos, seleccionamos nk
elementos finales mediante muestreo aleatorio simple. La
probabilidad de inclusión de un elementos será la del conglomerados
al que pertenece multiplicada por la del elemento dentro del
conglomerado, es decir,
πi =
gnk
gNk nk
=
N Nk
N
por lo que los pesos son,
ωi =
N
gnk
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 27/35
Variables de Estructura
Estratos
Para definir y manejar una estructura de estratos los progamas
emplearán una o varias variables, cuyos diferentes niveles
determinarán dichos estratos.
Conglomerados
Iguamente, para definir y manejar una estructura de conglomerados
se emplearán también una o varias variables, cuyos diferentes
niveles determinarán dichos conglomerados.
Subpoblaciones
Es usual, al realizar las estimaciones de los parámetros, hacerlo
tanto para la población total, como para partes o subpoblaciones de
la misma. Iguamente, para definir subpoblaciones se emplearán una
o varias variables, cuyos diferentes niveles determinarán dichos
conglomerados.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 28/35
Variables de Estructura
Ejemplo
En una población de individuos los conglomerados están definidos
por secciones censales, SC, y los estratos por el cruce de
SEXO:[H,M] y grupos de EDAD:[A,B,C]. A:jóvenes, B:intermedios,
C:Mayores. Tendremos múltiples variables, y tres de ellas serán las
anteriores,
VAR01
VAR02 ...... SEXO
EDAD
SC
VAR09
-------------------------------------------------....
....
......
V
B
23
....
....
....
......
M
A
23
....
....
....
......
M
B
34
....
....
....
......
V
B
34
....
....
....
......
V
A
53
....
....
....
......
...
...
.... ....
-------------------------------------------------Las variables SEXO y EDAD definen pues una estructura de seis estratos.
La variable SC define la estructura de conglomerados. Además, la variable
SEXO podría ser utilizada para desagregar las estimaciones.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 29/35
Error de Muestreo
Error, Intervalo de Confianza, Contrastes
La estimación de parámetros a partir de una muestra es un proceso
inferencial, y por consiguiente conlleva un error.
El “software” usual proporciona una medida del error de muestreo
denominándolo error típico, cuyo significado es la desviación típica
estimada de la estimación, es decir, si θ es el parámetro que se
estima, el error típico o “standard error” [SE en el “package”
SURVEY],
q
b [θ]
b =σ
b
Error Típico = V
También proporcionan un intervalo de confianza, basado en la
distribución normal o la distribución t de Student, de la forma por
ejemplo,
g.l.
g.l.
(θb − σ
b t1−α/2 , θb + σ
b t1−α/2 )
Siendo g.l. los grados de libertad calculados como la diferencia entre
el número de unidades muestrales y el de estratos, en la primera
etapa.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 30/35
Cálculo del Error de Muestreo
Probabilidades de inclusión de segundo orden, πij
Las fórmulas matemáticas que permiten calcular el error de muestreo
cuando se realiza un muestreo usual, sin reemplazamiento, necesitan
como datos las probabilidades de inclusión de segundo orden, πij .
En procesos de selección basados en muestreo aleatorio simple,
estas probabilidades son muy sencillas y los programas las pueden
calcular mediante una fórmula del tipo,
πij =
n(n − 1)
N(N − 1)
siendo n el tamaño muestral y N el tamaño poblacional.
El problema se presenta si nuestro muestreo complejo contiene una
primera etapa de selección de conglomerados mediante un
procedimiento muestral sin reemplazamiento, con probabilidades
variables pues en tal caso, el cálculo de la πij no es tan simple, y
además depende del método empleado.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 31/35
Cálculo del Error de Muestreo
Caso A: Disponemos de un fichero con las πij
Esto sería lo ideal, pues podemos calcular el error de muestreo de
forma exacta. Esta situación es la que tendremos usualmente cuando
la muestra haya sido construida también mediante SPSS, pues en tal
caso este programa se crea automáticamente un fichero con las πij .
En este caso, sólo será necesario indicarle a SPSS el mencionado
fichero con las πij , con lo que el programa realizará los cálculos de
forma automática.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 32/35
Cálculo del Error de Muestreo
Caso B: No tenemos las πij , ni podemos o no queremos calcularlas.
En esta situación, existe la posibilidad de indicar a SPSS, aunque no
sea cierto, que el muestreo de conglomerados en la primera etapa se
ha realizado CON reemplazamiento. La teoría del Muestreo prueba
que para este tipo de muestreos, basta con probabilidades de primer
orden para estimar el error. Para muchos diseños muestrales
usuales, esto produce una ligera sobrestimación del error.
IMPORTANTE: no es que el error aumente, es que SPSS da un valor
algo mayor [Enfoque conservador].
El “package” SURVEY, por defecto, supone que la muestra se ha
obtenido con reemplazamiento, aunque permite también la
posibilidad de calcular el error de muestreo a partir de fórmulas
aproximadas para las πij , e incluso emplear fórmulas exactas
suministrando las probabilidades de inclusión de segundo orden.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 33/35
Efecto del Diseño
Comparación con el Muestreo Aleatorio Simple Básico
Cuando se emplea un diseño complejo es interesante comparar el
error que se obtiene con el que se obtendría aplicando Muestreo
Aleatorio Simple Básico.
SAS, SPSS y R[survey] pueden realizar esta comparación,
calculando el efecto del diseño, que no es otra cosa que,
EFD =
b
V
nuestro diseño
b
V
M.A.S. básico
es decir, el cociente entre las varianzas estimadas de nuestreo
diseño y del Muestreo
√ Aleatorio Simple Básico. Aunque es más
indicativo calcular EFD pues el error típico viene dado a partir de la
desviación típica.
INTERPRETACIÓN: Según sea menor o mayor que 1, indica si
nuestro diseño produce menos o más error que un Muestreo
Aleatorio Simple Básico, que se emplea como referencia.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 34/35
Bibliografía
Fernández García, F.R. y Mayor Gallego, J.A. (1995). Muestreo en
poblaciones finitas: Curso básico. E.U.B. Ediciones Universitarias de
Barcelona.
Lohr, S.L. (2010). Sampling: Design and Analysis. 2nd. Edition.
Brooks/Cole. International Edition.
Särndal, C., Swensson, B. and Wretman, J. (1992). Model Assisted
Survey Sampling. Springer-Verlag. New York, Inc.
MÁSTER EN MATEMÁTICA AVANZADA: Métodos Estadísticos Avanzados.
Diseños Muestrales Complejos
C B 35/35
Descargar