Muestreo Aleatorio Estratificado (MAE)

Anuncio
Muestreo Aleatorio Estratificado (MAE)
Una región geográfica puede ser estratificada en áreas similares de acuerdo a cierta variable conocida: Tipo
de hábitat, elevación, tipo de suelo. Las poblaciones humanas pueden ser estratificadas con base en: Región
geográfica, tamaño de ciudad, sexo, factores socioeconómicos, demográficos etc.
h = estrato
yih = variable de interes asociada a la i-ésima unidad de; estrato h
Nh = Número de unidades en el estrato h (o población del estrato h)
nh= Número de unidades en la muestra del estrato h
L= Número de estratos
N   h1 N h
L
Numero total de unidades en la población :
Tamaño total de la muestra:
n  h1 nh
Total de los valores de la variable en el estrato h:
 h   i1h Yhi
L
N
Media para el estrato h:
h 
h
Nh
   h1 h
L
Total poblacional (todos los estratos):
Media poblacional (Todos los estratos):


N
La figura muestra una muestra aleatoria estratificada de
una población de N = 400 unidades. Los tamaños de
los L = 4 estratos son N1= 200, N2= 100, N3= N4= 50.
Dentro de cada estrato una muestra aleatoria sin
reemplazo ha sido seleccionada de manera
independiente. El tamaño total de la muestra de n=40
se asignó para cada estrato de manera proporcional a
su tamaño de manera que
n1= 20, n2= 10, n3= n4= 5.
Asignación en MAE
Si no se tiene información previa de la población (del tamaño de los estratos en la población:
n
nh 
L (Estratos del mismo tamaño)
Asignación Proporcional
Si los estratos varían en tamaño pero no se conoce ningún parámetro poblacional en relación a las variables
bajo estudio, el tamaño del estrato h es:
nN h
nh 
N
Asignación optima
Es el esquema que estima la media poblacional con la varianza total menor para un tamaño de muestra n es:
nh 
nN h h
Lk 1 N k k
Donde N k es el tamaño del k-ésimo estrato h y  k su desviación estándar.
Estimación del Total poblacional (toda la población)
L
ˆ st  ˆh
h1
(La suma de los totales de cada estrato)
ˆ st = total poblacional de una muestra estratificada.
Un estimador de la varianza del estimado estratificado es
L
vˆar ˆ st    vˆar ˆ h 
h1
El estimador del total del estrato h es:
y la media del estrato h es:
ˆ h  N h y h
yh 
1
nh
nh
 y hi
i1
L
Estimador para el total poblacional =
ˆ st   N h y h
h1
L
Estimador de la varianza del total poblacional =
(el error estándar es la raíz cuadrada de la varianza)
Donde:
s2h 
vˆar ˆ st    N h N h  nh 
h1
s2h
nh
1 nh
2
 y  y 
nh 1 i1 hi h es la varianza muestral para el estrato.
Asignación, Ejemplo
Una población consiste en tres estratos de tamaño N1= 150, N2= 90, N3=120. De manera que la
población total es de N-=360. De acuerdo a las desviaciones estándar de estudios anteriores las
desviaciones para cada estrato se calculan como 1= 100, 2= 200, y 3=300
a) Por medio de asignación proporcional, cuál sería el tamaño de muestra para cada estrato para una
muestra de n= 12?
b) ¿Cuál sería el tamaño de muestra para cada estrato con una muestra de tamaño n = 12 usando el
esquema de asignación óptima?
Estimación de la media poblacional con muestreo aleatorio estratificado
Un estimador insesgado de la media poblacional es la media poblacional estratificada:
y st 
1
N
L
 Nh y h
h1
Un estimador insesgado de su varianza es:
vˆar y st  
L
1
N
s2
N N h  nh  h
2  h
n
h
h1
Intervalos de confianza
I.C.  ˆ st  t vˆar ˆ st 
ˆ st  t vaˆ r
ˆ st 
I.C.  
y
donde t es el nivel de confianza expresado como valor Z.
Para muestras menores a nh = 30 se utiliza la distribución t en vez de la distribución normal. Para aproximar
los grados de libertad se puede utilizar la siguiente fórmula:
2
 L

d   a h sh2 
h1

 L
2
 a h sh
h1
 
2

n h  1

donde
ah  N h N h  n h  nh
Si todos los tamaños de estratos Nh son iguales y los tamaños de muestra nh son iguales, los grados de
libertad son d = n - L
Ejemplo
La tabla siguiente muestra los resultados de una muestra aleatoria estratificada. Los estratos
representan tipos de familias de acuerdo a su condición económica en una colonia del DF. La variable de
interés son el número de hijos por familia menores de 18 años que viven actualmente en casa. Las medias
para cada estrato han sido previamente calculadas con sus respectivas varianzas.
Estima la media de hijos por familia en esta colonia así como el total poblacional (número total de
hijos menores de 18 años que viven actualmente en casa en la colonia) así como sus varianzas respectivas.
Calcula un intervalo de confianza para cada estimador usando tanto la distribución normal como la t.
Estrato h
(1) Ingreso bajo
(2) Ingreso medio
(3) Ingreso alto
Nh
nh
Población
del estrato
9
20
12
Número de familias en la
muestra por estrato
3
5
4
yh
# de hijos < 18
2.8
1.6
0.6
s 2h
4.0
3.3
2.2
Descargar