Muestreo Aleatorio Estratificado (MAE) Una región geográfica puede ser estratificada en áreas similares de acuerdo a cierta variable conocida: Tipo de hábitat, elevación, tipo de suelo. Las poblaciones humanas pueden ser estratificadas con base en: Región geográfica, tamaño de ciudad, sexo, factores socioeconómicos, demográficos etc. h = estrato yih = variable de interes asociada a la i-ésima unidad de; estrato h Nh = Número de unidades en el estrato h (o población del estrato h) nh= Número de unidades en la muestra del estrato h L= Número de estratos N h1 N h L Numero total de unidades en la población : Tamaño total de la muestra: n h1 nh Total de los valores de la variable en el estrato h: h i1h Yhi L N Media para el estrato h: h h Nh h1 h L Total poblacional (todos los estratos): Media poblacional (Todos los estratos): N La figura muestra una muestra aleatoria estratificada de una población de N = 400 unidades. Los tamaños de los L = 4 estratos son N1= 200, N2= 100, N3= N4= 50. Dentro de cada estrato una muestra aleatoria sin reemplazo ha sido seleccionada de manera independiente. El tamaño total de la muestra de n=40 se asignó para cada estrato de manera proporcional a su tamaño de manera que n1= 20, n2= 10, n3= n4= 5. Asignación en MAE Si no se tiene información previa de la población (del tamaño de los estratos en la población: n nh L (Estratos del mismo tamaño) Asignación Proporcional Si los estratos varían en tamaño pero no se conoce ningún parámetro poblacional en relación a las variables bajo estudio, el tamaño del estrato h es: nN h nh N Asignación optima Es el esquema que estima la media poblacional con la varianza total menor para un tamaño de muestra n es: nh nN h h Lk 1 N k k Donde N k es el tamaño del k-ésimo estrato h y k su desviación estándar. Estimación del Total poblacional (toda la población) L ˆ st ˆh h1 (La suma de los totales de cada estrato) ˆ st = total poblacional de una muestra estratificada. Un estimador de la varianza del estimado estratificado es L vˆar ˆ st vˆar ˆ h h1 El estimador del total del estrato h es: y la media del estrato h es: ˆ h N h y h yh 1 nh nh y hi i1 L Estimador para el total poblacional = ˆ st N h y h h1 L Estimador de la varianza del total poblacional = (el error estándar es la raíz cuadrada de la varianza) Donde: s2h vˆar ˆ st N h N h nh h1 s2h nh 1 nh 2 y y nh 1 i1 hi h es la varianza muestral para el estrato. Asignación, Ejemplo Una población consiste en tres estratos de tamaño N1= 150, N2= 90, N3=120. De manera que la población total es de N-=360. De acuerdo a las desviaciones estándar de estudios anteriores las desviaciones para cada estrato se calculan como 1= 100, 2= 200, y 3=300 a) Por medio de asignación proporcional, cuál sería el tamaño de muestra para cada estrato para una muestra de n= 12? b) ¿Cuál sería el tamaño de muestra para cada estrato con una muestra de tamaño n = 12 usando el esquema de asignación óptima? Estimación de la media poblacional con muestreo aleatorio estratificado Un estimador insesgado de la media poblacional es la media poblacional estratificada: y st 1 N L Nh y h h1 Un estimador insesgado de su varianza es: vˆar y st L 1 N s2 N N h nh h 2 h n h h1 Intervalos de confianza I.C. ˆ st t vˆar ˆ st ˆ st t vaˆ r ˆ st I.C. y donde t es el nivel de confianza expresado como valor Z. Para muestras menores a nh = 30 se utiliza la distribución t en vez de la distribución normal. Para aproximar los grados de libertad se puede utilizar la siguiente fórmula: 2 L d a h sh2 h1 L 2 a h sh h1 2 n h 1 donde ah N h N h n h nh Si todos los tamaños de estratos Nh son iguales y los tamaños de muestra nh son iguales, los grados de libertad son d = n - L Ejemplo La tabla siguiente muestra los resultados de una muestra aleatoria estratificada. Los estratos representan tipos de familias de acuerdo a su condición económica en una colonia del DF. La variable de interés son el número de hijos por familia menores de 18 años que viven actualmente en casa. Las medias para cada estrato han sido previamente calculadas con sus respectivas varianzas. Estima la media de hijos por familia en esta colonia así como el total poblacional (número total de hijos menores de 18 años que viven actualmente en casa en la colonia) así como sus varianzas respectivas. Calcula un intervalo de confianza para cada estimador usando tanto la distribución normal como la t. Estrato h (1) Ingreso bajo (2) Ingreso medio (3) Ingreso alto Nh nh Población del estrato 9 20 12 Número de familias en la muestra por estrato 3 5 4 yh # de hijos < 18 2.8 1.6 0.6 s 2h 4.0 3.3 2.2