MUESTREO ESTRATIFICADO MUESTREO ESTRATIFICADO • El muestreo estratificado consiste en dividir la población en L subconjuntos o estratos, y de cada uno de ellos seleccionar una muestra probabilística; de manera independiente de un estrato a otro. Existen tres razones importantes para utilizar este tipo de muestreo: i. estadísticas, ii. marcos; y de iii. costos. MUESTREO ESTRATIFICADO Se supone que se conoce el número de unidades en cada estrato (Nh). Aunque esto se verá después, es importante señalar que si se usan estimadores de razón o de regresión o si el muestreo se hace con probabilidad proporcional al tamaño, los estratos se forman con subconjuntos de unidades donde sea constante la proporcionalidad de Y a X, aunque esa proporcionalidad cambie de estrato a estrato. i. La razó razón estadí estadística ocurre cuando la población está constituida por unidades heterogé heterogéneas y podemos tener una idea previa de los grupos de unidades más homogéneas entre sí, entonces es conveniente formar estratos. Los estratos son subconjuntos de la población que agrupan unidades homogé homogéneas, neas aunque sean heterogé heterogéneas entre estratos. estratos Cada estrato se muestrea por separado y se obtienen los estimadores de parámetros (totales, medias, proporciones) para cada estrato. MUESTREO ESTRATIFICADO Como ejemplos de la razón estadística para usar estratos, considérense: (a) En un muestreo donde interesa conocer alguna característica de los hogares en la Ciudad de México (por ejemplo: gastos en alimentos, ropa, ingresos, tipo de casa habitación, años de escolaridad del padre, número de hijos, etcétera). Se sabe que esas características dependen fuertemente del nivel socioeconómico de las familias, por lo tanto conviene hacer estratos considerando áreas de la ciudad con niveles socioeconómicos semejantes. 1 MUESTREO ESTRATIFICADO MUESTREO ESTRATIFICADO (b) En un muestreo para estimar la cosecha total de café en México, se conocía que el estado fisiológico, edad y estado de sanidad de los árboles influye mucho en su producción. Entonces, se tomaron como estratos, categorías de árboles bien definidas y homogéneas en lo que respecta a edad, estados fisiológicos y de sanidad. Además, los predios se agruparon en estratos de acuerdo a la región ecológica donde estaban ubicados. Esto es porque la productividad del café varía según las condiciones ecológicas como altura sobre el nivel del mar, vientos, temperaturas extremas, etcétera. Así, las colonias se pueden clasificar a priori con relación al nivel socioeconómico como: muy alto, alto, medio, medio bajo y bajo, formando de esta manera cinco estratos. La encuesta se planea para cada estrato por separado. El efecto de formación de estratos es reducir la variabilidad de los estimadores. La variabilidad de Yˆ se puede reducir mucho si los estratos son muy homogé homogéneos dentro de cada uno de ellos y heterogé heterogéneos entre los mismos. MUESTREO ESTRATIFICADO (c) En una encuesta para estimar el consumo de energía eléctrica es conveniente agrupar las fábricas en estratos, así quedarían agrupadas en: fábricas grandes, fábricas pequeñas, empresas de producción familiar y un estrato final constituido por casahabitación. Esto, porque sabemos que el consumo de electricidad va a ser muy variable entre estratos, y esperamos que sea menor dentro de estos. MUESTREO ESTRATIFICADO ii. Otra razón poderosa para formar estratos es la disponibilidad de marcos. marcos Si para una parte de la población se tiene un buen marco, éste se usa para el muestreo de esa parte y la o las otras partes de la población se muestrean usando otros marcos más imprecisos y, posiblemente distintos esquemas (diseños) de muestra. 2 MUESTREO ESTRATIFICADO Por ejemplo, ejemplo en encuesta de hogares se cuenta con un buen marco para la zona urbana de construcción antigua; pero las zonas rurales y las urbanas de construcción reciente no tienen un marco adecuado. Entonces se utilizan planos catastrales para las zonas urbanas antiguas (un estrato), se usan fotografías aéreas para zonas rurales (otro estrato) y las áreas de posible nueva urbanización (otro estrato) se delimitan como otro marco; se muestrean áreas y se investigan las nuevas urbanizaciones (muestreo en etapas o conglomerados). MUESTREO ESTRATIFICADO • Lo más frecuente es que los tres criterios para formación de estratos coincidan, coincidan de modo que los estratos formen unidades homogéneas con un mismo tipo de marco y con costos de localización y captación de información semejantes. semejantes MUESTREO ESTRATIFICADO iii. Otra razón más para construir estratos puede ser el costo de localizar y levantar la información de las unidades, por ejemplo: si en una encuesta de predios agrícolas hay una región cuyo acceso es difícil (por avión o a caballo únicamente), esa región puede constituir un estrato, que será muestreado con un tamaño de muestra pequeño. MUESTREO ESTRATIFICADO • Se pueden utilizar diferentes formas de muestreo en los diferentes estratos, estratos sin embargo, se considerará en este escrito como una introducción al tema, aquel en el cual cada estrato se muestrea usando “mas”. Más adelante se consideran las muestras complejas, donde se amplia el uso de estratos. 3 MUESTREO ESTRATIFICADO MUESTREO ESTRATIFICADO • Valores Poblacionales • Considérese la siguiente notación: Yhi valor de la medición en el elemento i-ésimo del estrato h-ésimo. Nh= número de unidades en estrato h-ésimo; L N = ∑ N h total de unidades en la población. h=1,2,...,L; h =1 Nh ∑Y L= número de estratos. Yh = MUESTREO ESTRATIFICADO Yh = N hYh = ∑ Yhi total poblacional del estrato i =1 S h2 = ∑ (Y i =1 hi − Yh ) Nh −1 hi h-ésimo. 2 media poblacional del estrato h-ésimo. Nh MUESTREO ESTRATIFICADO L Nh Nh i =1 L Nh Y = ∑ Yh = ∑∑ Yhi h =1 total de toda la población. h =1 i =1 L Y = ∑ Nh Y h h =1 varianzas poblacionales del estrato h-ésimo. Y = Y ∑ Nh media de los valores Yhi en toda la población. 4 MUESTREO ESTRATIFICADO Wh = L ∑W h =1 h Nh N proporción del tamaño del estrato h-ésimo. MUESTREO ESTRATIFICADO • Valores muestrales En esta parte se considera cualquier estrategia de muestreo probabilístico en cada estrado, incluso pueden ser diferentes de un estrato a otro. =1 MUESTREO ESTRATIFICADO Supóngase que de manera independiente se toman muestras de cada estrato. Sea nh el tamaño de muestra en el estrato h-ésimo. La muestra total es L n = ∑ nh h =1 MUESTREO ESTRATIFICADO Supóngase que se quiere estimar el total de la población, esto es L L Nh Y = ∑ Yh = ∑∑ Yhi h =1 h =1 i =1 Para esto con la muestra de cada estrato se estima el total, sea Yˆh el estimador insesgado o con sesgo despreciable para el caso de estimadores de razón o de regresión, su varianza V (Yˆh ), además, sea Vˆ (Yˆh ) un estimador de esa varianza. 5 MUESTREO ESTRATIFICADO El estimador del total es L Yˆ = ∑ Yˆh h =1 MUESTREO ESTRATIFICADO La varianza del estimador del total es L V (Yˆ ) = V (Yˆ ) , ∑ h =1 h la suma de los estimadores de los totales de los estratos (es un estimador insesgado). que es la suma de las varianzas de los estimadores de los totales de estratos. Esto es válido con cualquier diseñ diseño de muestra y estimadores por estrato, los que pueden ser distintos en los diferentes estratos. Esto es por tener muestras independientes en los estratos. MUESTREO ESTRATIFICADO Además el estimador de la varianza del estimador del total es: L Vˆ (Yˆ ) = ∑ Vˆ (Yˆh ) h =1 MUESTREO ESTRATIFICADO Suponiendo distribució distribución normal de Yˆ se tiene: P Yˆ − Y < 1.96 V (Yˆ ) = .95 ⇒ P Yˆ − 1.96 Vˆ (Yˆ ) ≤ Y ≤ Yˆ + 1.96 Vˆ (Yˆ ) =& .95 6 MUESTREO ESTRATIFICADO Si no se puede suponer normalidad úsese el valor 4.4 en lugar de 1.96 (T. Tchebycheff). • Estas expresiones para Yˆ son válidas para cualquier forma de muestrear estratos. MUESTREO ESTRATIFICADO • La primera aproximación al uso de estratos es considerar que se usa “mas” en cada estrato entonces: n h Yˆh = N h yh = N h ∑y i =1 hi nh = N hYˆh donde yhi son los valores observados en la unidad i-ésima de la muestra (tamaño nh) del estrato h-ésimo. MUESTREO ESTRATIFICADO MUESTREO ESTRATIFICADO El estimador del total poblacional es: L L h =1 h =1 Yˆ = ∑ Yˆh = ∑ N h yh (6.1) nh y ⇒ Yˆ = ∑ N h ∑ hi h =1 i =1 nh L L nh = ∑∑ h =1 i =1 Nh yhi nh N donde h corresponde al factor de expansión, nh de las unidades obtenidas en cada estrato. Su varianza teórica es: L L h =1 h =1 V (Yˆ ) = ∑ V (Yˆh ) = ∑ N h2V ( yh2 ) n S2 = ∑ N h2 1 − h h h =1 N h nh L (6.2) Esta varianza se estima al sustituir S2h por su estimador en cada estrato. 7 MUESTREO ESTRATIFICADO Recurriendo al Teorema central del lí límite, mite para cada estrato yh ~N [Yh , V ( yh )] , se tendrá que Yˆ ~N [Y , V (Yˆ )] . El estimador insesgado de S2h es ∧ 2 S h nh =∑ ( yhi − yh ) nh − 1 i =1 2 . Nótese que Sˆh es la misma expresión que S2h, pero la primera es con valores de la muestra y la segunda con los valores de todo el estrato h-ésimo. 2 6. MUESTREO ESTRATIFICADO Si se estima V (Yˆ ) , se puede construir un intervalo de confianza aproximado para el total de la población: [ MUESTREO ESTRATIFICADO ] P Yˆ − 1.96 Vˆ (Yˆ ) < Y < Yˆ + 1.96 Vˆ (Yˆ ) =& 0.95 (6.3) Al dividir cada término de (6.3) entre N = ∑ N h , tenemos el intervalo de confianza para Y , la media de la población. Esto es mucho más factible aunque cada yh no tenga distribución normal, si se tienen muchos estratos. Se puede decir que los errores de estimación tienden a cancelarse de un estrato a otro. 6. MUESTREO ESTRATIFICADO Si se considera que la muestra es grande en cada estrato, la muestra total será mayor aún. Esto justifica el uso del valor 1.96 en lugar del valor de las tablas de t. Nótese que: L n Sˆ 2 Vˆ (Yˆ ) = ∑ N h2 1 − h h h =1 N h nh (6.4) 8 6. MUESTREO ESTRATIFICADO Si lo que se quiere estimar es Y , se tendrá que, L Yˆ Yˆ = = N ∑N h =1 N h yh L =∑ h =1 L Nh yh = ∑ Wh yh N h =1 (6.5) N donde Wh = h proporción del tamaño de estrato N h-ésimo. 6. MUESTREO ESTRATIFICADO De manera semejante, el intervalo de confianza aproximado para Y es el siguiente: P Yˆ − 1.96 Vˆ (Yˆ ) ≤ Y ≤ Yˆ + 1.96 Vˆ (Yˆ ) =& 0.95 Aún con muestras chicas en cada estrato (nh = 2,3,4) si se tienen mas de 10 estratos se puede tener normalidad para Yˆ , esto en virtud de la compensación de errores. 6. MUESTREO ESTRATIFICADO Nótese que (6.5) es un promedio ponderado de los promedios muestrales y su varianza es: () L n S2 V Yˆ = ∑ Wh2 1 − h h h =1 N h nh (6.6) la que se estima con: L n Sˆ 2 Vˆ (Yˆ ) = ∑ Wh2 1 − h h h =1 N h nh (6.6a) 6. MUESTREO ESTRATIFICADO • Proporciones Si lo que se requiere estimar es P, la proporción de elementos de la población que tienen una característica determinada, se usan las equivalencias dadas por Yh = Ph , yh = ph , L Pˆ = ∑ Wh ph , h =1 n p (1 − ph ) Vˆ (Yˆ ) = Vˆ ( Pˆ ) = ∑ Wh2 1 − h h N nh h =1 h L 9 6. MUESTREO ESTRATIFICADO Estas equivalencias surgen al considerar que 1 Si la unidad i-ésima del estrato h tiene la característica 0 De otro modo Yhi= 6.1 Distribución (afijación) de la Muestra a los Estratos Antes de considerar el problema de la determinación del tamaño de muestra, se discute la forma de distribuir el tamaño de muestra total, n, a los diferentes estratos. 6. MUESTREO ESTRATIFICADO • Sólo si las Ph son muy diferentes de estrato a estrato, vale la pena estratificar. • Si .2 ≤ Ph ≤ .8 ∀ h , no conviene usar los estratos. 6.1.1. Distribución Proporcional • Un criterio es lo que se le llama distribució distribución (afijació (afijación) proporcional, proporcional, donde la muestra se divide de manera proporcional a los tamaños de los estratos Nh. 10 6.1.1. Distribución Proporcional Se busca que se cumpla la relación: nh N h = = Wh . n N De esta relación se tiene: nh = n 6.1.1. Nh = nWh N (6.7) Distribución Proporcional También se emplea cuando el muestreo o encuesta va a determinar varias caracterí características (varias mediciones) en cada unidad de la población, incluso cuando se quiere que sea “autoponderado”, es decir, todos los elementos de la muestra tienen un mismo factor de expansión N h = N . nh n 6.1.1. Distribución Proporcional Esta distribución de la muestra total se usa cuando no se tiene informació información sobre la magnitud de las S2h, o que esas S2h sean semejantes; se usa además cuando los costos de muestrear las unidades en los diferentes estratos son semejantes. semejantes 6.1.1. Distribución Proporcional Con esta distribución proporcional se tiene: N Yˆ = ∑ Yˆh =∑ N h yh =∑ h h =1 h =1 h =1 nh L L L L nh ∑y i =1 hi nh = k ∑∑ yhi h =1 i =1 donde k= Nh N N = h = . nh n N h n N 11 6.1.2 Distribución Óptima • Cuando se tienen costos muy diferentes para el muestreo de unidades en los diferentes estratos, se usa la distribució distribución (afijació (afijación) óptima. ptima Si el costo para obtener información de una unidad en el estrato h-ésimo es Ch, el costo total L será: C = C0 + Ch nh (6.8) ∑ h =1 C0 es costo administrativo, administrativo de instalación, etcétera, general. 6.1.2 Distribución Óptima • Para cualquier diseño de muestreo en los estratos, la varianza del estimador del total se podrá expresar como: V (Yˆh ) = Ah + (cte. que no involucra nh ) nh 6.1.2 Distribución Óptima La minimización (variando las nh, sin cambiar otras condiciones), de la varianza del estimador (6.2) con costo fijo (6.8) o viceversa, produce la distribució distribución óptima que es: nh = n N h Sh L N h Sh ∑ Ch h =1 Ch nh ∝ −1 (6.9) N h Sh Ch Esto es para muestreo “mas” mas” en todos los estratos. 6.2 Tamaño de Muestra Total • Si lo que se quiere es encontrar aquel valor de n que produce la mí mínima varianza para un costo total fijo C0, se deberá usar la expresión (6.9) y sustituir en (6.8). Entonces la distribució distribución óptima es: es −1 Ah L Ah Ah nh = n ∑ , nh ∝ Ch h =1 Ch Ch 12 6.2 Tamaño de Muestra Total Entonces tenemos: n= L ( C − C0 ) ∑ h =1 N h Sh Ch L ∑ N h S h Ch (6.10) 6.2 Tamaño de Muestra Total Si lo que se quiere es encontrar el valor de n que produce el costo mí mínimo para un error de estimación δ determinado, entre el estimador del total y el verdadero total, entonces se tiene δ = 1.96 V (Yˆ ) . h =1 Esto es usando la distribución óptima. Los valores de Sh se deberán obtener con base en muestras piloto de cada estrato, estrato o bien por conocimiento previo de la forma de la distribución en cada estrato y el rango de variación. 6.2 Tamaño de Muestra Total • Las expresiones (6.10) y (6.11) se refieren a la estimación del total. Para estimar un promedio, Y , la expresión (6.10) sigue siendo válida pero la (6.11) debe modificarse: ˆ ˆ ˆ ˆ P Y − 1.96 V (Y ) ≤ Y ≤ Y + 1.96 V (Y ) =& .95 14243 δ () δ = 1.96 V Yˆ Si se sustituye la varianza de la expresión (6.2) con distribución óptima, se obtiene: L L N S N h S h Ch ∑ h h ∑ (6.11) h =1 h =1 Ch n= 2 L δ + ∑ N h S h2 2 (1.96 ) h =1 6.2 Tamaño de Muestra Total Sustituyendo la varianza por la expresión (6.6) y con nh óptimo se tiene: L N S S h Ch ∑ h h h =1 h =1 Ch n= 2 δ 1 L + 2 ∑ N h Sh2 2 N h =1 (1.96) L Nh ∑N 2 (6.11´) Donde ahora δ es el error máximo permisible, con confianza del 95%, entre el estimador del promedio Yˆ , y el promedio poblacional Y . Nótese que las δ en expresiones (6.11) y (6.11’) son muy diferentes. diferentes 13 6.2 Tamaño de Muestra Total • Las expresiones (6.10), (6.11) y (6.11’) se usan cuando se quiere optimizar algo que involucra el costo. costo 6.3 Distribución Proporcional • Si se va a usar la distribución proporcional se puede recurrir a la expresión de la varianza que es: L N h2 2 V (Yˆ ) = S h − N h S h2 (6.12) ∑n h =1 • Si el costo no es determinante y si se usa la distribución óptima para Ch constante, constante (6.10) no deberá deberá usarse. usarse • Es importante enfatizar que en (6.10), (6.11) y (6.11’) se usa la distribució distribución óptima. 6.3 Distribución Proporcional Con este valor en lugar de las S2, se pueden usar las expresiones (5.3) y (5.4) para obtener n. Si se sustituye nh = N V (Yˆ ) = n ∑ h Nh n se tiene: N L ∑N S −∑N S h h =1 2 h h 2 h (6.12)´ 6.3 Distribución Proporcional de donde: L • Si se quiere tener un coeficiente de variación fijo (CVo), sin tomar en cuenta el tipo de distribución del estimador Yˆ , se tendrá : V (Yˆ ) CV0 = Y 1 N ∑ N h S h2 n= (6.13) h =1 Y 2 ( CV0 ) 2 L + ∑ Nh S h =1 2 h 2 , 14 6.3 Distribución Proporcional [ 6.3 Distribución Proporcional ] • Si se considera que Yˆ ~ Y , V (Yˆ ) y se desea tener: [ ] P | Yˆ − Y |< δ = 1 − α , L zα / 2 = de aquí se tiene que n= δ V (Yˆ ) 1 N ∑N S h =1 h 2 h − 1 N2 L ∑N S h =1 δ2 h h =1 L (6.14) + ∑ N h Sh2 h =1 6.4 Conclusiones • Es relativamente sencillo modificar las expresiones (6.13) y (6.14) para considerar la estimación de Y . El cambio fundamental está en que se debe sustituir Yˆ por Yˆ que es Yˆ , entonces: 1 1 V (Yˆ ) = 2 V (Yˆ ) = N nN N ∑ N h S h2 z α2 / 2 2 6.3 Distribución Proporcional L de donde a partir de V (Yˆ ) se obtiene que n debe de ser: 2 h . • Si se considera que el costo es importante, importante esto es, hay costos diferenciales en los estratos, conviene usar la distribución óptima (6.9) y determinar el tamaño de muestra con expresiones (6.10), (6.11) o (6.11’). • Si no hay costos diferenciales muy marcados y se decide usar la distribución proporcional (6.7) para determinar el tamaño de muestra total, se usará (6.13), si se quiere fijar el coeficiente de variación, sin consideraciones sobre la distribución de los estimadores. 15 6.4 Conclusiones • Si se quiere fijar la precisión (δ ) y la confiabilidad (1-α) considerando distribución normal para el estimador, se usará la expresión (6.14). Debe tenerse cuidado al señalar que todas las expresiones anteriores determinan el tamaño de muestra para estimadores globales de toda la población. Las inferencias no son para cada estrato con esas muestras. muestras. 6.4 Conclusiones Si lo que se desea es estimar media o totales en cada estrato, las expresiones anteriores no se deben usar, lo que se debe emplear son fórmulas (5.3) y (5.4) para cada estrato por separado y así determinar las nh a usarse en cada uno de ellos. Por supuesto que en este último caso la muestra total n es mucho más grande. Esto es de esperarse, puesto que ahora se están haciendo inferencias por separado para L poblaciones. 16