Algunos apuntes sobre el muestreo aleatorio estratificado. 1. Definición y algunos comentarios. Definición: cuando la población se puede dividir en grupos disjuntos y homogéneos (parecidos) en su interior y heterogéneos entre ellos. Por lo general la variable que nos permita formar dichos grupos debe estar relacionada (dependiente en cierto grado) con las variables en estudio. A los grupos los llamaremos estratos. Lo motivos principales para utilizar este método de muestreo son: - - Reduce el error frente al muestreo aleatorio simple si las muestras son del mismo tamaño. Al con un mismo error en el muestreo estratificado la muestra es más pequeña, simplifica los cálculos y reduce los costes de la investigación estadística. Se pueden obtener estimaciones de parámetros poblacionales para los estratos de la población. La selección de la muestra en cada estrato se hará por muestreo aleatorio simple, y por lo tanto será aplicable las fórmulas de dicho muestreo en cada estrato. Por ejemplo: Si deseamos realizar una investigación sobre el gasto familiar y disponemos de un listado poblacional que contiene el número de miembros de la familia, podemos clasificar dicha población en grupos (1 a 2 personas, 3 a 5 personas, 6 a 8 personas y 9 o más). Observamos que los grupos son disjuntos y además la variable de estratificación nº de miembros está relacionada con la variable en estudio gasto familiar. 2. Afijación En este apartado veremos los tres métodos de saber cuantos elementos intervienen en la muestra y cuantos en cada estrato. a) Afijación proporcional: el número de elementos muestrales de cada estrato es proporcional al tamaño de cada estrato. n1 n n 2 ... N1 N 2 N b) Afijación optima: el número de elementos muestrales de cada estrato es proporcional al tamaño de cada estrato y de la varianza de cada estrato n1 1 n 2 2 ... N1 N2 ni i N c) Afijación optima con costes: el número de elementos muestrales de cada estrato es proporcional al tamaño de cada estrato y de la varianza de cada estrato e inversamente proporcional a la raíz del coste de obtener cada unidad de información en el estrato. n1 1 n 2 2 ... N1 c1 N 2 c2 n N c i i 3. Estimadores de la media, de un total poblacional y de la proporción poblacional en muestreo estratificado con afijación proporcional. Estimador de la media poblacional 1 1 yi N Ni Varianza del estimador de la media poblacional ̂ 1 𝑁𝑖 − 𝑛𝑖 𝑠𝑖2 2 𝑉̂ (𝜇̂ ) = 2 ∑ 𝑁𝑖 ( ) 𝑁 𝑁𝑖 𝑛𝑖 𝑠𝑖2 ∑(𝑦𝑖𝑗 − 𝑦̅)2 = 𝑛𝑖𝑗 − 1 Límite del error de la estimación √𝑉̂ (𝜇̂ ) Intervalo del estimador de la media poblacional i i [𝜇̂ − 2√𝑉̂ (𝜇̂ ); 𝜇̂ + 2√𝑉̂(𝜇̂ )] Estimación para la proporción poblacional ̂ 𝒊𝒋 = 𝟏 ∑ 𝑵𝒊 𝑷𝒊 𝑷 𝑵 Varianza del estimador de la proporción poblacional ̂ 𝑉̂ (𝑃 𝑖𝑗 ) = 1 𝑝̂𝑖 𝑞̂𝑖 2 𝑁𝑖 − 𝑛𝑖 ∑ 𝑁 ( ) 𝑖 𝑁2 𝑁𝑖 𝑛𝑖 − 1 Límite del error de la estimación √𝑉̂ (𝑃̂𝑖𝑗 ) Intervalo del estimador de la proporcion poblacional [𝑃̂𝑖𝑗 − 2√𝑉̂ (𝑃̂𝑖𝑗 ); 𝑃̂𝑖𝑗 + 2√𝑉̂(𝑃̂𝑖𝑗 )]