Tema: Muestreo Sistemático. Introducción: La muestra seleccionada en una muestra sistemática de 1 en k de n individuos entre N estará compuesta por los individuos: s h : h r j − 1k ≤ N; j 1, 2, . . . , n Suponemos N nk c y r semilla aleatoria entre 1 y k. Tabla que ilustra las k posibles muestras si c 0 : s1 ... sr ... s k y1 y k1 ... yr ... y kr ... yk ... y n−1k1 y n−1kr s1 ... s r ∑ y j−1kr ... n y 2k ... yN sk j1 Obtención de muestra sistemática de exactamente n individuos si k no es entero: i) Método del Intervalo Fraccional: Extraemos un valor de una distribución U0, k : s l : l − 1 j − 1k ≤ l; j 1, . . , n ó s l : l − 1n r j − 1N ≤ ln; j 1, . . , n; Si se quieren tomar m replicas de tamaño exactamente mn sin que se repitan: Extraemos m valores 1 , . . . , m de una distribución U0, mk : s 1 l : l − 1 1 j − 1mk ≤ l; j 1, . . , mn ................ s m l : l − 1 m j − 1mk ≤ l; j 1, . . , mn ; ii) Método de Muestreo Sistemático circular: Tomar aleat. r del 1 al N y k la parte entera de N/n l : l r j − 1k; j 1, . . , n si r j − 1k ≤ N s l : l r j − 1k − N; j 1, . . , n si r j − 1k N 1 N n Estimadores: sis k s r Estimador de la varianza En el diseño muestral sistemático se puede comprobar de manera inmediata que no todas las ij son positivas con lo que no se utiliza el −estimador de la varianza k k Var sis k ∑ s r − N SSB, donde 2 ∑ s r r1 k k r1 Descomposición de la varianza en función del coeficiente de homogeneidad: k k ∑ y j − 2 ∑∑ y j − s r 2 ∑ n s r − 2 SST SSW SSB r1 s r j∈U r1 Var sis N SSB Definiciones: i) Coeficiente de correlación intraclases: (Se precisa que las s r sean del mismo tamaño) k ∑ ∑∑y k −y U y l −y U 2 1− n SSW n−1 SST r1 kl sr n−1N−1S 2yU 1 si SSW 0 Homogeneidad en s r 1 − n−1 si SSB 0 Heterogeneidad en s r Se interpreta como una medida de la correlación entre pares de elementos dentro de la misma muestra sistemática; tomará valores positivos cuando los elementos en la misma muestra tienden a tener valores similares de la variable Y; tomará el valor 1 si hay 1 completa homogeneidad dentro de las muestras sistemáticas; toma el valor − n−1 cuando hay completa heterogeneidad dentro de las muestras ii) Coeficiente de homogeneidad (medida de homogeneidad que se prefiere puesto que no se precisa que las s r sean del mismo tamaño) 1 si SSW 0 Homogeneidad en s r SSW 1 − N−1 N−k SST k−1 − N−k si SSB 0 Heterogeneidad en s r Expresión de la varianza en función del coeficiente de homogeneidad si N nk: k Var sis k ∑ s r − N 2 2 ∗2 n 1 − f n − 1 r1 Var sis N 2 1−f n S ∗2 sr ; S ∗2 sr 1 n−1 ∑ y k − s r 2 k∈s r 2 Eficiencia del diseño: Var sis Var 1 n−1 1−f 0 Diseño sistemático más eficiente que m.a.s. 0 Diseño sistemático menos eficiente Muestreo Sistemático replicado: Tomar m semillas entre los m k primeros dígitos ordenados m sistemáticos ”slices” de tamaño mn Suponiendo mn y N n ∈ Z s h : h r j − 1mk ≤ N; j 1, 2, . . . , ; i 1, . . . , m i n m Muestreo sistemático replicado se puede considerar equivalente al muestreo aleatorio simple de m conglomerados de entre km posibles, por tanto los estimadores son: sr m mk m ∑ i i1 Var sr m m km 2 1− mk m ∑ ∗2 S ∗2 s I donde S s I 2 i − i1 m−1 Tamaño muestral: Obtención de n con una muestra sistemática: 2 1 Estimar S ∗2 s r n−1 ∑ y k − s r con muestra previa n k∈s r N n N 2 S ∗2 sr B2 k2 NS ∗2 sr Obtención de tamaño de muestra para muestreo sistemático replicado: Suponemos una muestra piloto con m replicas cada una con n′ mn individuos y k km 2 1− 1k ∗2 2 S s I y se despeja m ∗ Se plantea la ecuación: kB∗ m∗ Conclusión: Se toman m ∗ muestras sistemáticas de mn individuos cada una 3