Tema: Muestreo Sistemático.

Anuncio
Tema: Muestreo Sistemático.
Introducción:
La muestra seleccionada en una muestra sistemática de 1 en k de n individuos entre N
estará compuesta por los individuos:
s  h : h  r  j − 1k ≤ N; j  1, 2, . . . , n
Suponemos N  nk  c y r semilla aleatoria entre 1 y k.
Tabla que ilustra las k posibles muestras si c  0 :
s1
...
sr
... s k
y1
y k1
...
yr
...
y kr
...
yk
...
y n−1k1
y n−1kr
 s1
...  s r ∑ y j−1kr ...
n
y 2k
...
yN
 sk
j1
Obtención de muestra sistemática de exactamente n individuos si k 
no es entero:
i) Método del Intervalo Fraccional:
Extraemos un valor  de una distribución U0, k :
s  l : l − 1    j − 1k ≤ l; j  1, . . , n
ó
s  l : l − 1n  r  j − 1N ≤ ln; j  1, . . , n; 
Si se quieren tomar m replicas de tamaño exactamente mn sin que se repitan:
Extraemos m valores  1 , . . . ,  m de una distribución U0, mk :
s 1  l : l − 1   1  j − 1mk ≤ l; j  1, . . , mn 
................
s m  l : l − 1   m  j − 1mk ≤ l; j  1, . . , mn ; 
ii) Método de Muestreo Sistemático circular:
Tomar aleat. r del 1 al N y k la parte entera de N/n 
l : l  r  j − 1k; j  1, . . , n si r  j − 1k ≤ N
s
l : l  r  j − 1k − N; j  1, . . , n si r  j − 1k  N
1
N
n
Estimadores:
 sis  k s r
Estimador de la varianza
En el diseño muestral sistemático se puede comprobar de manera inmediata que no
todas las  ij son positivas con lo que no se utiliza el  −estimador de la varianza
k
k
Var sis   k ∑  s r −   N  SSB, donde  
2
∑ s r
r1
k


k
r1
Descomposición de la varianza en función del coeficiente de homogeneidad:
k
k
 ∑ y j −  2 ∑∑ y j −  s r  2 ∑ n s r −  2  SST  SSW  SSB
r1 s r
j∈U
r1
Var sis   N  SSB
Definiciones:
i) Coeficiente de correlación intraclases: (Se precisa que las s r sean del mismo
tamaño)
k
∑ ∑∑y k −y U y l −y U 
2
  1−

n SSW
n−1 SST

r1
kl
sr
n−1N−1S 2yU

1 si SSW  0  Homogeneidad en s r
1
− n−1
si SSB  0  Heterogeneidad en s r
Se interpreta como una medida de la correlación entre pares de elementos
dentro de la misma muestra sistemática; tomará valores positivos cuando los elementos en
la misma muestra tienden a tener valores similares de la variable Y; tomará el valor 1 si hay
1
completa homogeneidad dentro de las muestras sistemáticas; toma el valor   − n−1
cuando hay completa heterogeneidad dentro de las muestras
ii) Coeficiente de homogeneidad (medida de homogeneidad que se prefiere puesto
que no se precisa que las s r sean del mismo tamaño)
1
si SSW  0  Homogeneidad en s r
SSW

  1 − N−1
N−k SST
k−1
− N−k
si SSB  0  Heterogeneidad en s r
Expresión de la varianza en función del coeficiente de homogeneidad si N  nk:
k
Var sis   k ∑  s r −   N 2
2
 ∗2
n
1 − f  n − 1
r1
Var sis  
N 2 1−f
n
S ∗2
sr ;
S ∗2
sr 
1
n−1
∑ y k −  s r  2
k∈s r
2
Eficiencia del diseño:
Var sis 
Var
 1
n−1
1−f
  0  Diseño sistemático más eficiente que m.a.s.

  0  Diseño sistemático menos eficiente
Muestreo Sistemático replicado:
Tomar m semillas entre los m  k primeros dígitos ordenados m sistemáticos ”slices”
de tamaño mn
Suponiendo mn
y
N
n
∈
Z

s

h
:
h

r

j
−
1mk
≤
N;
j

1,
2,
.
.
.
,
;
i

1,
.
.
.
,
m
i
n
m
Muestreo sistemático replicado se puede considerar equivalente al muestreo aleatorio
simple de m conglomerados de entre km posibles, por tanto los estimadores son:
 sr 
m
mk
m
∑ i
i1
Var sr  
m
m 
km 2 1− mk
m
∑
∗2
S ∗2
s I donde S s I 
2
 i −
i1
m−1
Tamaño muestral:
Obtención de n con una muestra sistemática:
2
1
Estimar S ∗2
s r  n−1 ∑ y k −  s r  con muestra previa n 
k∈s r
N
n
N 2 S ∗2
sr
B2
k2
NS ∗2
sr
Obtención de tamaño de muestra para muestreo sistemático replicado:
Suponemos una muestra piloto con m replicas cada una con n′  mn individuos y
k
km 2 1− 1k  ∗2
2

S s I y se despeja m ∗
Se plantea la ecuación: kB∗
m∗
Conclusión: Se toman m ∗ muestras sistemáticas de mn individuos cada una
3
Descargar