Muestreo Aleatorio Simple yj = variable en estudio, xj = variable

Anuncio
Muestreo Aleatorio Simple
yj = variable en estudio, xj = variable auxiliar
Cantidades poblacionales:
• N = total de unidades muestrales
• ty =
N
X
N
yj = total poblacional, ȳU =
j=1
X
ty
tx
= media poblacional y tx =
xj , x̄U =
N
N
j=1
N
•
Sy2
N
1 X
1 X
2
2
=
(yj − ȳU ) y Sx2 =
(xj − x̄U ) (varianzas poblacionales)
N − 1 j=1
N − 1 j=1
• B = ty /tx = razón poblacional, B1 = RSy /Sx y B0 = ȳU −B1 x̄U coeficientes de regresión poblacionales,
siendo
PN
(xi − x̄U )(yi − ȳU )
el coeficiente poblacional de correlación
R = i=1
(N − 1)Sx Sy
Valores muestrales:
• n = tamaño de la muestra, S = {yj1 , . . . , yjn } = valores observados
X
X
• ȳ =
yj y x̄ =
xj (medias muestrales).
j∈S
j∈S
• Estimadores de la media poblacional y residuos
Insesgado
Razón
Regresión
ȳˆreg
Estimador
ȳ
ˆ
ȳ raz = B̂ x̄
= ȳ + B̂1 (x̄U − x̄)
ei
yi − ȳ
yi − B̂xi
yi − B̂0 − B̂1 xi
• Varianzas estimadas:
n s2e
1 X 2
V̂ (estimador de la media poblacional) = 1 −
siendo s2 =
ej
N n
n−1
j∈S
Muestreo con probabilidades distintas
πj = probabilidad de seleccionar la unidad muestral j
πij = probabilidad de seleccionar las unidades muestral i y j
X yi
Estimador de Horvitz-Thomson: t̂HT =
π1
i∈S
V (t̂HT ) =
N
X
1 − πi
i=1
πi
yi2 +
2
N X
N X
X
X
πij − πi πj
yi
yj
y i yj =
(πij − πi πj )
−
πi πj
πi
πj
i=1
i=1 j>i
j6=i
1
Muestreo Estratificado
yhj = medida observada para el elemento j del estrato h
Cantidades poblacionales:
• H = número de estratos, Nh = número de unidades muestrales en el estrato h, N =
H
X
Nh
h=1
Nh
X
• th =
yhj = total en el estrato h, t =
h=1
H
X
th = total poblacional
h=1
• ȳU =
th
t
= media poblacional, ȳhU =
= media poblacional del estrato h
N
Nh
• Sh2 =
Nh
X
1
2
(yhj − ȳhU ) = varianza poblacional dentro del estrato h
Nh − 1
h=1
Cantidades muestrales:
• nh = número de unidades muestrales del estrato h, ȳh =
1 X
yhj , t̂h = Nh ȳh
nh
j∈Sh
• t̂estr =
H
X
t̂i = estimador del total poblacional, ȳestr = t̂estr /N = estimador de la media poblacional
h=1
• s2h =
X
1
2
(yhj − ȳh ) = varianza muestral dentro del estrato h
nh − 1
j∈Sh
Varianza del estimador de la media:
V (ȳestr ) =
H X
h=1
nh
1−
Nh
Nh
N
2
Sh2
nh
Estimación de proporciones: Si yhj ∈ {0, 1}, hacemos inferencia con p̂h = ȳh y
s2h =
nh
p̂h (1 − p̂h )
nh − 1
Afijaciónes: proporcional nh = nNh /N y óptima
!
H
N h Sh X N i Si
nh = n √
, siendo ci el costo muestral de una observación del estrato i
√
ch
ci
i=1
Descomposición en sumas de cuadrados (afijación proporcional):
"
#
H H
X
X
n
N2
Nh
VM AS (t̂) = Vprop (t̂estr ) + 1 −
SSB −
1−
Sh2 , SSB =
Nh (ȳhU − ȳU )2
N n(N − 1)
N
h=1
2
h=1
Muestreo por conglomerados
yij = medida observada para el elemento j de la u.p.m. i
Cantidades poblacionales:
• N = número de u.p.m. en la población, Mi = número de u.s.m. en la u.p.m. i, K =
N
X
Mi
i=1
• St2 =
2
Mi
N N
X
X
1 X
t
, con ti =
ti −
yij , t =
ti = total poblacional
N − 1 i=1
N
j=1
i=1
• ȳU =
ti
t
= media poblacional, ȳiU =
= media poblacional de la u.p.m. i
K
Mi
• S2 =
1 X Xi
2
(yij − ȳU ) = varianza poblacional
K − 1 i=1 j=1
• Si2 =
Xi
1
2
(yij − ȳiU ) = varianza poblacional dentro de la u.p.m. i
Mi − 1 j=1
N
M
M
Cantidades muestrales:
• n = número de upm en la muestra, mi = número de usm de la upm i en la muestra
1 X
• ȳi =
yij = media muestral de la upm i
mi
j∈Si
• t̂i =
XN
Mi X
t̂i = estimador del total poblacional
yij = total estimado de la u.p.m. i, t̂cong =
mi
n
j∈Si
• s2t =
• s2i =
1
n−1
i∈S
X
i∈S
t̂i −
t̂cong
N
2
= varianza estimada de totales de las upm
X
1
2
(yij − ȳi ) = varianza muestral dentro de la upm i
mi − 1
j∈Si
Estimadores de la razón (muestreo monoetápico), tomando Mi como variables auxiliares:
v
P
u
X M2
u
t
n
1
i
i
B̂ = ȳˆr = P i∈S , t̂r = K ȳˆr , SE(ȳˆr ) = t 1 −
(ȳi − ȳˆr )2
2
N
n(n
−
1)
M
M̄
i
i∈S
U
i∈S
Si M̄U = K/N es desconocido, podemos reemplazarlo en las fórmula anterior por su estimador muestral
1X
M̄S =
Mi
n
i∈S
Varianza del estimador del total:
N n St2
NX
mi
S2
V (t̂cong ) = N 2 1 −
+
1−
Mi2 i
N n
n i=1
Mi
mi
3
Descargar