Muestreo Aleatorio Simple yj = variable en estudio, xj = variable auxiliar Cantidades poblacionales: • N = total de unidades muestrales • ty = N X N yj = total poblacional, ȳU = j=1 X ty tx = media poblacional y tx = xj , x̄U = N N j=1 N • Sy2 N 1 X 1 X 2 2 = (yj − ȳU ) y Sx2 = (xj − x̄U ) (varianzas poblacionales) N − 1 j=1 N − 1 j=1 • B = ty /tx = razón poblacional, B1 = RSy /Sx y B0 = ȳU −B1 x̄U coeficientes de regresión poblacionales, siendo PN (xi − x̄U )(yi − ȳU ) el coeficiente poblacional de correlación R = i=1 (N − 1)Sx Sy Valores muestrales: • n = tamaño de la muestra, S = {yj1 , . . . , yjn } = valores observados X X • ȳ = yj y x̄ = xj (medias muestrales). j∈S j∈S • Estimadores de la media poblacional y residuos Insesgado Razón Regresión ȳˆreg Estimador ȳ ˆ ȳ raz = B̂ x̄ = ȳ + B̂1 (x̄U − x̄) ei yi − ȳ yi − B̂xi yi − B̂0 − B̂1 xi • Varianzas estimadas: n s2e 1 X 2 V̂ (estimador de la media poblacional) = 1 − siendo s2 = ej N n n−1 j∈S Muestreo con probabilidades distintas πj = probabilidad de seleccionar la unidad muestral j πij = probabilidad de seleccionar las unidades muestral i y j X yi Estimador de Horvitz-Thomson: t̂HT = π1 i∈S V (t̂HT ) = N X 1 − πi i=1 πi yi2 + 2 N X N X X X πij − πi πj yi yj y i yj = (πij − πi πj ) − πi πj πi πj i=1 i=1 j>i j6=i 1 Muestreo Estratificado yhj = medida observada para el elemento j del estrato h Cantidades poblacionales: • H = número de estratos, Nh = número de unidades muestrales en el estrato h, N = H X Nh h=1 Nh X • th = yhj = total en el estrato h, t = h=1 H X th = total poblacional h=1 • ȳU = th t = media poblacional, ȳhU = = media poblacional del estrato h N Nh • Sh2 = Nh X 1 2 (yhj − ȳhU ) = varianza poblacional dentro del estrato h Nh − 1 h=1 Cantidades muestrales: • nh = número de unidades muestrales del estrato h, ȳh = 1 X yhj , t̂h = Nh ȳh nh j∈Sh • t̂estr = H X t̂i = estimador del total poblacional, ȳestr = t̂estr /N = estimador de la media poblacional h=1 • s2h = X 1 2 (yhj − ȳh ) = varianza muestral dentro del estrato h nh − 1 j∈Sh Varianza del estimador de la media: V (ȳestr ) = H X h=1 nh 1− Nh Nh N 2 Sh2 nh Estimación de proporciones: Si yhj ∈ {0, 1}, hacemos inferencia con p̂h = ȳh y s2h = nh p̂h (1 − p̂h ) nh − 1 Afijaciónes: proporcional nh = nNh /N y óptima ! H N h Sh X N i Si nh = n √ , siendo ci el costo muestral de una observación del estrato i √ ch ci i=1 Descomposición en sumas de cuadrados (afijación proporcional): " # H H X X n N2 Nh VM AS (t̂) = Vprop (t̂estr ) + 1 − SSB − 1− Sh2 , SSB = Nh (ȳhU − ȳU )2 N n(N − 1) N h=1 2 h=1 Muestreo por conglomerados yij = medida observada para el elemento j de la u.p.m. i Cantidades poblacionales: • N = número de u.p.m. en la población, Mi = número de u.s.m. en la u.p.m. i, K = N X Mi i=1 • St2 = 2 Mi N N X X 1 X t , con ti = ti − yij , t = ti = total poblacional N − 1 i=1 N j=1 i=1 • ȳU = ti t = media poblacional, ȳiU = = media poblacional de la u.p.m. i K Mi • S2 = 1 X Xi 2 (yij − ȳU ) = varianza poblacional K − 1 i=1 j=1 • Si2 = Xi 1 2 (yij − ȳiU ) = varianza poblacional dentro de la u.p.m. i Mi − 1 j=1 N M M Cantidades muestrales: • n = número de upm en la muestra, mi = número de usm de la upm i en la muestra 1 X • ȳi = yij = media muestral de la upm i mi j∈Si • t̂i = XN Mi X t̂i = estimador del total poblacional yij = total estimado de la u.p.m. i, t̂cong = mi n j∈Si • s2t = • s2i = 1 n−1 i∈S X i∈S t̂i − t̂cong N 2 = varianza estimada de totales de las upm X 1 2 (yij − ȳi ) = varianza muestral dentro de la upm i mi − 1 j∈Si Estimadores de la razón (muestreo monoetápico), tomando Mi como variables auxiliares: v P u X M2 u t n 1 i i B̂ = ȳˆr = P i∈S , t̂r = K ȳˆr , SE(ȳˆr ) = t 1 − (ȳi − ȳˆr )2 2 N n(n − 1) M M̄ i i∈S U i∈S Si M̄U = K/N es desconocido, podemos reemplazarlo en las fórmula anterior por su estimador muestral 1X M̄S = Mi n i∈S Varianza del estimador del total: N n St2 NX mi S2 V (t̂cong ) = N 2 1 − + 1− Mi2 i N n n i=1 Mi mi 3