muestreo estratificado muestreo estratificado muestreo estratificado

Anuncio
MUESTREO ESTRATIFICADO
MUESTREO ESTRATIFICADO
•
El muestreo estratificado consiste en dividir
la población en L subconjuntos o estratos, y
de cada uno de ellos seleccionar una
muestra
probabilística;
de
manera
independiente de un estrato a otro.
Existen tres razones importantes para
utilizar este tipo de muestreo:
i. estadísticas,
ii. marcos; y de
iii. costos.
MUESTREO ESTRATIFICADO
Se supone que se conoce el número de
unidades en cada estrato (Nh).
Aunque esto se verá después, es importante
señalar que si se usan estimadores de razón o
de regresión o si el muestreo se hace con
probabilidad proporcional al tamaño, los
estratos se forman con subconjuntos de
unidades
donde
sea
constante
la
proporcionalidad de Y a X, aunque esa
proporcionalidad cambie de estrato a estrato.
i.
La razó
razón estadí
estadística ocurre cuando la población
está constituida por unidades heterogé
heterogéneas y
podemos tener una idea previa de los grupos de
unidades más homogéneas entre sí, entonces
es conveniente formar estratos.
Los estratos son subconjuntos de la población
que agrupan unidades homogé
homogéneas,
neas aunque
sean heterogé
heterogéneas entre estratos.
estratos
Cada estrato se muestrea por separado y se
obtienen los estimadores de parámetros (totales,
medias, proporciones) para cada estrato.
MUESTREO ESTRATIFICADO
Como ejemplos de la razón estadística para usar
estratos, considérense:
(a) En un muestreo donde interesa conocer
alguna característica de los hogares en la Ciudad
de México (por ejemplo: gastos en alimentos,
ropa, ingresos, tipo de casa habitación, años de
escolaridad del padre, número de hijos, etcétera).
Se sabe que esas características dependen
fuertemente del nivel socioeconómico de las
familias, por lo tanto conviene hacer estratos
considerando áreas de la ciudad con niveles
socioeconómicos semejantes.
1
MUESTREO ESTRATIFICADO
MUESTREO ESTRATIFICADO
(b) En un muestreo para estimar la cosecha
total de café en México, se conocía que el
estado fisiológico, edad y estado de sanidad de
los árboles influye mucho en su producción.
Entonces, se tomaron como estratos,
categorías de árboles bien definidas y
homogéneas en lo que respecta a edad,
estados fisiológicos y de sanidad. Además, los
predios se agruparon en estratos de acuerdo a
la región ecológica donde estaban ubicados.
Esto es porque la productividad del café varía
según las condiciones ecológicas como altura
sobre el nivel del mar, vientos, temperaturas
extremas, etcétera.
Así, las colonias se pueden clasificar a priori
con relación al nivel socioeconómico como:
muy alto, alto, medio, medio bajo y bajo,
formando de esta manera cinco estratos.
La encuesta se planea para cada estrato por
separado. El efecto de formación de estratos
es reducir la variabilidad de los
estimadores. La variabilidad de Yˆ se puede
reducir mucho si los estratos son muy
homogé
homogéneos dentro de cada uno de ellos y
heterogé
heterogéneos entre los mismos.
MUESTREO ESTRATIFICADO
(c) En una encuesta para estimar el consumo
de energía eléctrica es conveniente agrupar
las fábricas en estratos, así quedarían
agrupadas en: fábricas grandes, fábricas
pequeñas, empresas de producción familiar y
un estrato final constituido por casahabitación. Esto, porque sabemos que el
consumo de electricidad va a ser muy
variable entre estratos, y esperamos que sea
menor dentro de estos.
MUESTREO ESTRATIFICADO
ii.
Otra razón poderosa para formar estratos
es la disponibilidad de marcos.
marcos
Si para una parte de la población se tiene
un buen marco, éste se usa para el
muestreo de esa parte y la o las otras
partes de la población se muestrean
usando otros marcos más imprecisos y,
posiblemente distintos esquemas (diseños)
de muestra.
2
MUESTREO ESTRATIFICADO
Por ejemplo,
ejemplo en encuesta de hogares se cuenta
con un buen marco para la zona urbana de
construcción antigua; pero las zonas rurales y las
urbanas de construcción reciente no tienen un
marco adecuado.
Entonces se utilizan planos catastrales para las
zonas urbanas antiguas (un estrato), se usan
fotografías aéreas para zonas rurales (otro
estrato) y las áreas de posible nueva urbanización
(otro estrato) se delimitan como otro marco; se
muestrean áreas y se investigan las nuevas
urbanizaciones (muestreo en etapas
o
conglomerados).
MUESTREO ESTRATIFICADO
• Lo más frecuente es que los tres criterios
para formación de estratos coincidan,
coincidan de
modo que los estratos formen unidades
homogéneas con un mismo tipo de marco y
con costos de localización y captación de
información semejantes.
semejantes
MUESTREO ESTRATIFICADO
iii. Otra razón más para construir estratos
puede ser el costo de localizar y levantar la
información de las unidades, por ejemplo:
si en una encuesta de predios agrícolas
hay una región cuyo acceso es difícil (por
avión o a caballo únicamente), esa región
puede constituir un estrato, que será
muestreado con un tamaño de muestra
pequeño.
MUESTREO ESTRATIFICADO
• Se pueden utilizar diferentes formas de
muestreo en los diferentes estratos,
estratos sin
embargo, se considerará en este escrito
como una introducción al tema, aquel en el
cual cada estrato se muestrea usando “mas”.
Más adelante se consideran las muestras
complejas, donde se amplia el uso de
estratos.
3
MUESTREO ESTRATIFICADO
MUESTREO ESTRATIFICADO
• Valores Poblacionales
• Considérese la siguiente notación:
Yhi
valor de la medición en el elemento
i-ésimo del estrato h-ésimo.
Nh= número de unidades en estrato h-ésimo;
L
N = ∑ N h total de unidades en la población.
h=1,2,...,L;
h =1
Nh
∑Y
L= número de estratos.
Yh =
MUESTREO ESTRATIFICADO
Yh = N hYh = ∑ Yhi total poblacional del estrato
i =1
S h2 =
∑ (Y
i =1
hi − Yh )
Nh −1
hi
h-ésimo.
2
media poblacional del estrato h-ésimo.
Nh
MUESTREO ESTRATIFICADO
L
Nh
Nh
i =1
L
Nh
Y = ∑ Yh = ∑∑ Yhi
h =1
total de toda la población.
h =1 i =1
L
Y = ∑ Nh Y h
h =1
varianzas poblacionales del
estrato h-ésimo.
Y =
Y
∑ Nh
media de los valores Yhi
en toda la población.
4
MUESTREO ESTRATIFICADO
Wh =
L
∑W
h =1
h
Nh
N
proporción del tamaño
del estrato h-ésimo.
MUESTREO ESTRATIFICADO
• Valores muestrales
En esta parte se considera cualquier estrategia
de muestreo probabilístico en cada estrado,
incluso pueden ser diferentes de un estrato a
otro.
=1
MUESTREO ESTRATIFICADO
Supóngase que de manera independiente se
toman muestras de cada estrato. Sea nh el
tamaño de muestra en el estrato h-ésimo.
La muestra total es
L
n = ∑ nh
h =1
MUESTREO ESTRATIFICADO
Supóngase que se quiere estimar el total de la
población, esto es
L
L
Nh
Y = ∑ Yh = ∑∑ Yhi
h =1
h =1 i =1
Para esto con la muestra de cada estrato se
estima el total, sea Yˆh el estimador insesgado o
con sesgo despreciable para el caso de
estimadores de razón o de regresión, su
varianza V (Yˆh ), además, sea Vˆ (Yˆh ) un estimador
de esa varianza.
5
MUESTREO ESTRATIFICADO
El estimador del total es
L
Yˆ = ∑ Yˆh
h =1
MUESTREO ESTRATIFICADO
La varianza del estimador del total es
L
V (Yˆ ) = V (Yˆ ) ,
∑
h =1
h
la suma de los estimadores de los totales de
los estratos (es un estimador insesgado).
que es la suma de las varianzas de los
estimadores de los totales de estratos.
Esto es válido con cualquier diseñ
diseño de
muestra y estimadores por estrato, los que
pueden ser distintos en los diferentes estratos.
Esto es por tener muestras independientes
en los estratos.
MUESTREO ESTRATIFICADO
Además el estimador de la varianza del
estimador del total es:
L
Vˆ (Yˆ ) = ∑ Vˆ (Yˆh )
h =1
MUESTREO ESTRATIFICADO
Suponiendo distribució
distribución normal de Yˆ se tiene:
P  Yˆ − Y < 1.96 V (Yˆ )  = .95


⇒ P Yˆ − 1.96 Vˆ (Yˆ ) ≤ Y ≤ Yˆ + 1.96 Vˆ (Yˆ )  =& .95


6
MUESTREO ESTRATIFICADO
Si no se puede suponer normalidad úsese el
valor 4.4 en lugar de 1.96 (T. Tchebycheff).
• Estas expresiones para Yˆ son válidas para
cualquier forma de muestrear estratos.
MUESTREO ESTRATIFICADO
• La primera aproximación al uso de estratos
es considerar que se usa “mas” en cada
estrato entonces: n
h
Yˆh = N h yh = N h
∑y
i =1
hi
nh
= N hYˆh
donde yhi son los valores observados en la
unidad i-ésima de la muestra (tamaño nh) del
estrato h-ésimo.
MUESTREO ESTRATIFICADO
MUESTREO ESTRATIFICADO
El estimador del total poblacional es:
L
L
h =1
h =1
Yˆ = ∑ Yˆh = ∑ N h yh
(6.1)
nh
y
⇒ Yˆ = ∑ N h ∑ hi
h =1
i =1 nh
L
L
nh
= ∑∑
h =1 i =1
Nh
yhi
nh
N
donde h corresponde al factor de expansión,
nh
de las
unidades obtenidas en cada estrato.
Su varianza teórica es:
L
L
h =1
h =1
V (Yˆ ) = ∑ V (Yˆh ) = ∑ N h2V ( yh2 )

n  S2
= ∑ N h2 1 − h  h
h =1
 N h  nh
L
(6.2)
Esta varianza se estima al sustituir S2h por
su estimador en cada estrato.
7
MUESTREO ESTRATIFICADO
Recurriendo al Teorema central del lí
límite,
mite
para cada estrato yh ~N [Yh , V ( yh )] , se tendrá
que
Yˆ ~N [Y , V (Yˆ )] .
El estimador insesgado de S2h es
∧ 2
S
h
nh
=∑
( yhi − yh )
nh − 1
i =1
2
.
Nótese que Sˆh es la misma expresión que
S2h, pero la primera es con valores de la
muestra y la segunda con los valores de todo
el estrato h-ésimo.
2
6. MUESTREO ESTRATIFICADO
Si se estima V (Yˆ ) , se puede construir un
intervalo de confianza aproximado para el total
de la población:
[
MUESTREO ESTRATIFICADO
]
P Yˆ − 1.96 Vˆ (Yˆ ) < Y < Yˆ + 1.96 Vˆ (Yˆ ) =& 0.95
(6.3)
Al dividir cada término de (6.3) entre N = ∑ N h ,
tenemos el intervalo de confianza para
Y , la media de la población.
Esto es mucho más factible aunque cada yh
no tenga distribución normal, si se tienen
muchos estratos. Se puede decir que los
errores de estimación tienden a cancelarse
de un estrato a otro.
6. MUESTREO ESTRATIFICADO
Si se considera que la muestra es grande en
cada estrato, la muestra total será mayor
aún. Esto justifica el uso del valor 1.96 en
lugar del valor de las tablas de t. Nótese que:
L

n  Sˆ 2
Vˆ (Yˆ ) = ∑ N h2  1 − h  h
h =1
 N h  nh
(6.4)
8
6. MUESTREO ESTRATIFICADO
Si lo que se quiere estimar es Y , se tendrá que,
L
Yˆ
Yˆ = =
N
∑N
h =1
N
h
yh
L
=∑
h =1
L
Nh
yh = ∑ Wh yh
N
h =1
(6.5)
N
donde Wh = h proporción del tamaño de estrato
N
h-ésimo.
6. MUESTREO ESTRATIFICADO
De manera semejante, el intervalo de confianza
aproximado para Y es el siguiente:


P Yˆ − 1.96 Vˆ (Yˆ ) ≤ Y ≤ Yˆ + 1.96 Vˆ (Yˆ )  =& 0.95


Aún con muestras chicas en cada estrato (nh =
2,3,4) si se tienen mas de 10 estratos se
puede tener normalidad para Yˆ , esto en
virtud de la compensación de errores.
6. MUESTREO ESTRATIFICADO
Nótese que (6.5) es un promedio ponderado de
los promedios muestrales y su varianza es:
()
L

n  S2
V Yˆ = ∑ Wh2 1 − h  h
h =1
 N h  nh
(6.6)
la que se estima con:
L

n  Sˆ 2
Vˆ (Yˆ ) = ∑ Wh2  1 − h  h
h =1
 N h  nh
(6.6a)
6. MUESTREO ESTRATIFICADO
• Proporciones
Si lo que se requiere estimar es P, la
proporción de elementos de la población que
tienen una característica determinada, se
usan las equivalencias dadas por
Yh = Ph ,
yh = ph ,
L
Pˆ = ∑ Wh ph ,
h =1

n  p (1 − ph )
Vˆ (Yˆ ) = Vˆ ( Pˆ ) = ∑ Wh2 1 − h  h
N
nh
h =1
h 

L
9
6. MUESTREO ESTRATIFICADO
Estas equivalencias surgen al considerar que
1
Si la unidad i-ésima del estrato h
tiene la característica
0
De otro modo
Yhi=
6.1 Distribución (afijación) de la Muestra
a los Estratos
Antes de considerar el problema de la
determinación del tamaño de muestra, se
discute la forma de distribuir el tamaño de
muestra total, n, a los diferentes estratos.
6. MUESTREO ESTRATIFICADO
• Sólo si las Ph son muy diferentes de estrato
a estrato, vale la pena estratificar.
• Si .2 ≤ Ph ≤ .8 ∀ h , no conviene usar los
estratos.
6.1.1.
Distribución Proporcional
• Un criterio es lo que se le llama distribució
distribución
(afijació
(afijación) proporcional,
proporcional, donde la muestra se
divide de manera proporcional a los tamaños
de los estratos Nh.
10
6.1.1.
Distribución Proporcional
Se busca que se cumpla la relación:
nh N h
=
= Wh .
n
N
De esta relación se tiene:
nh = n
6.1.1.
Nh
= nWh
N
(6.7)
Distribución Proporcional
También se emplea cuando el muestreo o
encuesta
va
a
determinar
varias
caracterí
características (varias mediciones) en cada
unidad de la población, incluso cuando se
quiere que sea “autoponderado”, es decir,
todos los elementos de la muestra tienen un
mismo factor de expansión N h = N .
nh
n
6.1.1.
Distribución Proporcional
Esta distribución de la muestra total se usa
cuando no se tiene informació
información sobre la
magnitud de las S2h, o que esas S2h sean
semejantes; se usa además cuando los
costos de muestrear las unidades en los
diferentes estratos son semejantes.
semejantes
6.1.1.
Distribución Proporcional
Con esta distribución proporcional se tiene:
N
Yˆ = ∑ Yˆh =∑ N h yh =∑ h
h =1
h =1
h =1 nh
L
L
L
L
nh
∑y
i =1
hi
nh
= k ∑∑ yhi
h =1 i =1
donde
k=
Nh
N
N
= h = .
nh n N h
n
N
11
6.1.2 Distribución Óptima
• Cuando se tienen costos muy diferentes para el
muestreo de unidades en los diferentes
estratos, se usa la distribució
distribución (afijació
(afijación) óptima.
ptima
Si el costo para obtener información de una
unidad en el estrato h-ésimo es Ch, el costo total
L
será:
C = C0 + Ch nh
(6.8)
∑
h =1
C0 es costo administrativo,
administrativo de instalación,
etcétera, general.
6.1.2 Distribución Óptima
• Para cualquier diseño de muestreo en los
estratos, la varianza del estimador del total se
podrá expresar como:
V (Yˆh ) =
Ah
+ (cte. que no involucra nh )
nh
6.1.2 Distribución Óptima
La minimización (variando las nh, sin cambiar otras
condiciones), de la varianza del estimador (6.2)
con costo fijo (6.8) o viceversa, produce la
distribució
distribución óptima que es:
nh = n
N h Sh  L N h Sh 
∑

Ch  h =1 Ch 
nh ∝
−1
(6.9)
N h Sh
Ch
Esto es para muestreo “mas”
mas” en todos los estratos.
6.2 Tamaño de Muestra Total
• Si lo que se quiere es encontrar aquel valor
de n que produce la mí
mínima varianza para un
costo total fijo C0, se deberá usar la
expresión (6.9) y sustituir en (6.8).
Entonces la distribució
distribución óptima es:
es
−1
Ah  L Ah 
Ah
nh = n
∑
 , nh ∝
Ch  h =1 Ch 
Ch
12
6.2 Tamaño de Muestra Total
Entonces tenemos:
n=
L
( C − C0 ) ∑
h =1
N h Sh
Ch
L
∑ N h S h Ch
(6.10)
6.2 Tamaño de Muestra Total
Si lo que se quiere es encontrar el valor de n
que produce el costo mí
mínimo para un error de
estimación δ determinado, entre el estimador
del total y el verdadero total, entonces se tiene
δ = 1.96 V (Yˆ ) .
h =1
Esto es usando la distribución óptima.
Los valores de Sh se deberán obtener con base
en muestras piloto de cada estrato,
estrato o bien por
conocimiento previo de la forma de la distribución
en cada estrato y el rango de variación.
6.2 Tamaño de Muestra Total
• Las expresiones (6.10) y (6.11) se refieren a
la estimación del total. Para estimar un
promedio, Y , la expresión (6.10) sigue siendo
válida pero la (6.11) debe modificarse:


ˆ

ˆ
ˆ
ˆ
P  Y − 1.96 V (Y ) ≤ Y ≤ Y + 1.96 V (Y )  =& .95
14243


δ


()
δ = 1.96 V Yˆ
Si se sustituye la varianza de la expresión (6.2)
con distribución óptima, se obtiene:
L
 L N S 
N h S h Ch  ∑ h h 
∑
(6.11)
h =1
 h =1 Ch 
n=
2
L
δ
+ ∑ N h S h2
2
(1.96 ) h =1
6.2 Tamaño de Muestra Total
Sustituyendo la varianza por la expresión (6.6) y
con nh óptimo se tiene:
 L N S 
S h Ch  ∑ h h 
h =1
 h =1 Ch 
n=
2
δ
1 L
+ 2 ∑ N h Sh2
2
N h =1
(1.96)
L
Nh
∑N
2
(6.11´)
Donde ahora δ es el error máximo permisible, con
confianza del 95%, entre el estimador del promedio
Yˆ , y el promedio poblacional Y . Nótese que las δ
en expresiones (6.11) y (6.11’) son muy diferentes.
diferentes
13
6.2 Tamaño de Muestra Total
• Las expresiones (6.10), (6.11) y (6.11’) se
usan cuando se quiere optimizar algo que
involucra el costo.
costo
6.3 Distribución Proporcional
• Si se va a usar la distribución proporcional se
puede recurrir a la expresión de la varianza
que es:
L
N h2 2
V (Yˆ ) =
S h − N h S h2
(6.12)
∑n
h =1
• Si el costo no es determinante y si se usa la
distribución óptima para Ch constante,
constante (6.10)
no deberá
deberá usarse.
usarse
• Es importante enfatizar que en (6.10), (6.11)
y (6.11’) se usa la distribució
distribución óptima.
6.3 Distribución Proporcional
Con este valor en lugar de las S2, se pueden usar
las expresiones (5.3) y (5.4) para obtener n.
Si se sustituye nh =
N
V (Yˆ ) =
n
∑
h
Nh
n se tiene:
N
L
∑N S −∑N S
h
h =1
2
h
h
2
h
(6.12)´
6.3 Distribución Proporcional
de donde:
L
• Si se quiere tener un coeficiente de variación fijo
(CVo), sin tomar en cuenta el tipo de distribución
del estimador Yˆ , se tendrá :
V (Yˆ ) 

CV0 = 
Y
1
N ∑ N h S h2
n=
(6.13)
h =1
Y
2
( CV0 )
2
L
+ ∑ Nh S
h =1
2
h
2
,
14
6.3 Distribución Proporcional
[
6.3 Distribución Proporcional
]
• Si se considera que Yˆ ~ Y , V (Yˆ ) y se desea tener:
[
]
P | Yˆ − Y |< δ = 1 − α ,
L
zα / 2 =
de aquí se tiene que
n=
δ
V (Yˆ ) 


1
N
∑N S
h =1
h
2
h
−
1
N2
L
∑N S
h =1
δ2
h
h =1
L
(6.14)
+ ∑ N h Sh2
h =1
6.4 Conclusiones
• Es relativamente sencillo modificar las expresiones
(6.13) y (6.14) para considerar la estimación de Y .
El cambio fundamental está en que se debe
sustituir Yˆ por Yˆ que es Yˆ , entonces:
1
1
V (Yˆ ) = 2 V (Yˆ ) =
N
nN
N ∑ N h S h2
z α2 / 2
2
6.3 Distribución Proporcional
L
de donde a partir de V (Yˆ ) se obtiene que n
debe de ser:
2
h
.
• Si se considera que el costo es importante,
importante esto
es, hay costos diferenciales en los estratos,
conviene usar la distribución óptima (6.9) y
determinar el tamaño de muestra con
expresiones (6.10), (6.11) o (6.11’).
• Si no hay costos diferenciales muy marcados y
se decide usar la distribución proporcional (6.7)
para determinar el tamaño de muestra total, se
usará (6.13), si se quiere fijar el coeficiente de
variación, sin consideraciones sobre la
distribución de los estimadores.
15
6.4 Conclusiones
• Si se quiere fijar la precisión (δ ) y la
confiabilidad (1-α) considerando distribución
normal para el estimador, se usará la
expresión (6.14).
Debe tenerse cuidado al señalar que todas las
expresiones anteriores determinan el tamaño
de muestra para estimadores globales de
toda la población. Las inferencias no son
para cada estrato con esas muestras.
muestras.
6.4 Conclusiones
Si lo que se desea es estimar media o totales
en cada estrato, las expresiones anteriores
no se deben usar, lo que se debe emplear
son fórmulas (5.3) y (5.4) para cada estrato
por separado y así determinar las nh a usarse
en cada uno de ellos. Por supuesto que en
este último caso la muestra total n es mucho
más grande. Esto es de esperarse, puesto
que ahora se están haciendo inferencias por
separado para L poblaciones.
16
Descargar