2- Sesion 5 Tecnica Muestreo Poder

Anuncio
Sesión VII
Muestreo y Poder
Christel Vermeersch
Noviembre 2006
Introducción
p
Objetivo: evaluar programas y/o intervenciones
( ¿Tiene efecto o no?)
p
Necesitamos suficientes datos para detectar cambios
debidos a la intervención:
→ parte 1: discusión sobre poder
p
Necesitamos datos representativos:
→ parte 2: discusión sobre muestreo
HDN LAC FPSI WBI
2
PARTE 1: Evaluar el efecto
p
p
Evaluar una intervención es una prueba de significancia
Ejemplo: y es el resultado de una prueba de logro. Estimamos el
efecto de doblar el presupuesto de la escuela en el resultado
promedio de la prueba de logro.
H0: E(y|Tratamiento) = E(y|Control)
H1: E(y|Tratamiento) > E(y|Control)
Intervención tiene efecto
(en realidad)
Prueba
estadística
HDN LAC FPSI WBI
No
Si
Rechazamos H0
Error tipo I
OK
No rechazamos
H0
OK
Error tipo II
3
Error de tipo I
HDN LAC FPSI WBI
4
Error de tipo II y poder
HDN LAC FPSI WBI
5
Errores tipo I y tipo II
p
Error tipo I = α
n
n
n
p
Error tipo II = β
n
p
probabilidad de no rechazar la hipótesis nula cuando está falsa
Poder = 1 - β
n
n
p
probabilidad de rechazar la hipótesis nula cuando ésta es verdadera
probabilidad de concluir que la intervención tiene efecto si no tiene
efecto
Valores típicos: 0.01, 0.05, 0.1
probabilidad de rechazar la hipótesis nula cuando una hipótesis
alternativa es verdadera
probabilidad de concluir que la intervención tiene efecto si
realmente tiene efecto
Queremos maximizar el poder de la muestra, dado el nivel α
HDN LAC FPSI WBI
6
Qué afecta el poder de una prueba?
El poder de la prueba aumenta cuando…
p Aumenta a (el error de tipo I)
p Aumenta el tamaño del efecto esperado
p Disminuye la varianza del indicador… como???
n La varianza del promedio es proporcional a 1/n, donde n es
el tamaño de la muestra à aumentar el tamaño de la
muestra
? Para detectar un cambio de indicador dado con un error de tipo
a dado, hay que aumentar el tamaño de la muestra.
? En la practica, se calcula el tamaño de muestra necesario para
detectar un cambio X en el indicador, con un alpha de 5 % y
un poder de 80/90 %.
HDN LAC FPSI WBI
7
Algunas simulaciones en Stata
*computar el tamaño de la muestra;
sampsi 130 135, alpha (0.05) power(0.8) sd1(15)
sd2(18) onesided;
*aumentamos el efecto esperado del programa==>
se necesita una muestra mas pequeña;
sampsi 130 145, alpha(0.05) power(0.8) sd1(15)
sd2(18) onesided;
*aumentamos el poder requerido ==> se necesita
una muestra mas grande;
sampsi 130 135, alpha (0.05) power(0.9) sd1(15)
sd2(18) onesided;
HDN LAC FPSI WBI
8
Algunas simulaciones en Stata
*computar el poder de una prueba;
sampsi 130 135, alpha (0.05) sd1(15) sd2(18)
n1(100) n2(100) onesided;
*aumentamos el efecto esperado del programa==>
poder aumenta;
sampsi 130 145, alpha (0.05) sd1(15) sd2(18)
n1(100) n2(100) onesided;
*aumentamos el tamaño de la muestra => poder
aumenta;
sampsi 130 135, alpha (0.05) sd1(15) sd2(18)
n1(200) n2(200) onesided;
HDN LAC FPSI WBI
9
Parte 2: Muestreo (? Datos representativos)
p
Encuestas representativas
n
n
p
Meta: aprender acerca de la población
p (p.ej. ENCOVI: encuesta nacional)
Muestra: representativa de toda la población
Evaluación de impacto
n
n
n
n
Meta: medir los cambios de indicadores claves en la
población objetiva/ grupo de interés
En la práctica: medir la diferencia entre los grupos de
tratamiento y de control
Concentrar estratégicamente la muestra
Importancia del presupuesto
HDN LAC FPSI WBI
10
Definiciones
p
p
p
p
p
p
p
Unidad de análisis: El tipo de entidad para la cual
buscamos datos (personas, sitios, escuelas,…)
Población: El conjunto de todas las unidades de análisis
sobre las cuales queremos inferir conclusiones
Marco muestral: El listado de unidades de análisis utilizado
para sacar la muestra (?Cual es la situación ideal?)
Muestra: las unidades de análisis sacadas del marco
muestral, para las cuales intentamos recollectar datos
Encuestados: las unidades de análisis de la muestra para las
cuales conseguimos datos.
Fracción muestral: proporción de casos del marco muestral
seleccionada para la muestra (n/N)
Tasa de respuesta: proporción de unidades de análisis de la
muestra para las cuales recollectamos datos.
HDN LAC FPSI WBI
11
Gráficamente…
Población
Marco muestral
Muestra
Encuestados
HDN LAC FPSI WBI
12
Validez interna del experimento
n
n
n
i.e. dentro del experimento
Pregunta: ?El grupo control es válido?
No hay diferencia sistemática entre el grupo control y el
grupo tratamiento en ausencia de la intervención.
HDN LAC FPSI WBI
13
Validez externa del experimento
p
p
p
p
p
p
p
?Se pueden generalizar los resultados del experimento a beneficiarios fuera
del experimento?
Eso depende del marco muestral del experimento y del método de muestreo
Necesitamos representatividad al nivel de la población meta
n Si no vamos a implementar la intervención nunca para personas de tipo
X, no tiene sentido incluirlas en el marco muestral del experimento.
Representatividad para una población más diversa implica que necesitamos
una muestra más grande
n Por qué? La inclusión de población menos “sensible” a la intervención
diluye el efecto de la intervención
n Ejemplo: efecto de intervenciones de salud en diarrhea – concentrar la
muestra en los hogares con niños de menos de 5 años.
El presupuesto limita el tamaño de la muestra.
“Nunca arriesga su hipótesis central”
Balance entre el poder dentro de la población de interés y la representación
de la población.
HDN LAC FPSI WBI
14
Métodos de muestreo
p
Muestreo aleatorio
n
n
n
n
p
Simple: cada unidad en el marco muestral tiene la misma probabilidad
de ser seleccionada
Estratificado: el marco muestral se divide en dos o mas estratas, en
dónde se hace un muestreo simple
de conglomerados (“clusters”): se muestrean conglomerados de
unidades, ej. pueblos
Multi-etapa – combina dos o más de los métodos anteriores, ej. muestro
aleatorio (estratificado o simple) de pueblos, y muestreo aleatorio
simple de personas dentro de cada pueblo
Muestreo sistemático
n
Ej. Estudio de caso “típico”– no es correcto hacer análisis estadistico
sobre este típo de muestra!!!
HDN LAC FPSI WBI
15
El muestreo multi-etapa cambia
la varianza del indicador
p
Los individuos en un cluster tienden a ser más parecidos entre
ellos que con los de otros clusters:
n
p
10 hogares del mismo cluster nos dan menos información que 10
hogares de clusters diferentes
Consecuencia: errores estándar mayores que con un muestreo
aleatorio simple (MAS)
Var
ConCluster
n
n
n
= Var * (1 + ρ * (k − 1))
144244
3
deff
MAS
ρ es una medida del grado de homogeneidad entre los sujetos del
cluster para la medida de interés
k=numero de observaciones dentro de cada cluster
deff puede ser estimado tanto para medidas de asociación como para
medidas de prevalencia (o medias)
HDN LAC FPSI WBI
16
Ajuste de la muestra para compensar
el efecto de diseño
p
p
p
Varianza mas grande à poder de la prueba menor para un
tamaño de muestra fijo !!!
La pérdida de poder debida al efecto de diseño puede ser
compensada por incrementar el tamaño de muestra
Por cuanto tenemos que aumentar el tamaño de la muestra
cuando hay conglomerados en la muestra?
HDN LAC FPSI WBI
17
Tamaño de muestra con efecto de diseño
p
Utilizamos métodos estándares para determinar el tamaño
de muestra necesario bajo el método de muestreo aleatorio
simple, n .
Calculamos el tamaño de muestra necesaria para el
muestreo multi-etapas, con la formula siguiente:
MAS
p
n
ConCluster
p
p
= n * efdi = n * (1 + ρ * (k − 1))
MAS
MAS
Se necesita el tamaño estimado del cluster y un valor de ρ que es una característica de la población estudiada
Utilizar Stata!
HDN LAC FPSI WBI
18
Después de que tengamos la muestra… …
Población
Marco muestral
Muestra
Encuestados
HDN LAC FPSI WBI
19
La tasa de respuesta …
p
p
p
p
p
p
Idealmente es 100 por ciento
Cuando es baja, hay un riesgo de sesgo debido a la selección de los
encuestados, p.ej. cuando los “control” no quieren participar en la encuesta
de seguimiento.
Debe de ser más de 70 por ciento en ambos grupos (control y tratamiento)
No puede ser significativamente diferente entre grupos control y
tratamiento
?Que hacemos cuando la tasa de respuesta es baja?
n Mala solución: aumentar el tamaño de muestra para “compensar”
n Buenas soluciones:
p hacer esfuerzos suplementarios para recolectar información sobre
los non-respondientes.
p Sub-muestrar los non-respondientes para investigar si son
diferentes de los respondientes.
p Comparar las características línea base de los respondientes y nonrespondientes.
Es imperativo informar sobre la tasa de respuesta en el informe de
evaluación
HDN LAC FPSI WBI
20
Descargar