Evaluación de Impacto

Anuncio
Evaluación de Impacto
Martín A. Rossi
Universidad de San Andrés
Plan de la presentación
„
1. Introducción al problema de la evaluación de
„
proyectos. Tipo de datos. Los enfoques Antes y
Después (Before and After); Con y Sin (With and
Without); y Diferencias en Diferencias (Difference in
differences). Estudio de caso: impacto de subsidios
a la investigación en el desempeño académico de
los investigadores.
2. Evaluación de Impactos con diseño de asignación
aleatoria. Estudio de caso: Diseño de evaluación de
un programa de expansión de sistemas de agua
potable en zonas rurales.
3. Evaluación de Impacto con Métodos noexperimentales: Métodos de pareo (Matching) y
Regresión Discontinuada.
„
¿A qué llamamos “impacto”
de un proyecto?
„
„
„
„
El concepto fundamental en esta literatura es el de
causalidad
El impacto causal de un proyecto es la diferencia en un
indicador de interés (como por ejemplo el número de
patentes en un programa de soporte a la investigación)
con el proyecto y sin el proyecto
La mayor complicación proviene del hecho que en un
momento dado del tiempo, la unidad de interés (que en
el ejemplo es un investigador) está o no está expuesta al
proyecto
Por lo tanto, necesitamos construir un escenario
contrafactual
‰
Qué hubiese sucedido en la ausencia del proyecto
¿Cómo medir el impacto de un proyecto?
„
„
„
O, ¿cómo construir el contrafactual?
Depende del tipo de información disponible, y de
cómo fue generada esta información
Tipo de información disponible
‰
‰
‰
‰
„
Datos después del proyecto para el grupo tratado
Datos antes y después del proyecto pero sólo para
agentes expuestos al proyecto
Datos después del proyecto para agentes expuestos y no
expuestos al proyecto
Datos antes y después del proyecto tanto para agentes
expuestos como no expuestos al proyecto
Cómo fueron generados estos datos
‰
De forma experimental o no experimental
Tipo de información disponible
„
„
„
„
En general, casi todos los proyectos pueden ser
evaluados
Pero los supuestos necesarios para construir el
escenario contrafactual dependen en forma crucial
del tipo de información disponible
Por lo tanto, el tipo de información disponible es
determinante al momento de evaluar qué tan
confiables van a ser los resultados de la evaluación
Veamos cuáles son los supuestos necesarios
dependiendo del tipo de información disponible
Formato de los datos
„
„
„
„
Datos después del proyecto, y solo para el
grupo tratado
Datos en formato de panel, pero solo para
los tratados: Before and After
Datos de corte transversal, tanto para el
grupo tratado como para un grupo de control
(no tratado): With and Without
Datos en formato de panel, tanto para el
grupo tratado como para un grupo de control:
Difference in Differences
Información post-proyecto pero
solo para el grupo tratado
Antes
Grupo tratado
Después
90
Grupo de control
Si solo se tiene información para el grupo
tratado después del proyecto, entonces es
imposible decir algo respecto del impacto del
proyecto, ya que no es posible construir un
escenario contrafactual
Información para el grupo tratado antes
y después del proyecto
Grupo tratado
Antes
Después
70
90
Grupo de control
Diferencia antes/después = 90 – 70 = 20
Denominado enfoque Before and After
Bajo supuestos muy fuertes esto puede llegar a
funcionar
Pero usualmente no es el caso
Problema con este enfoque
„
„
El problema fundamental con el enfoque Before
and After es que el impacto del proyecto se
confunde con cualquier otro evento que haya
sucedido en ese momento y que también
pueden eventualmente haber afectado al
indicador de interés
Esto es, la situación antes del proyecto en
general no es un buen contrafactual
‰
Ejemplo: programa de entrenamiento laboral con
datos en el 2007 y en el 2010. La variación de los
salarios (el indicador de interés) estaría contaminada
por los efectos de las crisis del año 2009
Supuesto
„
„
„
„
El supuesto fundamental del enfoque Before and
After es que el nivel del indicador de interés no
hubiese cambiado en ausencia del proyecto
En otras palabras, el nivel del indicador antes de la
intervención es utilizado como contrafactual
En la mayoría de los casos este supuesto es muy
fuerte
Esto es, la ausencia de un grupo de control no
implica que no haya un contrafactual; implica que el
contrafactual no es muy creíble en la mayoría de las
aplicaciones
Sobre-estimación del impacto
del proyecto
Indicador del impacto
después
Impacto
atribuido al
proyecto con
el enfoque
Before & After
Contrafactual
antes
proyecto
tiempo
Subestimación del impacto del proyecto:
capacitación laboral
Salarios
1000
900
700
t-2
t-1
t
t+1
Tiempo
Ejemplo en el cual el supuesto
probablemente no se cumpla
„
„
„
„
„
Supongamos un programa de capacitación laboral en el
momento t
Si se comparan los salarios en t-1 y t+1, la conclusión sería que
el programa no ha tenido efecto sobre el salario promedio
Sin embargo, el hecho que hubiese una tendencia negativa
antes del proyecto nos puede hacer suponer que esa tendencia
hubiese continuado igual en ausencia del proyecto
Por lo tanto, en este caso particular el efecto positivo del
proyecto es subestimado si uno realiza una estimación Before
and After
Lo importante es notar la conveniencia de disponer de más de
una observación antes del tratamiento, de forma tal de poder
estimar en forma más o menos confiable la tendencia de la
variable de interés
Datos post-proyecto para el grupo
tratado y el grupo no tratado
Antes
Después
Grupo tratado
90
Grupo de control
60
Diferencia simple = 90 – 60 = 30
Denominado enfoque With and Without
Esto puede llegar a funcionar si los dos grupos eran
similares antes de la intervención
Pero sin información antes del proyecto es imposible
testear este supuesto (pensar en el caso donde los números
eran los mismos antes del proyecto)
With and without
„
„
„
„
„
Utilizado cuando los datos son de corte transversal
Compara la diferencia en el indicador de interés
después del programa entre los participantes y no
participantes
El supuesto es que no hay sesgo de selección; esto
es, que no hay diferencias antes del proyecto entre
el grupo de participantes y el grupo de no
participantes
El nivel del indicador correspondiente al grupo de
control es utilizado como contrafactual
La ventaja es que este enfoque se puede utilizar
cuando no se dispone de información antes del
programa
Problema con este enfoque
„
„
„
La diferencia entre el indicador de interés en el
grupo tratado y en el grupo no tratado no siempre
refleja el impacto del proyecto
En cambio, puede estar reflejando una medida
compuesta tanto por el impacto del proyecto como
por diferencias preexistentes entre ambos grupos
A esto último se lo denomina sesgo de selección
‰
Ejemplo: evaluación del impacto de estudiar en Harvard
Datos antes y después del proyecto tanto para
el grupo tratado como el no tratado
Antes
Después
Grupo tratado
70
90
Grupo de control
55
60
Doble diferencia = (90-70)-(60-55) = 15
Denominado enfoque Diference in Differences
Datos de panel, con información tanto para el
grupo tratado como no tratado es el escenario
ideal para evaluar el impacto de un proyecto
Difference in differences: concepto
„
„
„
Combina los enfoques before and after y
with and without
Compara los cambios en el grupo de
participantes con respecto a los cambios en
el grupo de no participantes
Requiere datos de panel, tanto para el
grupo tratado como para el grupo de
control
Supuesto detrás del enfoque de
difference in differences
„
„
„
El supuesto de identificación del enfoque difference
in differences es que los controles han evolucionado
en el período pre- a post-proyecto de la misma
forma en que los tratados lo hubieran hecho en
ausencia del proyecto
En otras palabras, el cambio en el indicador de
interés para los individuos en el grupo de control es
un estimador no sesgado del contrafactual
Recordar que en el enfoque with and without el
contrafactual era que el nivel del indicador de los
individuos en el grupo de control
Difference in differences
Mejor escenario posible
Health
peformance
Treatment Group Trend
Control Group Trend
Time
Electricity Investments
Difference in differences cuando los niveles
iniciales son distintos
Treatment Group Trend
Health
peformance
Control Group Trend
Time
Electricity Investments
Diferencias preexistentes en los niveles
„
„
Una de las grandes ventajas de difference in
differences es que no es necesario controlar
por características no observables, siempre y
cuando éstas no varíen en el tiempo
Sin embargo, diferencias en los niveles
iniciales pueden estar reflejando que futuros
shocks afecten distinto a los individuos en los
distintos grupos
Difference in differences cuando las tendencias
antes del proyecto eran distintas
Treatment Group Trend
Health
peformance
Counterfactual Trend
Control Group Trend
Time
Electricity Investments
Diferencias preexistentes en las tendencias
„
„
Dado que las tendencias eran distintas antes
del proyecto, es improbable que las
tendencias hubiesen sido similares en el
escenario contrafactual
Por lo tanto, la tendencia del grupo de control
no es un buen contrafactual de la tendencia
del grupo tratado
Caso de estudio: FONCYT
„
„
„
En Chudnovsky, Lopez, Rossi, y Ubfal (2008)1
evaluamos el impacto de subsidios a la investigación en
el desempeño académico de los investigadores
El desempeño académico lo medimos en términos del
número de publicaciones y del índice de impacto en
revistas con referato
El grupo de control está conformado por investigadores
que aplicaron al subsidio pero que no lo obtuvieron
‰
Ayuda a controlar por motivación
1. Chudnovsky, Lopez, Rossi, and Ubfal (2008).“Money for Science? The
Impact of Research Grants on Academic Output.” Fiscal Studies 29 (1), 7587
Diseño para la evaluación: dif-in-dif
„
„
„
„
Utilizamos el enfoque difference in difference
En este enfoque no es necesario controlar
explícitamente por características individuales
que son invariantes en el tiempo ya que ellas
son absorbidas por el efecto individual
El supuesto es que el cambio en el
desempeño académico del grupo de control es
un buen contrafactual
Este supuesto no puede ser testeado, pero si
podemos testear si las tendencias eran
paralelas antes del tratamiento
Test informal del supuesto de
identificación: publicaciones
Figure 1. Trends in the number of publications
2.5
FONCYT
Annual average
2
1.5
Not financed
Financed
1
0.5
0
1994
1995
1996
1997
1998
1999
Year
2000
2001
2002
2003
2004
Test informal del supuesto de
identificación: índice de impacto
Figure 3. Trends in the quality index of publications.
5
4.5
FONCYT
4
Annual average
3.5
3
2.5
Not financed
Financed
2
1.5
1
0.5
0
1994
1995
1996
1997
1998
1999
Year
2000
2001
2002
2003
2004
Recapitulando
„
„
„
El principal supuesto en el enfoque before and after es que el
nivel del indicador de interés antes del tratamiento es un buen
contrafactual
El principal supuesto en el enfoque with and without es que el
nivel del indicador en el grupo de control es un buen
contrafactual
‰ Supuesto muy fuerte, necesidad de utilizar un procedimiento de
matching
El principal supuesto en el enfoque difference in differences es
que el cambio en el indicador de interés en el grupo de control
es un buen contrafactual
‰ Supuesto aceptable, especialmente si se pueden testear las
tendencias antes de tratamiento
¿Cómo fueron generados los datos?
„
„
La confiabilidad de los resultados va a depender no
solo del formato de los datos, sino también de cómo
fueron generados los datos
Dos posibilidades
‰
‰
„
Experimental
No experimental (o cuasi-experimental)
La mejor práctica actual es generar los datos de
forma experimental
‰
Identificar el grupo de agentes que cumple las condiciones para
formar parte del proyecto, y luego asignar aleatoriamente a estos
agentes al grupo de tratamiento y al grupo de control
¿Por qué se considera al enfoque
experimental como la mejor práctica posible?
„
„
Si la muestra es lo suficientemente grande,
entonces el grupo tratado y el grupo de control
tendrán características (observables y no
observables) similares
Por lo tanto, cualquier diferencia después del
proyecto puede ser atribuida al proyecto
‰
‰
„
Ejemplo de características observables: edad
Ejemplo de características no observables: motivación
Crucial: que la muestra sea lo suficientemente
grande para poder confiar en la Ley de los
Grandes Números
Causalidad
„
„
La noción fundamental para poder establecer
relaciones de causalidad es el potencial de cada
individuo a estar expuesto o no a la causa
Para inferencia causal, un requerimiento es que
cada individuo potencialmente pueda ser
expuesta a cualquiera de las causas
‰
Ejemplo, los años de escolaridad pueden ser una
causa, pero la raza no
Aleatorización en dos etapas
„
El diseño ideal es en dos etapas
‰
‰
En una primera etapa se obtiene aleatoriamente
un conjunto de agentes elegibles para el proyecto
En una segunda etapa a este conjunto de
agentes elegibles se los asigna aleatoriamente a
tratamiento o a control
Randomización en la primera etapa:
Validez externa
„
„
El hecho que el subgrupo de agentes elegibles
haya sido selecto en forma aleatoria en la
primera etapa asegura que las conclusiones del
estudio de evaluación de impacto tiene validez
externa, esto es, que los agentes elegibles son
representativos de la población
Esto es importante porque brinda información
acera de la posibilidad de replicar el programa
en otros lugares
Randomización en la segunda etapa:
Validez interna
„
La asignación aleatoria de los individuos
elegibles a tratamiento y control garantiza la
validez interna
‰
‰
Garantiza que los dos grupos son idénticos en
valor esperado
Por supuesto, hay que chequear que se cumpla
en la muestra
Necesidad de tener una muestra lo
suficientemente grande
„
Fundamental para garantizar la validez interna
„
La asignación aleatoria garantiza que, en promedio, los
valores de cualquier variable son iguales para ambos
grupos
„
Sin embargo, en una muestra los valores pueden diferir
en nuestras muestras
„
Por ello se necesitan hacer cálculos de potencia
estadística y tener muestras muy grandes
Estimación
„
„
En este contexto, el efecto causal promedio de
tratamiento puede ser estimado muy fácilmente
mediante Mínimos Cuadrados Clásicos
El modelo a ser estimado es
yi = α + β Di + ε i
„
donde ß es el parámetro de interés, yi es el
indicador de interés para el agente i, Di es una
variable dicotómica que toma el valor uno si el
agente i fue asignado a tratamiento, y εi es el
término de error
Estudio de caso – enfoque experimental
„
Diseño de evaluación de un programa de
expansión de sistemas de agua potable en
zonas rurales
‰
‰
Ejemplo de como realizar una evaluación
utilizando asignación aleatoria
Y teniendo en cuenta tanto restricciones políticas
como de implementación práctica
Background
„
„
El proyecto a ser evaluado promete proveer
con nuevos sistemas de agua potable a un
grupo de pequeñas aldeas en la zona rural
de Lesotho
El objetivo es alcanzar a 174 aldeas que
actualmente no poseen un sistema de agua
potable confiable
Evaluación “Ex-ante”
„
„
„
El gobierno anticipó la necesidad de hacer
una evaluación de impacto del proyecto
Y le requirió al director del proyecto
considerar la necesidad de la futura
evaluación al momento de diseñar el
proyecto
Este detalle facilita enormemente la posterior
evaluación
Estrategia de evaluación
„
„
Recomendamos usar asignación aleatoria
Sin embargo, reconocimos la existencia de
restricciones, tanto políticas como prácticas
Restricción política
„
„
„
„
El gobierno pretendía que las 174 aldeas fueran
alcanzadas por el proyecto
¿Significa esto que no es posible hacer un diseño
experimental?
NO!! Dado que el propio gobierno reconoció su
incapacidad de comenzar simultáneamente en todas las
aldeas
Por lo tanto, propusimos sortear el orden en el que se va
a implementar el proyecto (phase-in)
‰
„
Las aldeas que reciben el proyecto al final, actúan de grupo de
control de las que lo reciben al principio
En general, los gobiernos aceptan esto como factible
Diseño preferido
Year
1
2
3
4
5
„
Timing of works and evaluation
Group 1
Group 2
Baseline survey
Baseline survey
Works
----Mid-term survey
Mid-term survey
Works
----Long-term survey
Long-term survey
Group 3
Baseline survey
--Mid-term survey
--Long-term survey
Works
Este diseño permite medir el impacto de medio
término y de largo término del proyecto
‰
‰
Se utilizan los grupos 2 y 3 como grupo de control del
grupo 1 en el análisis de medio término
Y el grupo 3 como grupo de comparación del grupo 1 en el
análisis de largo término
Restricción práctica
„
„
El consultor a cargo de la implementación
opinó que era mejor trabajar en los 5 años,
sin huecos en el medio
El diseño alternativo contempla esta
posibilidad, dividiendo las 174 aldeas en 5
grupos, en lugar de 3
Diseño alternativo
Year
1
2
3
4
5
„
„
Group 1
Baseline
survey
Works
Timing of works and evaluation
Group 2
Group 3
Group 4
Baseline
Baseline
survey
survey
Group 5
Baseline
survey
Works
Mid-term
survey
Mid-term
survey
Works
Mid-term
survey
Mid-term
survey
Works
Long-term
survey
Long-term
survey
Long-term
survey
Works
Ahora usamos a los grupos 3, 4 y 5 como control del grupo
1 en el análisis de mediano término (y eventualmente el
grupo 5 como control del grupo 3)
Y utilizamos el grupo 5 como control del grupo 1 en el
análisis de largo término
Timing de las obras y de las encuestas
„
„
En todos los años/grupos en los cuales hay
trabajos y encuestas, la encuesta debe ser
realizado antes que comiencen las obras
Las encuestas deben ser realizadas siempre
en la misma estación (lluvia/seca;
verano/invierno)
Complicaciones a la utilización del
enfoque experimental
„
„
El principal problema se da cuando algunos
agentes originalmente asignados al grupo de
tratamiento terminan no recibiendo el
tratamiento, o cuando algunos agentes
originalmente asignados al grupo de control
terminan recibiendo el tratamiento
A esto se lo llama el problema de noncompliance
Posibles amenazas al diseño
experimental
„
„
„
„
Non compliance
Efectos placebo
Attrition
Efectos derrame (spillovers
Non compliance
„
„
El principal problema se da cuando algunos
agentes originalmente asignados al grupo de
tratamiento terminan no recibiendo el
tratamiento, o cuando algunos agentes
originalmente asignados al grupo de control
terminan recibiendo el tratamiento
Solución, utilizar la asignación aleatoria
original
Placebo
„
„
„
„
„
El efecto placebo es la relación positiva entre la respuesta
de la unidad al tratamiento y las expectativas de la unidad
acerca de estar expuesta al tratamiento
En un típico procedimiento experimental en medicina, el
grupo tratado recibe el medicamento mientras que el grupo
de control recibe un placebo, una pastilla que se ve igual
pero que no tiene ningún efecto sobre la salud
Nadie, ni los pacientes ni los médicos saben quién recibió
la medicina y quién recibió el placebo
Por lo tanto, los experimentos médicos pueden obtener el
efecto de tratamiento neto del efecto placebo, ya que tanto
el grupo tratado como el grupo de control tienen las
mismas expectativas acerca de la posibilidad de ser o no
tratado
En ciencias sociales es muy dificil, si no imposible,
controlar por efectos placebo (la gente sabe si está siendo
tratada)
Attrition
„
„
„
Algunas unidades desaparecen de la muestra en
algún punto del tiempo entre la encuesta de línea
de base y la encuesta final
Esto puede ser un problema si las unidades
tratadas dejando la muestra son distintas a las
unidades no tratadas dejando la muestra, ya que en
este caso la asignación al tratamiento en la muestra
resultante deja de ser aleatoria
Que se puede hacer? No mucho, al menos
chequear balancing en el grupo de los que dejan la
muestra
Spillovers o efectos derrame
„
Algunas unidades que no reciben el tratamiento
pueden beneficiarse del hecho que otras unidades
estén siendo tratadas
‰
„
Ejemplo, vacunas
Una forma de atenuar el problema es hacer la
aleatorización al nivel de grupo, no individual
‰
Ejemplo, vacunas por municipio
Enfoques no experimentales
„
Varias alternativas
‰
‰
„
„
„
Matching
Regresión discontinuada
En general, la idea central de estos enfoques es
buscar agentes que no participan del proyecto que
tengan características observables similares a los que
participan del proyecto
La intuición es que si las características observables
son similares, entonces es probable que también lo
sean las no observables
Todos estos enfoques son second best comparados
con el enfoque experimental
Matching
„
„
„
Utilizado cuando los datos no son generados en
forma experimental, y cuando se dispone de datos
de corte transversal (esto es, no se dispone de
datos antes del tratamiento)
Es un procedimiento que mejora al enfoque with
and without
El indicador de interés de cada participante es
comparado con el indicador de interés
correspondiente a un o un grupo de no participantes
con caractarísticas similares al participante
Supuesto
„
„
El principal supuesto es que la selección
al grupo tratado depende solo de variables
observables
Esto es, condicional en el conjunto de
variables observables disponible, todas
las características no observables
relevantes se encuentran balanceadas
entre el grupo de control y el grupo de
tratamiento
Propensity score matching
„
„
„
Problema con matching: en los casos en los
que hay muchas características observables,
es improbable encontrar un no participante
para cada uno de los participantes que
comparta todas estas características
Solución: realizar el matching de
participantes y no participantes basado en el
los propensity scores estimados
A este procedimiento se lo denomina
propensity score matching
Propensity score matching (cont.)
„
„
„
Rosenbaum and Rubin (1983) demostraron
que es lo mismo hacer matching con todas las
características que hacerlo con el propensity
score estimado
Se reduce un problema multidimensional a un
problema unidimensional
Ahora es más sencillo encontrar buenos
matches o comparadores
PSM: procedimiento
„
„
„
Estimar un modelo de elección discreta (Y=1 si
tratado y Y=0 si no tratado) condicional en el
vector de características observables X (Probit
o Logit)
Predecir los propensity scores individuales
basados en la estimación anterior (la
probabilidad de ser tratado de acuerdo al
modelo estimado)
Utilizar un promedio ponderado de los no
participantes como contrafactual de cada
participantes
PSM procedimiento (cont.)
„
Estimar el efecto promedio de tratamiento como
N0
N1
⎛
⎞
1
ˆ
ATT =
⎜ y1i − ∑ wij y0 j ⎟
∑
N1 i =1 ⎝
j =1
⎠
„
Donde
‰
‰
‰
‰
‰
N1 es el número de participantes
N0 es el número de no participantes
i indexa a los participantes
j indexa a los no participantes
wij son las ponderaciones
N0
wij ∈ [ 0,1] and
∑w
j =1
ij
=1
PSM procedimiento (cont.)
„
„
Cuanto menor es la diferencia en los propensity
scores estimados, mayor es el peso que se le
asigna al no participante en la construcción del
contrafactual del participantes
Diferentes enfoques para estimar las
ponderaciones
‰
‰
‰
Vecino más cercano
Calibre
Kernel
Vecino más cercano
„
„
Se le asigna ponderación igual a uno al no
participantes con la menor distancia al
participante |pi-pj|
Todos los demás no participantes tienen una
ponderación igual a cero
Calibre
„
„
„
El participante i solo es incluido en el cálculo
final del impacto promedio, si hay algún no
participante cuya distancia sea menor a
algún número prefijado: |pi-pj|<H
Reduce la posibilidad de tener malos
matches
Pero algunos participantes pueden no entrar
en el cálculo
Kernel
„
„
Todos los no participantes tienen una
ponderación positiva en el cálculo del
contractual de todos los participantes
La ponderación es inversamente
proporcional a la distancia entre los
propensity scores estimados |pi-pj|
El soporte común
„
Para incrementar la comparabilidad, la
muestra se restringe al soporte común
‰
Se reduce el sesgo proveniente de no tener
comparadores
Densidad
Densidad de los propensity scores
de los participantes
0
1
Propensity score
Densidad
Densidad de los propensity scores de
los no participantes
0
1
Propensity score
Densidad
0
Densidad de los propensity scores
de los no participantes
Región de soporte común
Propensity score
1
Lecciones del enfoque matching
„
„
„
Herramienta útil para controlar por
heterogeneidad no observable cuando no se
dispone de datos experimentales ni de datos
antes del proyecto
En la práctica, condicionando en
características observables, matching
remueve el sesgo asociado a diferencias pretratamiento entre los grupos tratado y no
tratado
Validez del enfoque depende enormemente
de la calidad y cantidad de características
observables que se disponga
Combinación de matching y
difference in differences
„
Matching
‰
„
Solución
‰
‰
„
Selección depende solo de observables
Combinar matching y difference-in-differences
Esto permite controlar por no observables
constantes en el tiempo
Condición
‰
Disponer de datos de panel
Difference-in-differences matching
„
Matching
ˆ
ATT
Matching
„
N0
⎞
1 N1 ⎛
=
⎜ y1i − ∑ wij y0 j ⎟
∑
N1 i =1 ⎝
j =1
⎠
Difference-in-difference matching
ˆ
ATT
Matching , DvD
N0
⎞
1 N1 ⎛
=
⎜ ( y1it − y0it ) − ∑ wij ( y0 jt − y0 jt ) ⎟
∑
N1 i =1 ⎝
j =1
⎠
Regresión discontinuada
„
„
Este enfoque se caracteriza por el hecho que
la probabilidad de participar del proyecto
varía en forma discontinua con respecto a
una variable
Existe un umbral en una variable que es el
que determina si el individuo participa o no
del proyecto
Regresión discontinuada (cont.)
„
Explota la regla que genera asignación al
programa solo para aquellos individuos por
encima del umbral
‰
„
„
Asume discontinuidad en la participación pero no en
otras variables
Contrafactual: los individuos justo debajo del
umbral
Esto es, alrededor del umbral es como tener un
“experimento”, en el sentido que el grupo de
control es similar al grupo de tratamiento
Regresión discontinuada: ejemplo
„
„
„
„
„
„
„
Beca a estudiantes otorgada a aquellos con nota promedio
superior a 7 sobre 10
Hay una discontinuidad en 7
Supongamos que queremos estimar el impacto de la beca en
los salarios futuros
Comparar los salarios de los becados y no becados no
parece una buena estrategia, ya que probablemente sobre
estimaría el impacto
¿Por qué? En promedio, se podría pensar que aquellos con
promedios por encima de 7 son más inteligentes o motivados
que aquellos con promedios por debajo de 7
Por lo tanto, es posible que sus salarios futuros de los dos
grupos hubiesen sido distintos aún en ausencia de la beca
Y no es posible controlar por inteligencia o motivación porque
no son observables por el investigador
Regresión discontinuada: ejemplo (cont.)
„
„
„
„
¿Cómo opera RD?
Comparando aquellos estudiantes cuyas notas promedio
se encuentran justo por encima de 7 (y por lo tanto
reciben la beca) con aquellos estudiantes cuyas notas
promedio se encuentran justo por debajo de 7 (y por lo
tanto no reciben la beca)
¿Cuál es el supuesto de identificación?
Todas las variables no observables que afectan los
salarios futuros se encuentran balanceadas para
aquellos estudiantes en un entorno del punto de corte
‰
En particular, tanto la motivación como la inteligencia son
similares para un estudiante con un promedio 7.01 como para
uno con un promedio 6.99
Tipos de diseño para regresiones
discontinuadas
„
Hay dos tipos de diseño
‰
‰
‰
El diseño sharp y el diseño fuzzy
En el diseño sharp, la selección al tratamiento
depende de forma determinística de una variable
observable, y además se conoce el punto umbral
En el diseño fuzzy, la selección al tratamiento es
aleatoria condicional en la variable observable,
pero la probabilidad condicional es discontinua en
el punto umbral
„
En el diseño fuzzy hay “non-compliers” (por lo que hay
que usar Variables Instrumentales)
Potenciales problemas
„
„
Potencial pérdida de poder estadístico
debido al uso de una sub-muestra
Potencial problema de validez externa
‰
‰
„
La posible existencia de efectos de tratamiento
heterogéneos sugiere que las estimaciones solo
son válidas alrededor del punto de corte
Cuidado al querer extrapolar los resultados a la
población
Los individuos no tienen que poder manipular
el punto umbral ni tener comportamiento
estratégico en base al punto umbral
Regresión discontinuada: ejemplo (cont.)
„
„
„
Volviendo al ejemplo de las becas
La pérdida de poder estadístico se debe a que sólo
estamos usando para calcular el efecto de
tratamiento a aquellos estudiantes, digamos, con
notas promedio entre 6.50 y 7.50
El problema de validez externa se debe a que las
becas pueden tener un impacto distinto para
alumnos con diferentes promedios
‰
„
Por ejemplo, las becas podrían beneficiar más a aquellos
con promedios altos comparado con aquellos con
promedios más bajos
La manipulación es también un problema si es que
los estudiantes conocen de antemano que las
becas serán otorgadas a los alumnos con
promedios superiores a 7 puntos
Descargar