Economía Aplicada Angrist y Krueger, The Quarterly Journal of

Anuncio
Economía Aplicada
Aplicación de Variables Instrumentales
Angrist y Krueger,
The Quarterly Journal of Economics, 1991
Does compulsory school attendance aect schooling and earnings?
Departamento de Economía
Universidad Carlos III de Madrid
Ver también Angrist y Pischke (cap. 4)
Introducción
Retorno a la educación
Un ejemplo típico de endogeneidad se presenta al querer estimar el
retorno a la educación regresando ingresos sobre nivel educativo. Una
variable omitida en dicha ecuación es la capacidad o habilidad de los
individuos.
Si las personas más capaces tienen en promedio mayor nivel educativo
y a la vez mayores ingresos, el nivel educativo estará correlacionado
con el término de error y MCO no arrojará estimaciones conables.
Angrist y Krueger en este artículo proponen solucionar el problema de
endogeneidad de la variable educación usando variables instrumentales.
El instrumento propuesto es la fecha de nacimiento medida por el
trimestre de nacimiento.
1 / 18
Idea
Idea de la legislación en EEUU
La idea surge del sistema de educación obligatoria en EEUU: la ley
obliga a asistir a la escuela hasta cumplir 16 años. Y los niños
comienzan la escuela el año calendario en el que cumplen 6 años.
Por ejemplo un estudiante nacido en enero, comienza la escuela con 6
años (y 8 meses) y al cumplir 16 tendrá 9 años completos de
escolarización. Un estudiante nacido en diciembre, comienza la escuela
con 5 años (y 9 meses) y al cumplir 16 tendrá 10 años completos de
escolarización.
Dependiendo de la fecha de nacimiento, los estudiantes estarán en
niveles diferentes al cumplir la edad legal mínima para abandonar la
educación.
2 / 18
Instrumento
Validez del instrumento
Exógeno: la fecha de nacimiento no debería afectar los ingresos de
manera directa (no correlacionado con habilidad, motivación,
conexiones familiares, etc.).
Relevante: correlacionado con el nivel educativo alcanzado.
Angrist y Krueger usan datos del censo de 1980 en EEUU para
hombres nacidos entre 1930 y 1959. Para replicar el artículo usaremos
datos obtenidos de Joshua Angrist Dataverse, un extracto para
hombres nacidos entre 1930-1939.
Presentan la siguiente gura y argumentan que el nivel educativo
medio es generalmente más bajo para los individuos nacidos en los
primeros trimestres del año.
3 / 18
Grácamente
Educación y fecha de nacimiento
Describe la primera etapa de MC2E (condicional en el año de nacimiento).
Además de la tendencia creciente de la educación, se observa el patrón
relacionado al trimestre de nacimiento.
4 / 18
Grácamente
Ingresos y fecha de nacimiento
Muestra la forma reducida de la relación entre el instrumento y la variable
dependiente.
5 / 18
Grácamente
Intuición
En promedio, los hombres nacidos en los primeros trimestres ganan
menos que los que nacieron más tarde en el año.
Esta relación imita el patrón encontrado para la educación.
En general, analizar la primera etapa y la forma reducida ayuda a
entender la posible causalidad en la relación y a motivar el uso de los
instrumentos propuestos.
En este caso, el argumento es que las diferencias de ingresos por
trimestre de nacimiento se deben solamente a las diferencias en nivel
educativo.
6 / 18
Más formalmente 1/2
Para simplicar usaremos como instrumento una variable binaria que vale
Z
uno si el individuo nació en el primer trimestre y cero si no (
debajo).
Una representación matemática de los grácos podría ser:
Primer gráco (variable dependiente educación, primera etapa de
MC2E):
EDUCi = π0 + π1 Zi + π2 Y1930 + ...π10 Y1938 + vi ,
Yj es una variable binaria que vale uno si el individuo nació en
el año j . El parámetro π1 captura el efecto del trimestre de nacimiento
donde
en la variable endógena, condicional en el año de nacimiento.
7 / 18
Más formalmente 2/2
Segundo gráco (variable dependiente salario):
log (wi ) = γ0 + γ1 Zi + γ2 Y1930 + ...γ10 Y1938 + εi , donde el parámetro γ1
captura el efecto directo del trimestre de nacimiento (Z ) en la variable
dependiente (log (wi )), condicional en el año de nacimiento.
Nota: a las VI se les suele llamar también instrumentos excluidos, en
oposición a los instrumentos incluidos que son los regresores exógenos en la
ecuación original. La primera etapa regresa la variable endógena en los
instrumentos excluidos e incluidos.
8 / 18
Más formalmente 2/2
Primeras estimaciones
Las estimaciones de las ecuaciones anteriores presentadas en el
artículo encuentran que los hombres nacidos en el primer trimestre
tienen aproximadamente 1/10 menos de educación y ganan 1, 1%
menos que los hombres nacidos en trimestres posteriores.
Replicamos las estimaciones que realizan los autores para llegar a estas
conclusiones.
Es necesario crear variables binarias para el primer trimestre y para los
controles (presentamos los resultados sin controles, para replicar la
Tabla III, panel B).
9 / 18
Más formalmente 2/2
Replicando las primeras estimaciones
Estimaciones en
gretl:
\ = 12.797 − 0.109
EDUC
(0.0066)
(0.0133)
QB1
\
LWKLYWGE
= 5.903 − 0.011
(0.0014)
(0.0027)
QB1
Tabla III en el artículo:
10 / 18
MCO vs. VI
Principales resultados
La ecuación básica estimada en el artículo es:
log (wi ) = β0 + β1 Xi + ∑c ξc Yic + ρ Ei + µi ,
con una primera etapa dada por:
Ei = π0 + π1 Xi + ∑c δc Yic + ∑c θcj Yic Qij + εi
Si el error de la ecuación de salarios está correlacionado con los años
de educación, las estimaciones de MCO del retorno a la educación no
serán consistentes.
Los instrumentos entonces son interacciones entre trimestre y año de
nacimiento .
Los autores agregan controles adicionales: variables binarias para el
lugar de nacimiento, edad y edad al cuadrado, raza, estado civil. Los
resultados son similares en todas las especicaciones.
11 / 18
MCO vs. VI
Estimaciones MCO vs. VI
12 / 18
MCO vs. VI
Estimaciones MCO vs. VI
Comentarios de los autores:
En todas las especicaciones mostradas los modelos están
sobreidenticados. Llevando a cabo un contraste de Sargan, no se
rechaza en ninguna de las especicaciones las restricciones de
sobreidenticación.
Las estimaciones de 2SLS son generalmente similares a las
estimaciones MCO correspondientes.
Las pequeñas diferencias encontradas sugieren que las estimaciones
MCO si acaso subestiman los retornos de la educación. En general
este resultado sugiere que la existencia de variables omitidas no parece
ser un problema muy importante.
13 / 18
Críticas
En Economía Aplicada
¾Que hubiéran hecho vosotros luego de las clases de Economía Aplicada?
Miremos a los resultados de las columnas (3) y (4).
La exogeneidad se analiza con Sargan y aparece en la tabla:
¾Los instrumentos son relevantes? Ver primera etapa:
χ 2 = 23.1
F = 1.5909.
¾Conclusión?
La consecuencia de que los instrumentos tengan poco poder
explicativo es incrementar el sesgo de los estimadores de VI. Si ese
poder explicativo es débil` las propiedades asintóticas fallan.
En general este resultado sugiere que la existencia de variables
omitidas no parece ser un problema muy importante.` ¾Entonces
usamos MCO o VI? Contraste de Hausman: p-valor
¾Conclusión?
= 0.864908.
14 / 18
Críticas en la literatura
Críticas: Exogeneidad
¾Es la fecha de nacimiento una variable exógena?
Buckles y Hungerman en The Review of Economics and Statistics en
2013 argumentan que existe estacionalidad en las características de las
madres. Controlando por el entorno famliar se logra explicar casi la
mitad de la correlación entre fecha de nacimiento y resultados
posteriores.
Los autores encuentran que las mujeres que tienen bebés en invierno
son signicativamente más jóvenes, con menor nivel educativo y con
una menor probabilidad de estar casadas.
15 / 18
Críticas en la literatura
Estacionalidad en características de las madres
16 / 18
Críticas en la literatura
Críticas: Instrumento débil BJB
Bound, Jaeger y Baker, en un artículo en el Journal of the American
Statistical Association en 1995 argumentan que es un caso de
instrumento débil: la fecha de nacimiento está muy poco
correlacionada con el nivel educativo una vez se controla por ciertas
variables.
BJB utilizaron un instrumento verdaderamente irrelevante: se asignó
una fecha de nacimiento aleatoria a cada individuo y se usó esa fecha
como instrumento (sugerido por Krueger). Los autores argumentan
que los resultados de MC2E fueron similares a los obtenidos con la
fecha real (ver la Tabla 3).
Pero también reconocen que se podría detectar el problema en la
primera etapa.
17 / 18
Críticas en la literatura
Estimaciones BJB
Las dos primeras columnas son comparables a las columnas (6) y (8) de la Tabla V
de AK. Las otras dos incluyen instrumentos adicionales.
18 / 18
Descargar