Economía Aplicada Aplicación de Variables Instrumentales Angrist y Krueger, The Quarterly Journal of Economics, 1991 Does compulsory school attendance aect schooling and earnings? Departamento de Economía Universidad Carlos III de Madrid Ver también Angrist y Pischke (cap. 4) Introducción Retorno a la educación Un ejemplo típico de endogeneidad se presenta al querer estimar el retorno a la educación regresando ingresos sobre nivel educativo. Una variable omitida en dicha ecuación es la capacidad o habilidad de los individuos. Si las personas más capaces tienen en promedio mayor nivel educativo y a la vez mayores ingresos, el nivel educativo estará correlacionado con el término de error y MCO no arrojará estimaciones conables. Angrist y Krueger en este artículo proponen solucionar el problema de endogeneidad de la variable educación usando variables instrumentales. El instrumento propuesto es la fecha de nacimiento medida por el trimestre de nacimiento. 1 / 18 Idea Idea de la legislación en EEUU La idea surge del sistema de educación obligatoria en EEUU: la ley obliga a asistir a la escuela hasta cumplir 16 años. Y los niños comienzan la escuela el año calendario en el que cumplen 6 años. Por ejemplo un estudiante nacido en enero, comienza la escuela con 6 años (y 8 meses) y al cumplir 16 tendrá 9 años completos de escolarización. Un estudiante nacido en diciembre, comienza la escuela con 5 años (y 9 meses) y al cumplir 16 tendrá 10 años completos de escolarización. Dependiendo de la fecha de nacimiento, los estudiantes estarán en niveles diferentes al cumplir la edad legal mínima para abandonar la educación. 2 / 18 Instrumento Validez del instrumento Exógeno: la fecha de nacimiento no debería afectar los ingresos de manera directa (no correlacionado con habilidad, motivación, conexiones familiares, etc.). Relevante: correlacionado con el nivel educativo alcanzado. Angrist y Krueger usan datos del censo de 1980 en EEUU para hombres nacidos entre 1930 y 1959. Para replicar el artículo usaremos datos obtenidos de Joshua Angrist Dataverse, un extracto para hombres nacidos entre 1930-1939. Presentan la siguiente gura y argumentan que el nivel educativo medio es generalmente más bajo para los individuos nacidos en los primeros trimestres del año. 3 / 18 Grácamente Educación y fecha de nacimiento Describe la primera etapa de MC2E (condicional en el año de nacimiento). Además de la tendencia creciente de la educación, se observa el patrón relacionado al trimestre de nacimiento. 4 / 18 Grácamente Ingresos y fecha de nacimiento Muestra la forma reducida de la relación entre el instrumento y la variable dependiente. 5 / 18 Grácamente Intuición En promedio, los hombres nacidos en los primeros trimestres ganan menos que los que nacieron más tarde en el año. Esta relación imita el patrón encontrado para la educación. En general, analizar la primera etapa y la forma reducida ayuda a entender la posible causalidad en la relación y a motivar el uso de los instrumentos propuestos. En este caso, el argumento es que las diferencias de ingresos por trimestre de nacimiento se deben solamente a las diferencias en nivel educativo. 6 / 18 Más formalmente 1/2 Para simplicar usaremos como instrumento una variable binaria que vale Z uno si el individuo nació en el primer trimestre y cero si no ( debajo). Una representación matemática de los grácos podría ser: Primer gráco (variable dependiente educación, primera etapa de MC2E): EDUCi = π0 + π1 Zi + π2 Y1930 + ...π10 Y1938 + vi , Yj es una variable binaria que vale uno si el individuo nació en el año j . El parámetro π1 captura el efecto del trimestre de nacimiento donde en la variable endógena, condicional en el año de nacimiento. 7 / 18 Más formalmente 2/2 Segundo gráco (variable dependiente salario): log (wi ) = γ0 + γ1 Zi + γ2 Y1930 + ...γ10 Y1938 + εi , donde el parámetro γ1 captura el efecto directo del trimestre de nacimiento (Z ) en la variable dependiente (log (wi )), condicional en el año de nacimiento. Nota: a las VI se les suele llamar también instrumentos excluidos, en oposición a los instrumentos incluidos que son los regresores exógenos en la ecuación original. La primera etapa regresa la variable endógena en los instrumentos excluidos e incluidos. 8 / 18 Más formalmente 2/2 Primeras estimaciones Las estimaciones de las ecuaciones anteriores presentadas en el artículo encuentran que los hombres nacidos en el primer trimestre tienen aproximadamente 1/10 menos de educación y ganan 1, 1% menos que los hombres nacidos en trimestres posteriores. Replicamos las estimaciones que realizan los autores para llegar a estas conclusiones. Es necesario crear variables binarias para el primer trimestre y para los controles (presentamos los resultados sin controles, para replicar la Tabla III, panel B). 9 / 18 Más formalmente 2/2 Replicando las primeras estimaciones Estimaciones en gretl: \ = 12.797 − 0.109 EDUC (0.0066) (0.0133) QB1 \ LWKLYWGE = 5.903 − 0.011 (0.0014) (0.0027) QB1 Tabla III en el artículo: 10 / 18 MCO vs. VI Principales resultados La ecuación básica estimada en el artículo es: log (wi ) = β0 + β1 Xi + ∑c ξc Yic + ρ Ei + µi , con una primera etapa dada por: Ei = π0 + π1 Xi + ∑c δc Yic + ∑c θcj Yic Qij + εi Si el error de la ecuación de salarios está correlacionado con los años de educación, las estimaciones de MCO del retorno a la educación no serán consistentes. Los instrumentos entonces son interacciones entre trimestre y año de nacimiento . Los autores agregan controles adicionales: variables binarias para el lugar de nacimiento, edad y edad al cuadrado, raza, estado civil. Los resultados son similares en todas las especicaciones. 11 / 18 MCO vs. VI Estimaciones MCO vs. VI 12 / 18 MCO vs. VI Estimaciones MCO vs. VI Comentarios de los autores: En todas las especicaciones mostradas los modelos están sobreidenticados. Llevando a cabo un contraste de Sargan, no se rechaza en ninguna de las especicaciones las restricciones de sobreidenticación. Las estimaciones de 2SLS son generalmente similares a las estimaciones MCO correspondientes. Las pequeñas diferencias encontradas sugieren que las estimaciones MCO si acaso subestiman los retornos de la educación. En general este resultado sugiere que la existencia de variables omitidas no parece ser un problema muy importante. 13 / 18 Críticas En Economía Aplicada ¾Que hubiéran hecho vosotros luego de las clases de Economía Aplicada? Miremos a los resultados de las columnas (3) y (4). La exogeneidad se analiza con Sargan y aparece en la tabla: ¾Los instrumentos son relevantes? Ver primera etapa: χ 2 = 23.1 F = 1.5909. ¾Conclusión? La consecuencia de que los instrumentos tengan poco poder explicativo es incrementar el sesgo de los estimadores de VI. Si ese poder explicativo es débil` las propiedades asintóticas fallan. En general este resultado sugiere que la existencia de variables omitidas no parece ser un problema muy importante.` ¾Entonces usamos MCO o VI? Contraste de Hausman: p-valor ¾Conclusión? = 0.864908. 14 / 18 Críticas en la literatura Críticas: Exogeneidad ¾Es la fecha de nacimiento una variable exógena? Buckles y Hungerman en The Review of Economics and Statistics en 2013 argumentan que existe estacionalidad en las características de las madres. Controlando por el entorno famliar se logra explicar casi la mitad de la correlación entre fecha de nacimiento y resultados posteriores. Los autores encuentran que las mujeres que tienen bebés en invierno son signicativamente más jóvenes, con menor nivel educativo y con una menor probabilidad de estar casadas. 15 / 18 Críticas en la literatura Estacionalidad en características de las madres 16 / 18 Críticas en la literatura Críticas: Instrumento débil BJB Bound, Jaeger y Baker, en un artículo en el Journal of the American Statistical Association en 1995 argumentan que es un caso de instrumento débil: la fecha de nacimiento está muy poco correlacionada con el nivel educativo una vez se controla por ciertas variables. BJB utilizaron un instrumento verdaderamente irrelevante: se asignó una fecha de nacimiento aleatoria a cada individuo y se usó esa fecha como instrumento (sugerido por Krueger). Los autores argumentan que los resultados de MC2E fueron similares a los obtenidos con la fecha real (ver la Tabla 3). Pero también reconocen que se podría detectar el problema en la primera etapa. 17 / 18 Críticas en la literatura Estimaciones BJB Las dos primeras columnas son comparables a las columnas (6) y (8) de la Tabla V de AK. Las otras dos incluyen instrumentos adicionales. 18 / 18