Pauta Tarea 2 - Econometrı́a I Profesor: Carlos Yévenes - Alberto Sepúlveda Ayudante: Valeria Herrada 1. Problema 4.5 [ A= colGP 1, 39+ (0, 33) 0, 412hsGP A+ (0, 094) n = 141 0, 015ACT + (0, 011) R2 = 0, 234 0, 083skipped (0, 026) Respuesta: i Intervalo de confianza de 95% para βhsGP A IChsGP A = [β̂hsGP A − t(n−k−1, α2 ) · se(β̂hsGP A ) ; β̂hsGP A + t(n−k−1, α2 ) · se(β̂hsGP A )] = [0, 412 − 1, 977 · 0, 094 ; 0, 412 + 1, 977 · 0, 094] = [0, 226 ; 0, 598] ii Debemos contrastar: H0 : βhsGP A = 0, 4 H1 : βhsGP A , 0, 4 Regla de decisión: Si 0,4 < IC se rechaza la hipotesis nula. Como βhsGP A = 0, 4 está contenido en el intervalo, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No hay evidencia empı́rica de que βhsGP A sea estadı́sticamente distinto de 0,4. iii Debemos contrastar: H0 : βhsGP A = 1 H1 : βhsGP A , 1 Regla de decisión: Si 1 < IC se rechaza la hipotesis nula. Como βhsGP A = 1 no está contenido en el intervalo, podemos rechazar la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que βhsGP A es estadı́sticamente distinto de 1. 2. Problema 4.6 [ price= n = 88 −14, 47+ 0, 976assess (16, 27) (0, 049) 2 SRC = 165.644, 51 R = 0, 820 1 Respuesta: i Debemos contrastar: H0 : β0 = 0 H1 : β0 , 0 Estadı́stico de contraste: t= β̂0 − β0 se(β̂0 ) t= ∼ t(n−k−1) bajoH0 −14, 47 = −0, 889 16, 27 Regla de decisión: Si |tobs | > t(n−k−1; α2 ) se rechaza H0 El valor absoluto del t estadı́stico es | − 0, 889| que es menor al valor crı́tico t86;0,025 = 1, 988. Por lo tanto, no podemos rechazar la hipotesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que la constante no es estadı́sticamente distinta de cero. Debemos contrastar: H0 : β1 = 1 H1 : β1 , 1 Estadı́stico de contraste: t= β̂1 − β1 se(β̂1 ) t= ∼ t(n−k−1) bajoH0 0, 976 − 1 = −0, 49 0, 049 Regla de decisión: Si |tobs | > t(n−k−1; α2 ) se rechaza H0 El valor absoluto del t estadı́stico es | − 0, 49| que es menor al valor crı́tico t86;0,025 = 1, 988. Por lo tanto, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No existe evidencia empı́rica de que la variable assess sea estadı́sticamente distinta de uno. ii Debemos contrastar: H0 : β0 = 0 , β1 = 1 H1 : β0 , 0 y/o β1 , 1 El modelo restringido será: price = assess + u 2 Estadı́stico de contraste: F= (SRCr − SRCnr )/q ∼ F(q;n−k−1) bajoH0 SRCnr /(n − k − 1) F= (209.448, 99 − 165.644, 51)/2 = 11, 37 165.644, 51/(88 − 1 − 1) Regla de decisión: Si Fobs > F(q;n−k−1;α) se rechaza H0 El valor del F estadı́stico es 11,37 que es mayor al valor crı́tico F(2;86;0,05) = 3, 103. Por lo tanto, se rechazar la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica para argumentar que β0 , 0 o β1 , 1 (o ambas). iii Debemos contrastar: H0 : β2 = β3 = β4 = 0 H1 : β2 , 0 y/o β3 , 0 y/o β4 , 0 Modelo no restringido: price = β0 + β1 assess + β2 lotsize + β3 sqrf t + β4 bdrms + u Modelo restringido: price = β0 + β1 assess + u Estadı́stico de contraste: F= (R2nr − R2r )/q ∼ F(q;n−k−1) bajoH0 (1 − R2nr )/(n − k − 1) F= (0, 829 − 0, 82)/3 = 1, 456 (1 − 0, 829)/(88 − 4 − 1) Regla de decisión: Si Fobs > F(q;n−k−1;α) se rechaza H0 El valor del F estadı́stico es 1,456 que es menor al valor crı́tico F(3;83;0,05) = 2, 715. Por lo tanto, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No existe evidencia empı́rica de que las variables sean conjuntamente significativas. iv Existe heterocedasticidad, se viola el supuesto 5, los estadı́sticos F no tienen una distribución F, por lo tanto, el test realizado en el punto anterior no serı́a válido. 3 3. Problema 4.7 Respuesta: i Modelo con 43 observaciones para 1987: [ log(scrap)= 11, 74(4, 57) 0, 042hrsemp(0, 019) n = 43 0, 951log(sales)+ (0, 370) 2 R = 0, 310 0, 992log(employ) (0, 360) Modelo solo con las 29 empresas no sindicalizadas: [ log(scrap)= 12, 46(5, 69) 0, 029hrsemp(0, 023) n = 29 0, 962log(sales)+ (0, 453) 2 R = 0, 262 0, 761log(employ) (0, 407) Al comparar los modelos el coeficiente de la variable hrsemp, que representa las horas de capacitación por año por empleado, cambia significativamente. En el modelo donde se consideran a todas las empresas en 1987 un aumento de una hora de capacitación por año por empleado implicarı́a una disminución de 4,2% en la tasa de desperdicios, ceteris paribus. Mientras que si solo se consideran las empresas no sindicalizadas en 1987, el aumento de una hora de capacitación implicarı́a una disminución de 2,9% en la tasa de desperdicios, ceteris paribus. Además, se aprecia que el coeficiente de la variable hrsemp cuando se consideran todas las empresas es estadı́sticamente distinto de cero, y no lo es en el modelo de empresas no sindicalizadas. ii Modelo original: log(scrap) = β0 + β1 hrsemp + β2 log(sales) + β3 log(employ) + u Si θ = β2 + β3 , al reemplazarlo en el modelo original: log(scrap) =β0 + β1 hrsemp + β2 log(sales) + (θ − β2 )log(employ) + u =β0 + β1 hrsemp + β2 log(sales) + θlog(employ) − β2 log(employ) + u =β0 + β1 hrsemp + β2 (log(sales) − log(employ)) + θ3 log(employ) + u =β0 + β1 hrsemp + β2 log(sales/employ) + θ3 log(employ) + u La hipótesis H0 : θ3 = 0 quiere decir que las ventas y la cantidad de empleados tienen un impacto nulo sobre la variable de interés, o bien efectos opuestos que se contrarrestan. 4 iii Modelo estimado: [ log(scrap)= 11, 74(4, 57) 0, 042hrsemp(0, 019) n = 43 0, 951log(sales/employ)+ (0, 370) R2 = 0, 310 0, 041log(employ) (0, 205) Debemos contrastar: H0 : θ3 = 0 H1 : θ3 > 0 Estadı́stico de contraste: t= θ̂3 − θ3 se(θ̂3 ) t= ∼ t(n−k−1) bajoH0 0, 041 = 0, 2 0, 205 Regla de decisión: Si tobs > t(n−k−1;α) se rechaza H0 El valor del estadı́stico t es 0,2 que es menor al valor crı́tico t39;0,05 = 1, 68. No podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No hay evidencia empı́rica de que las firmas más grandes tengan tasas de piezas defectuosas mayores, ceteris paribus. iv Debemos contrastar: H0 : β2 = −1 H1 : β2 , −1 Estadı́stico de contraste: t= β̂2 − β2 se(β̂2 ) t= ∼ t(n−k−1) bajoH0 −0, 951 = −0, 132 0, 370 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 El valor absoluto del estadı́stico t es | − 0, 132| que es menor al valor crı́tico t39;0,025 = 2, 023. No podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No existe evidencia empı́rica de que un aumento de un 1% en sales/employ implica una disminución del 1% en la tasa de piezas defectuosas. 5 4. Problema 4.9 Modelo estimado: [ sleep= 3.638, 25(112, 28) 0, 148totwrk(0, 017) n = 706 11, 13educ+ (5, 88) 2 R = 0, 113 2, 20age (1, 45) Respuesta: i Debemos contrastar: H0 : β2 = 0 H1 : β2 , 0 Estadı́stico de contraste: t= β̂2 − β2 se(β̂2 ) t= ∼ t(n−k−1) bajoH0 −11, 13 = −1, 893 5, 88 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 El valor absoluto del estadı́stico t es |−1, 893| que es menor al valor crı́tico t706−3−1;0.025 = 1, 963. Por lo tanto, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que la educación no es estadı́sticamente significativa. Debemos contrastar: H0 : β3 = 0 H1 : β3 , 0 Estadı́stico de contraste: t= β̂3 − β3 se(β̂3 ) t= ∼ t(n−k−1) bajoH0 2, 20 = 1, 517 1, 45 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 El valor absoluto del estadı́stico t es |1, 517| que es menor al valor crı́tico t706−3−1;0.025 = 1, 963. Por lo tanto, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que la edad no es estadı́sticamente significativa. 6 ii Modelo estimado: 3.586, 38(38, 91) n = 706 [ sleep= 1, 151totwrk (0, 017) 2 R = 0, 103 Debemos contrastar: H0 : β2 = 0 , β3 = 0 H1 : β2 , 0 y/o β3 , 1 Estadı́stico de contraste: (R2nr − R2r )/q ∼ F(q;n−k−1) bajoH0 F= (1 − R2nr )/(n − k − 1) F= (0, 113 − 0, 103)/2 = 3, 957 (1 − 0, 113)/(706 − 3 − 1) Regla de decisión: Si Fobs > F(q;n−k−1;α) se rechaza H0 El valor del F estadı́stico es 3,957 que es mayor al valor crı́tico F(2;702;0,05) = 3, 009. Por lo tanto, se rechazar la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que las variables educ y age son conjuntamente significativas. iii Incluir educ y age afecta de forma mı́nima la disyuntiva entre sueño y trabajo ya que el coeficiente de la variable totwrk no cambia de un modelo a otro. En el modelo original es de -0,148 y, al eliminar educ y age es de -0,151. iv La heterocedasticidad no genera sesgo ni inconsistencia en los estimadores MCO. Tampoco tiene efecto sobre R2 . Sin embargo, bajo heterocedasticidad los estimadores de las varianzas de las pendientes son sesgados. Por lo tanto, los estadı́sticos t no tienen una distribución t, los estadı́sticos F no tienen una distribución F. Tampoco se cumple que los estimadores MCO sean MELI (no son los estimadores de mı́nima varianza). 5. Problema 4.10 Modelo estimado: [ return= −14, 37+ (6, 89) 0, 321dkr+ (0, 201) n = 142 0, 043eps- −0, 0051netinc+ (0, 078) (0, 0047) 2 R = 0, 0395 7 0, 0035salary (0, 0022) Respuesta: i Debemos contrastar: H0 : β1 = 0 , β2 = 0 , β3 = 0 , β4 = 0 H1 : β1 , 0 y/o β2 , 0 y/o β3 , 0 y/o β4 , 0 Estadı́stico de contraste: F= (R2 /k ∼ F(k;n−k−1) bajoH0 (1 − R2 )/(n − k − 1) F= 0, 0395/4 = 1, 409 (1 − 0, 0395)/(142 − 4 − 1) Regla de decisión: Si Fobs > F(q;n−k−1;α) se rechaza H0 El valor del estadı́stico F es 1,409 que es menor al valor crı́tico F4;137;0,05 = 2, 438. Por lo tanto, no se rechaza la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que las variables del modelo no son conjuntamente significativas. Debemos contrastar: H0 : β1 = 0 H1 : β1 , 0 Estadı́stico de contraste: t= β̂1 − β1 se(β̂1 ) t= ∼ t(n−k−1) bajoH0 0, 321 = 1, 597 0, 201 Debemos contrastar: H0 : β2 = 0 H1 : β2 , 0 Estadı́stico de contraste: t= β̂2 − β2 se(β̂2 ) t= ∼ t(n−k−1) bajoH0 0, 043 = 0, 551 0, 078 Debemos contrastar: H0 : β3 = 0 8 H1 : β3 , 0 Estadı́stico de contraste: t= β̂3 − β3 se(β̂3 ) t= ∼ t(n−k−1) bajoH0 0, 0051 = 1, 085 0, 0047 Debemos contrastar: H0 : β4 = 0 H1 : β4 , 0 Estadı́stico de contraste: t= β̂4 − β4 se(β̂4 ) t= ∼ t(n−k−1) bajoH0 0, 0035 = 1, 591 0, 022 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 Al analizar la significancia individual de cada una de las variables, el valor del estadı́stico t es menor al valor crı́tico t137;0.025 = 1, 977. Por lo tanto, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No existe evidencia empı́rica de que las variables del modelo sean individualmente significativas. ii Modelo estimado: [ return= −36, 30+ (39, 37) 0, 327dkr+ (0, 203) n = 142 0, 069eps(0, 080) −4, 74log(netinc)+ (3, 39) R2 = 0, 0330 Debemos contrastar: H0 : β1 = 0 , β2 = 0 , β3 = 0 , β4 = 0 H1 : β1 , 0 y/o β2 , 0 y/o β3 , 0 y/o β4 , 0 Estadı́stico de contraste: F= (R2 /k ∼ F(k;n−k−1) bajoH0 (1 − R2 )/(n − k − 1) 9 7, 24log(salary) (6, 31) F= 0, 0330/4 = 1, 169 (1 − 0, 0330)/(142 − 4 − 1) Regla de decisión: Si Fobs > F(q;n−k−1;α) se rechaza H0 El valor del estadı́stico F es 1,409 que es menor al valor crı́tico F4;137;0,05 = 2, 438. Por lo tanto, no se rechaza la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que las variables del modelo no son conjuntamente significativas. Debemos contrastar: H0 : β1 = 0 H1 : β1 , 0 Estadı́stico de contraste: t= β̂1 − β1 se(β̂1 ) t= ∼ t(n−k−1) bajoH0 0, 327 = 1, 611 0, 203 Debemos contrastar: H0 : β2 = 0 H1 : β2 , 0 Estadı́stico de contraste: t= β̂2 − β2 se(β̂2 ) t= ∼ t(n−k−1) bajoH0 0, 069 = 0, 863 0, 080 Debemos contrastar: H0 : β3 = 0 H1 : β3 , 0 Estadı́stico de contraste: t= β̂3 − β3 se(β̂3 ) t= ∼ t(n−k−1) bajoH0 −4, 74 = −1, 398 3, 39 10 Debemos contrastar: H0 : β4 = 0 H1 : β4 , 0 Estadı́stico de contraste: t= β̂4 − β4 se(β̂4 ) t= ∼ t(n−k−1) bajoH0 7, 24 = 1, 147 6, 31 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 Al analizar la significancia individual de cada una de las variables, el valor del estadı́stico t es menor al valor crı́tico t137;0.025 = 1, 977. Por lo tanto, no podemos rechazar la hipótesis nula a un nivel de significancia del 5%. No existe evidencia empı́rica de que las variables del modelo sean individualmente significativas. Por lo tanto, las conclusiones no cambian al agregar las variables log(dkr) y log(eps). iii Debido a que la variable dkr contiene ceros y la variable eps contiene valores negativos, al utilizarlas en logaritmos perderı́amos observaciones ya que no existe el logaritmo de un valor negativo, al igual que el logaritmo de cero. Por lo tanto, no es aconsejable utilizar logaritmos. iv Si vemos el R2 de ambos modelos podemos concluir que las variables independientes solo explican aproximadamente entre el 3 y 4% de la variación en el rendimiento de las acciones. Además, las variables consideradas no son ni conjunta ni individualmente significativas. Todo esto, sugiere que las variables consideradas tienen un bajo poder predictivo y constituye una evidencia a favor de la hipótesis de los mercados eficientes. 6. Problema C4.8 Respuesta: i En la base de datos 401KSUBS existen 2.017 hogares conformados por una persona, de un total de 9.275 observaciones. ii Modelo estimado: [a= nettf −43, 04+ (4, 08) n = 2.017 11 0, 799inc+ 0, 843age (0, 06) (0, 092) R2 = 0, 1193 - β̂1 = 0, 799, si el ingreso anual aumenta en mil dólares se estima que la riqueza financiera neta aumente en 0,799 mil dólares, ceteris paribus. - β̂2 = 0, 843, si aumenta en un año la edad se estima que la riqueza financiera neta aumente en 0,843 mil dólares, ceteris paribus. - Los resultados son los esperados ya que las personas que ganan más dinero tendrán una mayor acumulación de riquezas. Por otro lado, también es razonable que las personas mayores tengan más riqueza, dado que han tenido más tiempo para acumular recursos. iii β̂0 = −43, 04, la interpretación del intercepto no tiene sentido en este caso ya que predice que una persona con ingreso igual a cero tendrá una deuda igual a 43 mil dólares. Además, tendrı́amos que considerar a personas de cero años, que obviamente no pueden vivir solas. iv Debemos contrastar: H0 : β2 = 1 H1 : β2 < 1 p − valor = prob(tn−k−1 < tobs ) p − valor = 0, 0437 > α = 0, 01 El p − valor = 0, 0437 que es mayor al nivel de significancia del 1%. Por lo tanto, no se rechaza la hipótesis nula. v Modelo estimado: [a= nettf −10, 57+ (2, 061) n = 2.017 0, 82inc (0, 061) 2 R = 0, 0827 El coeficiente de la variable inc en la regresión inicial es de 0,799, mientras que en la regresión simple es de 0,82. Por lo tanto, no cambia significativamente. Esto se puede deber a la existencia de una baja correlación entre ingreso y edad. 7. Problema C4.10 Respuesta: i Modelo estimado: [ log(avgsal)= 10, 748(0, 052) n = 1.848 12 0, 795bs (0, 1497) 2 R = 0, 0151 Debemos contrastar: H0 : β1 = 0 H1 : β1 , 0 Estadı́stico de contraste: t= β̂1 − β1 se(β̂1 ) t= ∼ t(n−k−1) bajoH0 −0, 795 = −5, 313 0, 1497 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 El valor absoluto del estadı́stico t es |−5, 313| que es mayor al valor crı́tico t1846;0,025 = 1, 961. Por lo tanto, se rechaza la hipótesis nula a un nivel de significancia del 5%. Existe evidencia empı́rica de que el cociente de beneficios promedio entre el sueldo promedio (bs) es estadı́sticamente distinto de cero. Debemos contrastar: H0 : β1 = −1 H1 : β1 , −1 Estadı́stico de contraste: t= β̂1 − β1 se(β̂1 ) t= ∼ t(n−k−1) bajoH0 −0, 795 − (−1) = 1, 369 0, 1497 Regla de decisión: Si |tobs | > t(n−k−1;α) se rechaza H0 El valor absoluto del estadı́stico t es |1, 369| que es menor al valor crı́tico t1846;0,025 = 1, 961. Por lo tanto, no se rechaza la hipótesis nula a un nivel de significancia del 5%. No existe evidencia empı́rica de que el cociente de beneficios promedio entre el sueldo promedio (bs) sea distinta de -1. ii Modelo estimado: [ log(avgsal)= 13, 95(0, 107) n = 1.848 0, 605bs(0, 109) 13 0, 032log(enroll)(0, 008) R2 = 0, 4820 0, 714log(staf f ) (0, 018) Esta última estimación, en relación a la realizada en la Tabla 4.1, sugiere que la razón beneficios sobre salario tiene un impacto similar sobre el sueldo del profesor. Mientras que, la matrı́cula escolar tiene un impacto menor y la variable de la cantidad de personal tiene un impacto mayor. iii Cuando se añaden nuevas variables explicativas, por un lado, la varianza del estimador de bs tiende a disminuir, ya que la varianza del error disminuye. Por otro lado, la varianza del estimador de bs va a aumentar, y este aumento depende de la correlación que exista entre bs y las nuevas variables (a mayor correlación mayor será la varianza del estimador de bs). En este caso, dada la disminución del error del estimador bs, el primer efecto es mayor al segundo. Cabe destacar que, existe una ausencia de multicolinealidad, ya que esta implicarı́a una fuerte correlación entre bs y las otras variables independientes. iv El coeficiente de log(staf f ) es negativo, lo cual implica que un aumento en el número de trabajadores tiene un impacto negativo sobre los salarios. Este efecto es bastante grande, por ejemplo, un aumento de del 10% en el personal lleva a una caı́da del 7,14% en el salario, ceteris paribus. v Modelo estimado: [ log(avgsal)= 13, 95(0, 107) n = 1.848 0, 605bs(0, 109) 0, 032log(enroll)(0, 008) 2 R = 0, 4882 0, 714log(staf f )(0, 018) 0, 0008lunch (0, 0002) Dado que el coeficiente de lunch es negativo, los profesores no se ven compensados por atender a estudiantes más vulnerables. Sin embargo, este impacto es pequeño. vi En general, si nos enfocamos en la estimación del coeficiente de bs los resultados son similares, sin embargo, esto depende de los controles que se utilicen. Por otra parte, los coeficientes del resto de las variables independientes son distintos entre las bases de datos. 14