Solución del control de Econometrı́a (GECO) del 16 de mayo de 2013. Grupos A y B. Se dispone de datos sobre el peso al nacer de 1000 bebés en kilogramos (bwght), la renta familiar en miles de dólares (faminc), el sexo del recién nacido (sexo), la raza en los grupos blanco y no blanco (etnic) y por último, el número de cigarrillos diarios que fumó la madre durante el embarazo (cigs). Se ha estimado el siguiente modelo lineal para el peso de los recién nacidos (donde log() indica el logaritmo neperiano): (Intercept) log(faminc) sexoVarón etnicNo blanco cigs Estimate 3.3401 — 0.0655 -0.1291 -0.0150 Std. Error t value Pr(>|t|) 0.0731 45.70 0.0000 0.0205 0.90 0.3660 0.0345 1.90 0.0574 0.0447 -2.89 0.0040 0.0028 — 0.0000 Pregunta 1. ¿Cuánto es el coeficiente β̂ asociado a la renta familiar? Interprete dicho coeficiente. ˆ El estadı́stico t para H0 : β2 = 0 es √ β2 ˆ , por lo que despejando β̂2 = 0,0205 · 0,90 = 0,018. Dado V (β2 ) que la variable explicativa está en logaritmos, pero no la dependiente, ante un aumento de un 1 % en la renta familiar se espera un aumento de peso de 0.018/100 kilogramos o 0.18 gramos. Pregunta 2. ¿Cuánto se espera que varı́e el peso del bebé de una familia que ingresa 30 000 dólares a una familia que ingresa 40 000 dólares a igualdad de otros factores? La diferencia en peso esperado entre los dos bebés es ŷf aminc=40 −ŷf aminc=30 = 0,018 [log 40 − log 30] = 40 0,018 log 30 = 0,0052 kg. (5.2 gramos). El resultado anterior es exacto, pero lo podemos aproximar usando el resultado de la pregunta 1, de esa forma, la variación en peso es, aproximadamente, 0,018 40−30 = 0,006. Si la tasa de variación (sea la logarı́tmica, sea la convencional) la expresamos en % 30 en lugar de tanto por uno, habrı́a que dividir por 100. Pregunta 3. ¿Cuánto es el test t de significación individual para βcigs ? ¿Cuánto se espera que varı́e el peso del bebé de una madre no fumadora a una que fuma 5 cigarrillos diarios a igualdad de otros factores? El test t para H0 : β5 = 0 es √ β̂5 ˆ = V (β5 ) −0,0150 0,0028 = −5,36. Siguiendo los pasos de la pregunta 2, ŷcigs=5 − ŷcigs=0 = −0,0150(5 − 0) = −0,075 kilos. Como la variable explicativa no está transformada, cada unidad adicional en los cigarrillos fumados por la madre produce un descenso en el peso esperado de 15 gramos. Pregunta 4. ¿Cómo es la variación del peso del bebé en función de su sexo (a igualdad de otros factores)? ¿Es significativa a los niveles habituales? A la vista de que β̂3 = 0,0655, se puede decir que el peso medio de un recién nacido es 65.5 gramos superior al de una recién nacida. Dicho efecto es significativamente distinto de cero al 10 %, pero no se puede rechazar la nula para α ≤ 0,05. Pregunta 5. A la vista de la estimación anterior y sabiendo que R2 = 0,0509 y que R̄2 = 0,04708 ¿qué se puede decir de la especificación del modelo? Si bien el R2 es pequeño, dicha cifra no es extraña en modelos con muchos datos de sección cruzada o con series temporales estacionarias. En todo caso, el valor del R2 es poco o nada relevante. La reducción del R̄2 comparado con R2 puede explicarse por la no significatividad de log(f aminc) y en menor medida por la variable sexo. [NOTA: eliminado la variable log(f aminc), resulta R2 = 0,04512 y R̄2 = 0,04224]. Pregunta 6. Contraste la significación conjunta de las pendientes del modelo ¿cuál es el valor del estadı́stico de contraste? Si P [F (4, 995) ≤ 2,3809] = 0,95, ¿qué hace con la hipótesis nula? En la pregunta 5 nos proporcionan el R2 de la regresión, por lo que el estadı́stico de contraste se 0,0509 R2 puede calcular F = n−k = 995 = 13,34. Puesto que el valor del estadı́stico es superior al k−1 1−R2 4 1−0,0509 ∗ valor crı́tico (c = 2,3809), se rechaza la nula al 5 % de significación. Pregunta 7. ¿Cuánto es el peso esperado de una niña que nacida en una familia con 37 500 dólares de ingresos, no blancos y cuya madre no fumó durante el embarazo? Aplicamos la estimación del modelo a los datos facilitados: ŷ = 3,3401 + 0,018 log(37,5) + 0,0655 · 0 − 0,1291 · 1 − 0,0150 · 0 = 3,2762. A continuación se presenta la matriz de varianzas y covarianzas de los coeficientes estimados del modelo redondeada a cuatro decimales. (Intercept) log(faminc) sexoVarón etnicNo blanco cigs (Intercept) 0.0053 -0.0014 -0.0007 -0.0014 -0.0001 log(faminc) -0.0014 0.0004 0.0000 0.0003 0.0000 sexoVarón -0.0007 0.0000 0.0012 0.0000 0.0000 etnicNo blanco -0.0014 0.0003 0.0000 0.0020 0.0000 Pregunta 8. Calcule el estadı́stico de contraste para H0 : 2βV aron = −βN o calcuları́a el p-valor. cigs -0.0001 0.0000 0.0000 0.0000 0.0000 Blanco . Detalle cómo En este caso, es necesario formular la nula como Aβ = c y calcular el contraste F con la forma de Wald o la versión t equivalente ya que tenemos una única restricción. Ası́, Aβ̂ − c = 2β̂3 + β̂4 − 0 = 2 · 0,0655 − 0,1291 = 0,0019 y V (Aβ̂) = V (2β̂3 + β̂4 ) = 4V (β̂3 ) + V (β̂4 ) + 2 · 2cov(β̂3 , β̂4 ). En la tabla, cov(β̂3 , β̂4 ) = 0, por lo que V (Aβ̂) = 4 · 0,0012 + 0,0020 = 0,0068. El estadı́stico de contraste es = 0,0230. Aproximando la distribución t995 por la N (0, 1), el p-valor se puede t = √Aβ̂−c = √0,0019 0,0068 V (Aβ̂) expresar α∗ = 2P [N (0, 1) > 0,023] (ya que la alternativa es de dos colas). Pregunta 9. Calcule el estadı́stico de contraste para la hipótesis nula de que no hay diferencia de peso al nacer ni por sexo ni por raza. Deje clara la distribución del estadı́stico de contraste y cuál es la región crı́tica. Aquı́ es necesario recurrir a la forma de Wald sin simplificación: F = m1 (Aβ̂−c)T [AV (β̂)AT ]−1 (Aβ̂− c) ∼ Fm,n−k , para lo que es necesario expresar la hipótesis nula en la forma Aβ = c. Ası́, la nula resulta: β1 β2 β3 0 0 0 1 0 0 β3 = 0 . H0 : = ⇒ H0 : 0 β4 0 0 0 0 1 0 β4 β5 0,0655 0,0012 0 T Resulta evidente que Aβ̂ − c = y que AV (β̂)A = . La inversa 0 0,0020 −0,1291 1/0,0012 0 es trivial, puesto que la matriz es diagonal: [AV (β̂)AT ]−1 = . Sólo queda 0 1/0,0020 multiplicar: T 1 1 0,06552 (−0,1291)2 0,0655 1/0,0012 0 0,0655 F = = + = 5,95. 0 1/0,0020 −0,1291 2 −0,1291 2 0,0012 0,0020 La región crı́tica (F > c∗ ) se obtiene de la distribución F2,995 , donde el valor crı́tico para una significación α debe cumplir que P [F2,995 > c∗ ] = α.