ECONOMETRIA 1 Profesor: Ramón Rosales Complementarios: Mónica Reyes Camilo Gutiérrez John Gómez Monitores: Andrés Camacho Daniel Gamboa Silvia Flórez Santiago León EJC 25: ERRORES ESTANDAR ROBUSTOS EN HETEROSCEDASTICIDAD Heteroscedasticidad en el modelo básico de regresión lineal es la violación del supuesto de que la varianza del error, condicionada a los valores de los regresores, es constante. Es decir que la heteroscedasticidad se da cuando: 𝑉𝑎𝑟 𝑢! 𝑥! = 𝜎!! En presencia de heteroscedasticidad los MCO son consistentes e insesgados; sin embargo, los estimadores de la varianza y los errores estándar no lo son, invalidando las pruebas de hipótesis. Aun así, estos estadísticos se pueden ajustar asintoticamente por medio de la utilización de ERRORES ESTANDAR ROBUSTOS, permitiendo usar las pruebas t, F y LM con mayor validez. El procedimiento es principalmente útil cuando la heteroscedasticidad es desconocida, lo cual es importante porque no requiere conocer la clase de heteroscedasticidad poblacional. Este método funciona mejor para muestras grandes. Para una regresión múltiple, que puede estar definida como: 𝑌 = 𝛽! + 𝛽! 𝑋! + ⋯ + 𝛽! 𝑋! + 𝑢 Los errores estándar robustos se pueden obtener como la raíz cuadrada de la varianza del estimador: 𝑣𝑎𝑟 𝛽! = ! ! ! !!! 𝑟!" 𝑢! 𝑆𝐶𝐸!! Donde 𝑟!"! denota el cuadrado del i-ésimo residuo de la regresión de Xj en función de las restantes variables independientes empleadas en el modelo original (estos son los errores al cuadrado de la regresión auxiliar). SCEj corresponde a la suma de cuadrados de los errores de la regresión auxiliar de Xj en función de las demás variables independientes. Ui es el error i de MCO del modelo original. El estadístico t se calcula: en el numerador la diferencia entre el estimador y el valor hipotético (teta) y en el denominador el error estándar robusto del respectivo estimador. 2 Ilustración para estimar los errores estándar robustos, con base en el ejercicio 8.7 de Wooldridge (pg. 280). Se tiene el precio de la vivienda medida en miles de dólares en función del tamaño del lote (pies cuadrados), el tamaño de la vivienda (pies cuadrados) y número de habitaciones. . reg price lotsize sqrft bdrms Source | SS df MS -------------+-----------------------------Model | 617130.701 3 205710.234 Residual | 300723.805 84 3580.0453 -------------+-----------------------------Total | 917854.506 87 10550.0518 Number of obs F( 3, 84) Prob > F R-squared Adj R-squared Root MSE = = = = = = 88 57.46 0.0000 0.6724 0.6607 59.833 -----------------------------------------------------------------------------price | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lotsize | .0020677 .0006421 3.22 0.002 .0007908 .0033446 sqrft | .1227782 .0132374 9.28 0.000 .0964541 .1491022 bdrms | 13.85252 9.010145 1.54 0.128 -4.065141 31.77018 _cons | -21.77031 29.47504 -0.74 0.462 -80.38466 36.84405 ------------------------------------------------------------------------------ Ahora, para hallar los errores estándar robustos, se obtiene la siguiente regresión: . reg price lotsize sqrft bdrms, robust Linear regression Number of obs = F( 3, 84) = Prob > F = R-squared = Root MSE = 88 23.72 0.0000 0.6724 59.833 -----------------------------------------------------------------------------| Robust price | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lotsize | .0020677 .0012514 1.65 0.102 -.0004209 .0045563 sqrft | .1227782 .0177253 6.93 0.000 .0875294 .158027 bdrms | 13.85252 8.478625 1.63 0.106 -3.008154 30.7132 _cons | -21.77031 37.13821 -0.59 0.559 -95.62371 52.0831 ------------------------------------------------------------------------------ Con errores estándar robustos, el estadístico t, para evaluar significancia es el mismo que el utilizado con errores estándar normales. Comparación de errores estándar, estadísticos t y F. Estimadores 𝜷𝟎 estimado 𝜷𝟏 estimado 𝜷𝟐 estimado 𝜷𝟑 estimado Error Estándar, estadístico t MCO (no corregidos) 29.475, -0.74 0.0006, 3.22 0.0132, 9.28 9.0101, 1.54 Errores estándar robustos, estadístico t (corregidos) 37.138, -0.59 0.0012, 1.65 0.0177, 6.93 8.7486, 1.63 Estadístico F, errores estándar (no corregidos) Estadístico F, errores estándar robustos (corregidos) F=57.46 Prob>F= 0.0000 F=23.72 Prob>F= 0.0000