Datos de Panel Enfoque matricial del método de Mínimos Cuadrados Generalizados Recordamos que en el caso de existir homocedasticidad y no autocorrelación las fórmulas pertinentes para el cálculo de los estimadores y de la matriz de covarianzas de los mismos eran uˆT uˆ con N −k ˆ los elementos de û surgen de la estimación de los como û = Y − X ˆ ˆ = ( X T X ) −1 X T Y ˆ ˆ = ˆ u2 ( X T X )−1 ˆ u2 = El supuesto subyacente era: u21 u12 u22 u = u12 .. .. u N 1 u N 2 Docente: Julio Fabris .. u1N 1 0 .. u 2 N = u2 .. .. .. 2 .. uN 0 0 1 .. 0 .. .. .. .. 0 0 .. 1 Enfoque matricial del método de Mínimos Cuadrados Generalizados En el caso de la autocorrelación de orden 1 con coeficiente de autocorrelación conocido ut = ut −1 + t t ii d (0, 2 ) La transformación adoptada fue: Yt − Yt −1 = (1 − ) 1 + 2 ( X 2t − X 2t −1 ) + k ( X kt − X kt −1 ) + ... + (ut − ut −1 ) Yi * = 1* + 2 X 2*i + ... + k X k*i + ui* Y los estimadores, bajo esos supuestos, volvían a ser MELI ya que ui = i no autocorrelacionado. * Este es un caso de GLS. Por supuesto si se desconoce y debe ser estimado, GLS → FGLS Docente: Julio Fabris Enfoque matricial del método de Mínimos Cuadrados Generalizados En este caso fue posible proponer la transformación en forma matricial, planteando una matriz adecuada. 1 2 1 2 u = u 2 1 .. .. .. N −1 N − 2 N − 3 .. N −1 .. N − 2 2 .. N −3 = u .. .. .. 1 Conocida la matriz es posible demostrar que una estimación GLS de los parámetros puede obtenerse con: ˆGLS = ( X T −1 X )−1 X T −1Y Para una demostración sencilla ver Pindyck y Rubinfeld Apéndice 6.1 Docente: Julio Fabris Enfoque matricial del método de Mínimos Cuadrados Generalizados Además la matriz de varianzas y covarianzas de los estimadores resulta: ˆ = u2 ( X T −1 X )−1 En el caso usual, en que la matriz y estimarse, las fórmulas son: ˆFGLS = ( X T ˆ −1 X )−1 X T ˆ −1Y Donde y ̂ ˆ u2 = u2 son desconocidas y deben ˆ ˆ = ˆ u2 ( X T ˆ −1 X )−1 y surge de la regresión T uˆFGLS uˆFGLS N −k con uˆt = uˆt −1 + t uˆFGLS = Y − X ˆFGLS Entonces, para implementar FGLS hacen falta: u • Un modelo teórico de la matriz • Estimaciones de sus elementos constituyentes Docente: Julio Fabris y Modelo de efectos aleatorios – Random effects model El modelo de partida es el modelo inicial: yit = + 1 x1it + 2 x2it + ... + k xk it + uit u it = i + vit ; Ahora i i iid (0, 2 ) i = 1,..., N ; t = 1,...,T ; vit iid (0, v2 ) ya no es un parámetro a estimar sino una pertubación específica i es independiente de vi t y X it es independiente de i y vi t Este modelo es apropiado si estamos seleccionando los individuos de forma aleatoria desde una población numerosa (ejemplo, encuestas de hogares en panel). Para poder hacer inferencia sobre toda la población debería cuidarse de que, además de aleatoria sea representativa de la misma. Docente: Julio Fabris Modelo de efectos aleatorios – Random effects model En este caso es claro que la matriz de covarianzas de las perturbaciones no será una matriz escalar. u i t = i + vi t ; u js = j + v js Cov(u i t , u j s ) = E (u i t u j s ) = E [( i + vi t ) ( j + v j s )] = = E [ i j + i v j s + vi t j + vi t v j s ] == E [ i j ] + E [ i v j s ] + E [vi t j ] + E [vi t v j s ] 0 0 2 + v2 i = j t = s Cov( ui t u j s ) 2 i= j ts 0 i j t, s Con estas especificaciones se busca construir la matriz que permitirá la estimación GLS (o en su caso FGLS) del vector Docente: Julio Fabris . Modelo de efectos aleatorios – Random effects model = u 2 + v2 2 2 0 0 0 2 2 2 2 +v 0 0 0 2 2 2 + v2 0 0 0 = 2 2 2 0 0 +v 2 0 0 0 0 2 2 + v2 2 0 0 0 2 2 2 + v2 Utilizando esta estructura de la matriz de varianzas y covarianzas y estimando las varianzas 2 GLS Docente: Julio Fabris y v2 se estima el modelo de Efectos Aleatorios (RE) por Modelo de efectos aleatorios – Estimador GLS Una sugerencia de Fuller y Battese (1974) consiste en realizar una transformación de las variables para poder estimarlas por MCO En este caso cada elemento quedaría como: yit* = yit − yi. Donde = 1− O sea Fijarse que para MCO, v 1 con = 1− =0 12 = T 2 + v2 1 T 2 / v2 mientras que para el estimador Within, Por tanto, los estimadores GLS serán intermedios a los citados Docente: Julio Fabris =1 Modelo de efectos aleatorios – Random effects model De acuerdo a la estrategia de estimación de las varianzas 2 y 2v existen 4 diferentes estimadores GLS ✓ Wallace y Hussain (1969) ✓ Amemiya (1971) “amemiya” ✓ Swamy y Arora (1972) ✓ Nerlove (1971) “walhus” “swar” “nerlove” El modelo default de nuestro programa es el de Swamy y Arora Docente: Julio Fabris Modelo de efectos aleatorios – ¿Por qué es más eficiente? Swamy y Arora (1972) Los autores proponen realizar 2 regresiones diferentes (Within y Between) y ponderar los resultados Para el caso de una sola variable explicativa (por simplicidad) yi t = + xi t + i + vi t Promediando con respecto del tiempo yi . = + xi. + i + vi . (1) Restando una ecuación de la otra yi t − yi . = ( xi t − xi . ) + (vi t − vi . ) (2) La ecuación (2) representa al modelo Within como ya vimos, mientras que la ecuación (1) representa el modelo Between Docente: Julio Fabris Modelo de efectos aleatorios – ¿Por qué es más eficiente? El modelo Between tiene en cuenta la variabilidad entre individuos, mientras que el modelo Within toma en cuenta la variabilidad temporal para cada individuo.En el modelo de Swamy y Arora ˆ GLS = W1 ˆ W + W2 ˆ B con W1 + W2 = 1 Correspondiendo los ponderadores de cada modelo a la inversa de su correspondiente varianza En resumen: • • • • El estimador Within ignora la variación Between (entre individuos) El estimador Between ignora la variación Within (temporal del individuo) MCO contempla ambas con igual ponderación GLS contempla ambas con ponderación inversa a cada variabilidad. Este hecho (considerar las dos variabilidades) lo convierte en un estimador más eficiente. Docente: Julio Fabris Modelo de efectos aleatorios – Random effects model Valores que toma T= sigma2_mu = sigma2_v = theta = de acuerdo a los valores de las varianzas 25 1 16 0,2 25 1 4 0,6 25 1 1 0,8 25 4 1 0,9 MCO 2 y 2v 25 16 1 0,95 Within Algunos ejemplos de la literatura (Ver Croissant y Milio) ✓ Modelo de Comercio Exterior Kinal y Lahiri (1993) ✓ Modelo Bancos El-Gamal y Inanoglu (2005) ✓ Modelo Electricidad costo-producción Kumbhakar (1996) y Horrace y Schmidt (1996) Docente: Julio Fabris Modelo de efectos aleatorios – Random effects model Modelo de Comercio Exterior Kinal y Lahiri (1993) Estimación de las varianzas 2 y 2v y cálculo de . T = 24 > ercomp(imports ~ gnp, FT) var std.dev share idiosyncratic 0.08634 0.29383 0.074 individual 1.07785 1.03820 0.926 theta: 0.9423 Como 1 el estimador GLS se aproxima al estimador Within within.gnp 0.9023642 Docente: Julio Fabris random.gnp 0.7681560 pooling.gnp 0.0636640 Wi GLS MCO Be Docente: Julio Fabris Modelo de efectos aleatorios – Random effects model Modelo Bancos El-Gamal y Inanoglu (2005) Estimación de las varianzas 2 y 2v y cálculo de > ercomp(log(cost)~ log(output), TB) var std.dev share idiosyncratic 0.3291 0.5737 0.604 individual 0.2156 0.4643 0.396 theta: 0.6473 Como 0,65 el estimador GLS se aproxima al estimador Within pero menos que en el caso anterior within.log(output) 0.5063813 Docente: Julio Fabris random.log(output) 0.6470614 pooling.log(output) 0.8006578 Wi GLS Docente: Julio Fabris MCO Be Modelo de efectos aleatorios – Random effects model Modelo Electricidad costo-producción Kumbhakar (1996) y Horrace y Schmidt (1996) Estimación de las varianzas 2 y 2v y cálculo de > ercomp(log(cost)~log(output), TE) var std.dev share idiosyncratic 0.106806 0.326811 0.99 individual 0.001088 0.032990 0.01 theta: 0.08076 Como 0,1 el estimador GLS se aproxima al estimador MCO pooling within.log(output) random.log(output) pooling.log(output) 2.632529 Docente: Julio Fabris 1.225987 1.180416 Wi GLS Be Docente: Julio Fabris MCO Efectos fijos vs. Efectos aleatorios Los efectos fijos no son fijos por naturaleza. Dentro del mismo enfoque se pueden tratar como un vector de parámetros constantes o como la realización de una variable aleatoria, a los efectos de la estimación. La elección entre una y otra opción depende de la estructura probabilística y , en particular de la posible correlación con las variables explicativas. En un micro-panel los efectos aleatorios son en general adecuados ya que se trabaja con una muestra de numerosos individuos (trabajadores, empresas, etc.) que son elegidos en forma aleatoria de una población muy grande. No hay interés en estimar los efectos individuales y el efecto aleatorio es más apropiado, dada la forma de muestreo. Por el contrario, en un panel macro, la muestra es fija o casi fija y casi exhaustiva (por ejemplo, los países del mundo o las grandes empresas de un mercado). En este caso el conocimiento de los efectos individuales puede ser importante y el estimador de efectos fijos aparece como el más indicado Docente: Julio Fabris Efectos fijos vs. Efectos aleatorios De todas maneras, el principal argumento que lleva a la elección de uno u otro modelo es la posibilidad de correlación entre algunas explicativas y los efectos individuales Si se mantiene la hipótesis de que los errores idiosincráticos vit no están correlacionados con las explicativas, pueden darse dos situaciones: E [ X T ] = 0 , o sea que los efectos individuales no están correlacionados con las explicativas. En este caso ambos modelos son consistentes, pero el modelo de efectos aleatorios es más eficiente que el de efectos fijos E [ X T ] 0 , o sea que los efectos individuales están correlacionados con las explicativas. En este caso sólo el estimador de efectos fijos es consistente, ya que con la transformación within dichos efectos desaparecen Docente: Julio Fabris Test de Hausman (1978) de Endogeneidad En principio el test consiste en la comparación de dos modelos A y B, a partir de un test de tipo Wald H0: E [ X ] = 0 , en ese caso ambos modelos son consistentes, pero B es más eficiente que A T H1: E [ X ] 0 , en este caso, solamente A es consistente Si H0 es cierta, los coeficientes estimados a partir de ambos modelos no difieren demasiado (convergen para muestra suficientemente grande), mientras que si H0 no es cierta, divergen. T Así , el test se basa en ( ˆ A ) − ˆB , mientras que Hausman demuestra que la matriz de covarianzas de esta diferencia ( ˆ −ˆ ) = ˆ − ˆ A B A La versión más común de este test compara los modelos: • • A: Efectos Fijos (Estimador Within) B: Efectos Aleatorios (Estimador GLS) Docente: Julio Fabris B Tests de especificación Lo primero que corresponde chequear es si existen o no los efectos individuales. Esto nos lleva a elegir entre el modelo MCO que los ignora y el modelo Within que los contempla y estima. En este caso habrá que contemplar la posibilidad de efectos temporales también. Para estas pruebas existen dos tipos de tests: F (ya visto) y LM (se verá) De todas maneras la existencia de efectos individuales no sesga per se los estimadores ni los torna inconsistentes. El problema surge cuando dichos efectos se correlacionan con las variables explicativas. En este caso, al no tenerlos en cuenta, se genera sesgo por variables omitidas. Por lo tanto, de verificarse dicha correlación, el único estimador consistente sería el Within (Efectos Fijos). El test adecuado en este caso es el test de Hausman (ya visto) Si no se verifica la correlación mencionada, el estimador más eficiente resulta ser el estimador GLS (Efectos Aleatorios). Docente: Julio Fabris Tests de especificación Test F (Para testear Pooling vs. Efectos Fijos) H0: No hay efectos fijos individuales Modelo NR: Modelo LSDV (Within) g.l. = NT-(N-1)-(K+1) Modelo R : Modelo Pooling g.l. = NT-(K+1) Estadístico de prueba: F ~ F gl: (N-1) , NT-(N-1)-(K+1) Breusch-Pagan Test (Para testear Pooling vs. Efectos Aleatorios) Es un test de multiplicadores de Lagrange, basado en los residuos de la regresión OLS El estimador es: LM 12 , Docente: Julio Fabris Breusch-Pagan Tests Es un test muy sencillo porque requiere sólo el cálculo del modelo restringido, en este caso, el modelo Pooling Docente: Julio Fabris Breusch-Pagan Tests Este test es muy popular, pero presenta 2 problemas ✓ El primero es que la H0 propone que la varianza es distinta de cero (test a 2 colas), mientras que la varianza sólo puede ser positiva Honda (1985) y King y Wu (1997) proponen sendas correcciones. ✓ El segundo problema es que el estadístico propuesto puede dar valores negativos especialmente cuando las varianzas de los componentes del error son cercanas a cero, mientras que la distribución que se asume es la chi cuadrada, que no acepta argumentos negativos. Gourieroux, Holly and Monfort (1982) modifican el test para evitar dicho problema. El estadístico que calcula el software plm incorpora ambas correcciones Docente: Julio Fabris