3. APLICACIONES INFORMÁTICAS Fichero: ci6p1.wf1 Series: MATR: vehículos matriculados RENTA: renta per cápita Muestra: 1 - 50 3.1. Introducción Consideremos el siguiente modelo, que relaciona el número de vehículos matriculados por particulares en 50 ciudades durante un año y la renta per cápita correspondiente a cada una de estas ciudades: MATR i = β 0 + β1 RENTA i + ε i i = 1,2,...,50 La estimación por MCO de este modelo es: QUICK/Estimate Equation... MATR C RENTA LS SMPL: 1 50 ============================================================ LS // Dependent Variable is MATR Sample: 1 50 Included observations: 50 ============================================================ Variable CoefficienStd. Errort-Statistic Prob. ============================================================ C -20.42504 4.137441 -4.936637 0.0000 RENTA 0.781242 0.059388 13.15494 0.0000 ============================================================ R-squared 0.782857 Mean dependent var 33.38473 Adjusted R-squared 0.778333 S.D. dependent var 9.337460 S.E. of regression 4.396218 Akaike info criter 3.000667 Sum squared resid 927.6832 Schwarz criterion 3.077148 Log likelihood -143.9636 F-statistic 173.0524 Durbin-Watson stat 2.349421 Prob(F-statistic) 0.000000 ============================================================ Es probable que un mayor nivel de renta per cápita implique una mayor variabilidad en la matriculación de vehículos y que, por tanto, nuestro modelo esté afectado por un problema de heteroscedasticidad. Por ejemplo, si la adquisición de vehículos es una función de la renta, a mayores niveles de renta los consumidores disponen de un mayor margen para actuar guíados por capricho y desviarse sensiblemente de la relación consumo - renta especificada. En los apartados que siguen vamos a contrastar si efectivamente el modelo es heteroscedástico y si es así, procederemos a su estimación teniendo en cuenta este problema. 3.2. Detección de la heteroscedasticidad 3.2.1. Métodos gráficos 3.2.1.1 Gráfico de los residuos MCO 1 Examinamos el gráfico de los residuos correspondientes a la estimación del modelo por MCO para comprobar si su variabilidad es constante en toda la muestra. En la ventana con el output de la estimación del modelo por MCO seleccionamos: VIEW/Actual, Fitted, Residuals/Graph 70 60 50 40 30 15 20 10 10 5 0 -5 -10 5 10 15 20 25 Residual 30 35 Actual 40 45 50 Fitted En este gráfico puede observarse que los residuos presentan una variabilidad mayor en unos tramos de la muestra que en otros. Se puede interpretar como un primer síntoma de heteroscedasticidad. Lo anterior puede verse mejor si presentamos la serie de residuos ordenada en función de la variable RENTA: 15 10 5 0 -5 -10 5 10 15 20 25 30 35 40 45 50 RESID 3.2.1.2. Diagrama de dispersión Ahora consideramos la representación gráfica de la recta de regresión y de cada una de las observaciones. Nos fijamos en si todas las observaciones presentan una dispersión similar en torno a la recta de regresión; de no ser así, es posible que haya heteroscedasticidad. Este método tiene una utilidad limitada al caso en que tengamos sólo un regresor en el modelo. QUICK/Graph... MATR RENTA Graph type: Scatter Diagram 2 70 60 MATR 50 40 30 20 10 50 60 70 80 90 100 110 RENTA Aquí vemos que las observaciones que corresponden a los valores más elevados de la variable RENTA están más alejados de la recta de regresión que las asociadas a niveles inferiores. Ésto puede considerarse síntoma de heteroscedasticidad y además nos informa de que la posible causa de heteroscedasticidad es la propia variable explicativa RENTA. 3.2.1.3. Diagramas de dispersión e2 vs. variables causantes de heteroscedasticidad Aproximamos la varianza de los residuos MCO mediante sus cuadrados (e 2) y representamos en un diagrama de dispersión esta proxy frente a las variables que consideramos pueden ser la causa de la heteroscedasticidad (estas variables pueden estar o no incluidas en el modelo como regresores). Según la forma de la nube de puntos resultante puede determinarse si hay heteroscedasticidad y obtener alguna información sobre cuál es su estructura. En el modelo que consideramos la posible causa de heteroscedasticidad es la variable RENTA; por ésto vamos a representar e2 en función de esta variable. A tal fin: • Generamos la proxy para la varianza QUICK/Generate series... E2 = RESID * RESID (Cada vez que estimamos un modelo, Eviews asigna a la serie de residuos el nombre RESID. Es decir, RESID contiene siempre la serie de residuos del último modelo que hemos estimado). Diagrama de dispersión de E2 vs. RENTA QUICK/Graph... E2 RENTA Graph type: Scatter Diagram 200 150 E2 • 100 50 0 50 60 70 80 RENTA 3 90 100 110 Esta nube de puntos tiene una pendiente positiva, lo cual implica que existe una relación entre la proxy de la varianza que estamos empleando (la variable E2) y la RENTA. Por tanto, volvemos a encontrar evidencia en favor de la presencia de heteroscedasticidad causada por la variable RENTA. 3.2.2. Contrastes estadísticos de heteroscedasticidad En todos los contrastes que veremos a continuación se contrastan las hipótesis: H 0 : no hay heteroscedasticidad H A : hay heteroscedasticidad Sin embargo la estructura concreta de la heteroscedasticidad especificada en la hipótesis alternativa diferencia unos de otros y hace que no necesariamente debamos aplicarlos todos en un modelo dado. 3.2.2.1. Contraste de Goldfeld y Quandt Empleamos este contraste cuando sospechamos que la magnitud de la varianza es una función creciente (decreciente) de sólo una variable explicativa del modelo. Procedimiento: i) Ordenación de la muestra Suponemos que la varianza del término de error es una función creciente de la RENTA, en consecuencia ordenaremos la muestra en sentido creciente de acuerdo con la variable RENTA. PROCS/Sort Series... Sort Key(s): RENTA Sort Order: Ascending ii) Eliminar los c datos centrales (c≅N/3) La muestra es de tamaño N = 50, de modo que debemos eliminar c = 50/3 ≅ 16 datos. Las dos submuestras que resultan son: 1ª submuestra: observaciones 1, 2,... ,17 (N1=17) 2ª submuestra: observaciones 34, 35,...,50 (N2=17) iii) Estimar el modelo en cada submuestra y obtener la SCE La estimación del modelo empleando la primera submuestra es: QUICK/Estimate Equation... MATR C RENTA smpl: 1 17 ============================================================ LS // Dependent Variable is MATR Sample: 1 17 Included observations: 17 ============================================================ Variable Coefficien Std. Error t-Statistic Prob. ============================================================ C -25.64990 15.96615 -1.606518 0.1290 RENTA 0.863038 0.274523 3.143772 0.0067 ============================================================ R-squared 0.397186 Mean dependent var 24.48835 Adjusted R-squared 0.356998 S.D. dependent var 3.865452 S.E. of regression 3.099605 Akaike info criter 2.372680 4 Sum squared resid 144.1132 Schwarz criterion 2.470705 Log likelihood -42.28974 F-statistic 9.883301 Durbin-Watson stat 2.154909 Prob(F-statistic) 0.006691 ============================================================ De esta estimación nos quedamos con la SCE: SCE1 = 144.1132. Y la estimación en la segunda submuestra: QUICK/Estimate Equation... MATR C RENTA smpl: 34 50 ============================================================ LS // Dependent Variable is MATR Sample: 34 50 Included observations: 17 ============================================================ Variable Coefficien Std. Error t-Statistic Prob. ============================================================ C -17.84559 16.71086 -1.067903 0.3025 RENTA 0.745584 0.205858 3.621844 0.0025 ============================================================ R-squared 0.466529 Mean dependent var 42.45271 Adjusted R-squared 0.430964 S.D. dependent var 7.883109 S.E. of regression 5.946580 Akaike info criter 3.675763 Sum squared resid 530.4272 Schwarz criterion 3.773789 Log likelihood -53.36594 F-statistic 13.11775 Durbin-Watson stat 2.170806 Prob(F-statistic) 0.002511 ============================================================ De donde tomamos: SCE2 = 530.4272. iv) Calcular Q = Tenemos: Q = SCE 2 / (N 2 - K) SCE 1 / (N 1 - K) 530.4272 / (17 − 2) = 3.6806 144.1132 / (17 − 2) v) Contrastar Bajo H0, Q ~ F[ 17 −2 ] ,[ 17− 2 ] ≡ F15 ,15 , y el valor crítico al 5% es igual a 2.40. Como Q=3.6806>2.40 ⇒ RH0. 5