1,2,...n

Anuncio
Fichero: capitulo 9 nuevo.doc
CAPÍTULO 9
HETEROCEDASTICIDAD.
1. CAUSAS MUESTRALES Y ESTRUCTURALES
Como sabemos, la heterocedasticidad consiste en que las observaciones
2
muestrales tienen varianzas del error diferentes entre sí: var(Ui)= σ i, i=1,2,...n.
Viola la hipótesis clásica de homocedasticidad, o igual varianza de los n errores
aleatorios, y es un caso particular, junto a la autocorrelación, de perturbaciones no
esféricas. Las figuras 9.1 y 9.2 presentan los casos de perturbaciones
homocedásticas y heterocedásticas respectivamente.
______________________________________
Manual de Econometría. Capítulo 9, página 1 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
A lo largo de este capítulo se abordan las siguientes cuestiones: cuándo y por qué
surge; cuáles son las consecuencias de estimar por MCO un modelo
heterocedástico; cómo hacer un diagnóstico correcto del problema, es decir, qué
contrastes ponen a prueba la hipótesis de homocedasticidad frente a la evidencia
de los datos muestrales; y por último, cómo estimar un modelo heterocedástico, y
cómo evitar que surja la heterocedasticidad, eliminándola, si llega el caso.
La heterocedasticidad puede surgir por causas estructurales o muestrales, es
decir, su presencia puede ser sugerida por la teoría o por el propio diseño muestral
y plan de muestreo en la recogida de la información para estimar el modelo.
Las causas estructurales o teóricas suelen darse en modelos de corte transversal
con unidades muestrales de diferente "tamaño". Consideremos, por ejemplo, un
modelo de decisiones de gasto en vivienda de las familias en función de la renta
familiar y de otras características. Podemos suponer que el grado de aleatoriedad
del gasto de las familias crece con los ingresos; las familias de ingresos bajos son
muy homogéneas entre sí, es decir, gastarán cantidades similares, ya que su
margen de maniobra para tomar decisiones de gasto es reducido. En cambio, las
familias de renta alta tendrán pautas de gasto más heterogéneas entre sí. La
variabilidad del gasto entre familias "ricas" es mucho mayor que entre familias
"pobres". En este ejemplo, la propia teoría sugiere la forma o pauta de la
heterocedasticidad: la varianza del error depende positivamente de la renta.
Otros ejemplos donde posiblemente surja el problema de la heterocedasticidad
'estructural' son los siguientes: un modelo que explica el reparto de dividendos (en
millones de ptas.) de una sociedad en función de los beneficios obtenidos en el
ejercicio (también en millones de ptas.) y de otras variables como el tamaño de la
sociedad; un modelo de gastos en publicidad de diferentes marcas comerciales en
______________________________________
Manual de Econometría. Capítulo 9, página 2 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
función de sus ventas y otras variables; un modelo que explica las ventas de una
compañía en función de su marketing-mix. Nótese que en todos los ejemplos los
datos muestrales son transversales, las unidades muestrales tienen diferente
"tamaño" (familias de bajos y altos ingresos, empresas de dimensión reducida y
grande, etc.) y que la variable dependiente se mide en términos absolutos
(millones de ptas. por ejemplo). Un hecho frecuente es que la dispersión absoluta
sea mayor en las unidades de mayor volumen precisamente por este motivo
'estructural', si bien es posible que la dispersión relativa sea más homogénea. Así,
aunque los dividendos distribuídos por las sociedades grandes estén muy
dispersos en torno al valor esperado, es posible que el ratio dividendos distribuídos
sobre beneficios, dados los beneficios y demás características de la sociedad,
tenga una dispersión similar, independiente del tamaño de las sociedades.
Los errores de especificación de la forma funcional también pueden producir
1
heterocedasticidad . Así, si el verdadero modelo, homocedástico, es doble-log y
estimamos un modelo lineal, las perturbaciones de éste son heterocedásticas,
como demostramos en el apéndice 9.1.
Hay un tipo de modelos heterocedásticos con datos temporales que está
despertando creciente interés por su potencial de aplicación en econometría
financiera, con series de cotizaciones o de rendimientos de valores. Son los
modelos ARCH, o GARCH, de varianza condicionada heterocedástica, en los que
el riesgo condicional de un valor (varianza de sus rendimientos en el día t, dada
toda la información disponible hasta ese día) va variando a lo largo del tiempo. A
diferencia de las situaciones anteriores, en las que la heterocedasticidad se
consideraba un 'problema' a evitar o tratar, en este caso es una fuente de
información que mejora sensiblemente la capacidad predictiva del modelo.
1
Para los alumnos de Bea: ya nos hemos encontrado un caso en la práctica 1
______________________________________
Manual de Econometría. Capítulo 9, página 3 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
La heterocedasticidad puede surgir también por causas muestrales, en el sentido
de que el propio diseño de recogida de información o plan de muestreo genera
perturbaciones con varianzas distintas. Por ejemplo, cuando trabajamos con datos
agregados o medios procedentes de distintas submuestras, siendo variable el
tamaño de las mismas. Supongamos un modelo lineal que explica el gasto en
publicidad de las empresas en función de las ventas del año anterior y de otras
variables que omitimos por simplicidad. Supongamos también que el modelo
desagregado es homocedástico:
Y i = β 0 + β 1 X i + U i ; (i = 1,2,...n); var( U i ) = σ
2
(9.1)
donde Yi y Xi representan respectivamente los gastos de publicidad y las ventas
desfasadas un año de la empresa i-ésima, y Ui es el error aleatorio y
homocedástico del modelo.
Supongamos que solamente tenemos datos medios por zonas, obtenidos a partir
de muestras de empresas de cada una de las J zonas. El plan de muestreo ha sido
una estratificación por zonas con afijación proporcional, es decir, en cada estrato
(zona) se tomó una muestra proporcional al número de empresas radicadas en la
misma, resultando J submuestras de empresas de tamaño nj (j=1,2,...J), de
forma que Σnj=n. Nuestro modelo explica el gasto medio en publicidad en cada
zona en función de las ventas del año previo. El modelo se estima con J
observaciones:
Y j = β 0 + β 1 X j +U j ; (j = 1,2,...J)
Los errores Uj de este modelo son la media de los nj errores de las empresas de la
zona j. Tienen esperanza nula y son por construcción heterocedásticos, ya que la
______________________________________
Manual de Econometría. Capítulo 9, página 4 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
varianza de la media es la varianza de la población dividida entre el tamaño
muestral. En nuestro caso, la varianza del error de cada observación es
inversamente proporcional al número de empresas en la muestra de la zona:
U j=
∑in=1j U i
; (j = 1,2,...J)
nj
E( U j ) = 0 ∀j = 1,2,...J
(9.2)
Var( U j ) = σ ; (j = 1,2,...J)
nj
2
Ejercicio 9.1.- Si en el ejemplo anterior los J datos son valores agregados en vez
de medios (ventas y gastos en publicidad totales de las nj empresas del grupo)
obtenga la expresión de las varianzas de las perturbaciones
Heterocedasticidad por grupos. En ocasiones, la heterocedasticidad aparece en
modelos de datos agrupados. Pongamos a título de ejemplo la ecuación de salarios
de licenciados universitarios que propusimos en el capítulo 6. El logaritmo del
salario depende de los años de experiencia laboral (EXPER), con una relación
cuadrática, es decir, como explicativas incluímos la experiencia y su cuadrado.
Además, el modelo hipotetiza que hay diferencias sistemáticas entre los hombres
y las mujeres, y entre las cuatro titulaciones (Humanidades, Economía, Medicina e
Ingeniería). La muestra, de 600 licenciados, se reparte entre las titulaciones con
n1(Humanidades) =
172; n2(Ingeniería) =
345; n3(Medicina) = 148;
n4(Economía) = 335; El modelo que proponíamos en el capítulo 6 era el siguiente,
en el que se suponía que las perturbaciones eran independientes, con media cero y
varianza constante:
______________________________________
Manual de Econometría. Capítulo 9, página 5 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Y i = Log ( Salarioi ) = β 1 + β 2 S i + β 3 T 1i + β 4 T 2i + β 5 T 3i + β 6 E i + β 7 E 2 i + u i ;
S i = MUJERi ; T 1i = Dummy de Medicina; T 2 i = Dummy de Economía T 3i = Dummy de Ingeniería;
E = exp eriencia laboral
Ahora supongamos que la varianza del error aleatorio difiere entre las titulaciones.
2
A la titulación j (j=1,...4) corresponde una varianza σ j. Esto puede ocurrir porque,
por ejemplo,
los salarios de los de Humanidades, para un nivel dado de
experiencia, son muy homogéneos, al trabajar en su mayoría como enseñantes,
mientras que los ingenieros presentan un abanico salarial mayor dependiendo del
puesto de trabajo y las funciones desempeñadas.
En este ejemplo, hay
heterocedasticidad por grupos. El modelo contiene tantas varianzas del error
desconocidas, a estimar, como grupos y hay un número suficientemente grande
de observaciones en cada grupo para estimarlas, basándose en las sumas de
cuadrados de los respectivos errores.
Más adelante veremos un contraste de
homocedasticidad por grupos.
2.
FORMAS
FUNCIONALES.
HETEROCEDASTICIDAD
ADITIVA
Y
MULTIPLICATIVA.
Hemos visto que cuando la heterocedasticidad es un problema producido por el
plan de muestreo o por la agregación de variables, generalmente conocemos,
excepto por un factor de escala, las varianzas de los errores de cada una de las
observaciones, que dependen del número de unidades muestrales desagregadas
contenido en cada observación agregada. Conocemos, pues, la matriz Σ y el
método de MCG puede aplicarse sin dificultad, obteniendo estimadores ELIO como
se indicaba en la lección anterior. El único parámetro a estimar, aparte de los
2
coeficientes de regresión, es σ , el factor de escala en la expresión Ε(UU') =V =
______________________________________
Manual de Econometría. Capítulo 9, página 6 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
2
σ ∑.
Pero cuando la heterocedasticidad obedece a otras causas, que hemos llamado
'estructurales' o bien es consecuencia de una especificación incorrecta de la
forma funcional, las varianzas de los n errores son desconocidas. Si no hay
autocorrelación, la matriz V es diagonal y contiene n valores desconocidos. Con
una muestra de tamaño n no se pueden estimar libremente esas n varianzas y los
K parámetros de regresión por falta de grados de libertad. Pero para aplicar MCGF
es preciso tener, como sabemos, una estimación consistente de la matriz V ( o Σ,
ya que en este caso podemos considerarlas equivalentes). Una posibilidad es
2
i.
parametrizar el comportamiento de las varianzas σ
La propia teoría, el tipo de
variables, la experiencia previa o la propia voz de los datos pueden sugerir un
determinado esquema funcional de comportamiento. Por ejemplo, en el modelo
explicativo del gasto familiar en turismo y ocio una hipótesis teóricamente
plausible y avalada por diversos estudios previos sugiere que la varianza del error
del gasto es proporcional a la renta familiar. Las siguientes son algunas formas
funcionales posibles para la varianza de las perturbaciones:
1)Var( U i ) = δ Z i ; ( δ > 0); i = 1,2,...N
2)Var( U i ) = δ Z i2 ; δ > 0; i = 1,2,...N
3)Var( U i ) = δ 0 + δ 1 Z i ; ( δ 1 > 0); i = 1,2,...N
(9.3)
δ 0+δ 1 Z i ; i = 1,2,...N
4)Var( U i ) = e
5)Var( U i ) = σ 12 ; (i = 1,2,... n1 )
= σ 22 ;
(i = n1 + 1,...N )
donde Zi representa alguna variable explicativa del modelo u otra ajena al mismo.
En las formas 1) y 2) la varianza del error es directamente proporcional a la
______________________________________
Manual de Econometría. Capítulo 9, página 7 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
variable Z y a su cuadrado respectivamente. En 2) se evita la posibilidad absurda
de
tener
varianzas
negativas.
El
esquema
3)
recibe
el
nombre
de
heterocedasticidad aditiva, ya que la varianza de los errores es una función lineal
de Z, con término constante. La forma 4) se llama heterocedasticidad
multiplicativa. En ella, la varianza de los errores es una función exponencial de Z.
En ambos casos, se puede generalizar para incluir varias variables Zp (p=1,2,...P).
El caso 5) indica que la muestra contiene dos submuestras diferentes en cuanto a
la dispersión de las perturbaciones, y admite también una generalización a más de
dos submuestras. Por ejemplo, con datos trimestrales podría ocurrir que la
varianza del error fuera homogénea dentro de cada trimestre pero diferente para
los cuatro trimestres del año; en ese caso, tendríamos cuatro submuestras. En
otras ocasiones tendremos menos suerte, y no seremos capaces de encontrar una
2
i
especificación adecuada para σ
compatible con los datos. Aún en este caso,
como veremos en el apartado 4, podremos estimar el modelo por MCGF
estimando consistentemente Σ mediante los residuos de la regresión por MCO.
3. DIAGNÓSTICO DE LA HETEROCEDASTICIDAD. CONTRASTES
En este apartado se reseñan varios métodos, incluyendo, de menor a mayor
formalización, desde la inspección visual de algunos gráficos hasta los contrastes
cuya hipótesis nula es la homocedasticidad del modelo, frente a la hipótesis
alternativa de heterocedasticidad, en alguna de sus múltiples formas.
El tipo de datos y de problema nos previene sobre la posible presencia de
heterocedasticidad. En general, cuando trabajemos con datos transversales y
unidades de "tamaños" diferentes, debemos estar prevenidos. Por otra parte,
como vimos en el primer apartado, si los datos son agregados o medias de
______________________________________
Manual de Econometría. Capítulo 9, página 8 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
distintas submuestras sabemos que el modelo es heterocedástico.
El análisis visual de algunos gráficos hará que aumente o disminuya nuestra
______________________________________
Manual de Econometría. Capítulo 9, página 9 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
sospecha, e incluso nos puede ayudar a detectar las variables (Z) responsables de
los cambios de varianza entre observaciones. En abscisas se representan las
posibles Z (generalmente, los regresores, uno cada vez), o los valores ajustados de
Y. En ordenadas, los residuos de la regresión MCO en valor absoluto o sus
cuadrados. Veamos algunos ejemplos: La figura 9.3 representa una situación
homocedástica: los errores son independientes de los valores de Y ajustados, y
por tanto, podemos pensar que también lo son del conjunto de regresores. En la
figura 9.4, los errores cuadráticos crecen linealmente con Xr (una de las variables
explicativas del modelo): sospechamos una forma 1) de heterocedasticidad, donde
Zi es Xri. En la figura 9.5, la relación parece ser cuadrática (heterocedasticidad de
la forma 2).
Existen múltiples test estadísticos para detectar la heterocedasticidad, cuya
hipótesis nula es siempre que los errores son homocedásticos.
Uno de los contrastes clásicos es el de Goldfeld y Quandt (1972), adecuado
cuando sospechamos que dos o más submuestras o grupos de individuos
perfectamente identificables pueden diferenciarse en la varianza de sus
respectivos errores. Es el caso 5) del apartado anterior. Por ejemplo, supongamos
que para explicar el precio de los coches en España se recurre a un conjunto de
variables de prestación: velocidad máxima, potencia del motor, etc.. La muestra
abarca una amplia gama de modelos incluyendo los pequeños utilitarios y los
familiares. Es posible que el grupo de modelos base, los más pequeños, baratos y
sencillos de cada marca, tengan desviaciones respecto al precio esperado, dadas
sus características, que los modelos familiares, más grandes y de mayor precio.
Supongamos, pues, un modelo con heterocedasticidad de la forma 5), es decir,
hay dos submuestras independientes de tamaños respectivos n1 y n2, con n1>k y
2
1
n2>k y n1+n2 = n, con varianzas del error σ
2
2
yσ
respectivamente. Podríamos
______________________________________
Manual de Econometría. Capítulo 9, página 10 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
estimar dos modelos de regresión independientes, uno para cada submuestra:
2
Y 1 = X 1 β 1 + U 1 ; U 1 ~ N(0;σ 1 I 1 )
(9.4)
2
Y 2 = X 2 β 2 + U 2 ; U 2 ~ N(0;σ 2 I 2 )
Como sabemos, en cada regresión se verifica que la suma de cuadrados de los
residuos MCO dividida entre la varianza de la perturbación aleatoria sigue una
2
distribución χ y ambas son independientes:
SCERR1
σ1
2
=
S1
σ1
2
~ χ n 1-k
2
(9.5)
SCERR2
σ
2
2
=
S2
σ
2
2
~ χ n 2- k
2
Para contrastar la hipótesis nula de homocedasticidad:
2
1
H0: σ
2
2
=σ
construimos una distribución F a partir de las dos distribuciones, como cociente
2
entre ambas distribuciones χ , cada una de ellas dividida entre sus grados de
libertad. Si se cumple H0, se verifica que:
S2
n2 - k ~
F n 2 - k,n 1- k
S1
n1 - k
(9.6)
Si el estadístico de prueba [9.6] calculado para nuestro problema es mayor que el
valor crítico de la F, decidimos rechazar la hipótesis nula.
______________________________________
Manual de Econometría. Capítulo 9, página 11 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Este contraste es exacto para muestras finitas admitiendo la posibilidad de que los
coeficientes de regresión β de ambas submuestras sean diferentes. Para el modelo
restringido (coeficientes iguales), solamente es válido asintóticamente.
Este contraste de Goldfeld y Quandt puede extenderse al caso de g grupos, y
muestra de tamaño n. La hipótesis nula de homocedasticidad es:
H 0 : σ 12 = σ 22 = ... = σ g2 = σ 2
E (uu ' ) = V = σ I n
2
(9.7)
La hipótesis alternativa de heterocedasticidad es:
σ 12 I n

0
E (uu ' ) = V = 
 M

 0
1
0
σ 22 I n
M
0
...
0
...
0
O
M
... σ g2 I n
2
g






(9.8)
El contraste, basado en el proncipio del ratio de verosimilitudes, consiste en
estimar por MV el modelo restringido (bajo la hipótesis nula) y el no restringido
(permitiendo varianzas diferentes entre grupos). El estadístico de prueba y su
distribución asintótica bajo la hipótesis nula es:
g
RV = n Ln σˆ 2 − ∑ ni Lnσˆ i2 ~ χ 2 g −1
2
(9.9)
i =1
Goldfeld y Quandt partieron de los resultados anteriores para diseñar un contraste
de heterocedasticidad que no valiera solamente para aplicar a dos submuestras
______________________________________
Manual de Econometría. Capítulo 9, página 12 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
previamente identificables sino también para esquemas de dependencia funcional
desconocida. Supongamos un modelo en que la varianza del error es proporcional
a una variable Zi conocida, que generalmente será alguno de los regresores. La
idea es formar dos submuestras, una con los individuos para los que Zi presenta
los valores más pequeños y otra de individuos con Zi mayor, estimar el modelo
para ambas muestras por separado y hacer el contraste [9.6]. Los pasos a seguir
son: 1) ordenar la muestra en orden creciente de valores de Zi; 2) eliminar las h
observaciones centrales; 3) Estimar el modelo para las dos submuestras extremas,
ambas de igual tamaño (N-h)/2; 4) Realizar el contraste [9.6]. El estadístico de
prueba es S2/S1 porque las dos submuestras tienen el mismo tamaño. La elección
del número de datos centrales a descartar, h, debe garantizar que las dos
muestras extremas resulten bastante 'separadas' pero a la vez que tengan un
tamaño
suficiente
para
estimar
el
modelo.
Es
recomentable
descartar
aproximadamente un tercio de la muestra.
Un segundo tipo de contrastes se basa en hacer una regresión de los residuos
mínimocuadráticos de la regresión (en valor absoluto o al cuadrado) contra un
conjunto de variables Z que se suponen conjuntamente causantes de la
heterocedasticidad.
Supongamos,
por
ejemplo,
una
pauta
lineal
de
heterocedasticidad:
Var( U i ) = E( U i2 ) = σ i2 = δ 0 + δ 1 Z 1i + ...+ δ p Z p i ; i = 1,2,...n
Aproximando el cuadrado de las perturbaciones, desconocidas, mediante el
cuadrado de los residuos MCO, se estima por regresión la ecuación que 'explica'
linealmente el cuadrado de los residuos MCO en función de las Z:
ei = d 0 + d 1 Z 1 i + ...+ d p Z p i + vi ; (i = 1,2,...n)
La hipótesis nula de homocedasticidad es la de nulidad conjunta de los
coeficientes d, excluyendo el término independiente, que se pone a prueba con el
______________________________________
Manual de Econometría. Capítulo 9, página 13 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
estadístico F:
H 0 : d 1 = d 2 = ... = d p = 0
Esta es la base de una prolífica familia de contrastes, entre los cuales el más
destacado representante es el de Breusch y Pagan.
El contraste de Breusch y Pagan, que ya se ha presentado en el capítulo 5,
detecta incluso pautas no lineales de comportamiento de la varianza de la
perturbación:
σ i2 = f ( δ 0 + δ 1 Z 1 i + ...+ δ p Z p i )
La hipótesis nula, de homocedasticidad, es que todos los coeficientes excepto δ0
son nulos:
H 0 : δ 1 = δ 2 = ... = δ p = 0
Para realizar el test se siguen los siguientes pasos: 1) se estima el modelo original
por MCO y se calculan los residuos MCO; 2) se calcula la serie eN de residuos
tipificados, restando a cada uno la media y dividiendo entre la desviación típica. Si
el modelo tiene constante, la media de los residuos es cero y en este caso tipificar
es simplemente dividir entre la desviación típica (
N^2
serie e
e' e
).
n
Se calcula también la
de residuos tipificados al cuadrado; 3) se hace la regresión lineal de
N^2
estos últimos, e
contra el conjunto de variables Z, incluyendo una constante y
se calcula la suma de cuadrados explicada; 4) si la hipótesis nula es cierta, la
mitad de la suma de cuadrados explicada se distribuye asintóticamente como una
2
χ con p grados de libertad. Si el valor del estadístico de prueba supera el valor
crítico tabulado, dado el nivel de significación elegido, rechazamos la hipóteis nula
decidiendo que el modelo presenta heterocedasticidad.
______________________________________
Manual de Econometría. Capítulo 9, página 14 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
El contraste de White es el más general. Es un contraste asintótico que no
necesita especificar la lista de variables responsables de la heterocedasticidad. Se
estima una regresión auxiliar en la que los cuadrados de los residuos
minimocuadráticos vienen “explicados”
por una constante, cada una de las
variables explicativas, sus respectivos cuadrados y todos los productos cruzados
entre cada dos variables explicativas. Bajo la hipótesis nula de homocedasticidad,
el estadístico
nR 2 ~ χ 2 (q ) ,
2
donde R es el coeficiente de determinación de la
regresión auxiliar y q es el número de variables explicativas de dicha regresión
auxiliar, excluyendo la constante. La ventaja de este contraste es que es muy
flexible, detectando heterocedasticidad bajo condiciones muy generales. Su
principal problema es que, en caso de detectarla, no nos da pista alguna sobre la
forma de la heterocedasticidad o la lista de variables responsables de la misma.
Una dificultad adicional, si la muestra no es muy grande, es el escaso número de
grados de libertad que quedan, ya que la lista de regresores es tan ampli.
Ejercicio 9.2. Si en el modelo original, del que queremos averiguar si hay o no heterocedasticidad,
hay K=6 variables explicativas, incluyendo la constante, y la muestra es de tamaño 100, calcula el
número de grados de libertad de la regresión auxiliar para el test de White.
Otros contrastes basados en regresiones auxiliares de los residuos o sus
cuadrados, son los de Glejser y de Park. Puedes consultar detalles en los manuales
de econometría.
4. TRATAMIENTO DE LA HETEROCEDASTICIDAD. ESTIMACION DE UN MODELO
HETEROCEDASTICO O TRANSFORMACIÓN DEL MODELO
Al ser un caso particular de perturbaciones no esféricas, ya conocemos los
______________________________________
Manual de Econometría. Capítulo 9, página 15 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
efectos de la estimación por MCO de un modelo heterocedástico: los estimadores
de MCO son insesgados y consistentes, pero no eficientes. Los estimadores de
MCG son óptimos o eficientes, es decir, los de varianza mínima. Además,
recordemos que si estimamos por MCO el modelo suponiendo homocedasticidad
cometemos un sesgo en la estimación de la matriz de covarianzas de
2
-1
estimadores, ya que calcularemos σ (X'X)
los
cuando en realidad su matriz de
covarianzas es [7.3].
Recordemos también que las medidas de bondad del ajuste y los contrastes de
significación y de restricciones sobre los parámetros pueden ser engañosas debido
a la mala estimación de la precisión de los estimadores, sin que a priori pueda
conocerse la dirección del sesgo.
En el caso concreto de un modelo heterocedástico pero sin autocorrelación, los
estimadores de MCG son de hecho estimadores de mínimos cuadrados
ponderados porque, la transformación [7.10] consiste en ponderar a cada
individuo de la muestra inversamente a la desviación típica de su respectiva
perturbación. En efecto, en este caso la matriz V=Σ es diagonal de forma que la
matriz C de [7.5] es la matriz identidad y P es también diagonal:
______________________________________
Manual de Econometría. Capítulo 9, página 16 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
1
1
V = Σ = Λ ; C = I n ; P = Σ- 2 = V - 2
σ 12



2


σ2
V =



...


2

σ n 
*
*
ri
de forma que Y i = Yi/σi y X
1
σ 2
 1



P=





1
σ 22








...


1
σ 2n 
= Xri/σi. La función a minimizar es ahora la suma de
cuadrados de los residuos ponderada según la fiabilidad de cada dato: si la variaza
de la perturbación de un individuo es grande, el dato muestral de la variable
dependiente de ese individuo tiene un intervalo de confianza grande, no debemos
asignar demasiado peso a los individuos poco fiables. Piense en la situación
opuesta: si supiéramos que la perturbación de un individuo tiene varianza casi
nula, esto significa que el dato de su endógena es (casi) exactamente la función
de regresión poblacional, o sea, el valor esperado de Y dadas las X. Al ser una
estimación muy fiable de un punto de la FRP, es lógico que asignemos a ese
individuo mucho peso.
Ejercicio 9.3.- Un modelo de gastos en vivienda
Queremos estimar un modelo con datos de N=20 familias que explique el gasto
anual en vivienda de cada una (Y) en función de la renta (X). El modelo es:
Y i = α + β X i +U i ; (i = 1,2,...20)
donde Yi son los gastos anuales en vivienda de la familia i-ésima en miles de
unidades monetarias, y Xi son sus ingresos anuales expresados en las mismas
unidades. Los datos muestrales son los siguientes:
______________________________________
Manual de Econometría. Capítulo 9, página 17 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
GR
UP
O
DE
FA
MIL
IAS
INGRESOS
NETOS/AÑ
O (Millones
de ptas.)
GASTOS EN VIVIENDA/AÑO (MILES DE PTAS.)
Y
X
Gasto
medio de
las
familias
del grupo
Varianza
del gasto
dentro del
grupo
S2y
1
210
220
230
235
240
0.8
227
116
2
405
415
450
540
580
2
478
4866
3
650
600
790
820
900
4
752
12296
4
550
700
1020
1200
980
6
890
54560
a) Estimar por MCO el modelo de regresión lineal.
b) Suponiendo que la varianza de las perturbaciones sea proporcional al cuadrado
de la renta, reestimar el modelo por mínimos cuadrados ponderados.
Solución:
a) La estimación del modelo por MCO es la siguiente:
Y i = 186 . 648 + 125 . 9694 X
(t
R
2
= 0 . 7486 ;
= 7 . 3220
i
)
F = 53 . 61
b) La transformación adecuada para convertir el modelo en homocedástico
consiste en dividir cada variable del modelo entre la renta disponible Xi. El modelo
resultante, estimado por MCO, es:
Y
X
R
= 154 . 9167
i
2
+ 110 . 5
(t
= 0 . 6289 ;
1
Xi
= 5 . 5227
)
F = 30 . 50067
Si la pauta de heterocedasticidad es como hemos supuesto, estos últimos
estimadores son los de varianza mínima (óptimos) y las medidas de bondad del
ajuste del modelo original están basadas en una estimación errónea de la matriz de
______________________________________
Manual de Econometría. Capítulo 9, página 18 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
2
covarianzas de U. Por tanto, los R de ambos modelos no pueden compararse.
¿Han cambiado mucho los resultados de la estimación (coeficientes estimados)?
Observación: para contestar esta pregunta, piensa qué coeficientes de ambos
modelos son comparables entre sí.
Ejercicio 9.4.- Para el modelo de regresión lineal siguiente:
Y i = β 1 + β 2 X 2 i + β 3 X 3 i +U i
a) σ i2 = σ 2 X 2i
b) σ i2 = σ 2 X 22i
c) σ i2 = σ 2 X 1i2 X 22i
d) σ i2 = σ 2 X 1i X 2i
indicar cuál es el modelo (homocedástico) transformado en cada uno de los
siguientes casos:
Solución:
a)
Yi
X
= β1
2i
1
X
+ β
2
X
+ β
3
2i
X
1
b) Y i = β
+ β2 + β3
1
X 2i
X 2i
X
c)
2i
3i
2i
+
X 3i
X 2i
Ui
X 2i
Yi
Ui
1
1
1
= β1
+ β2
+ β3
+
X 2 i X 3i
X 21 X 3 i
X 3i
X 2 i X 2 i X 3i
EL MÉTODO DE MCGF. CÓMO ESTIMAR CONSISTENTEMENTE LA MATRIZ Σ
Como sabemos, para aplicar MCG es preciso estimar previamente la matriz de
2
covarianzas de los errores σ Σ, es decir, determinar los pesos wi por los que
ponderar a cada individuo de la muestra. Hay dos posibilidades para determinar
dichos pesos. La primera consiste en admitir alguna hipótesis específica acerca de
______________________________________
Manual de Econometría. Capítulo 9, página 19 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
la forma funcional de la heterocedasticidad, como en el ejercicio anterior y aplicar
mínimos cuadrados
ponderados, estimando el modelo transformado :
wiY i = wi β 1+ wi β 2 X
+ ... + w i β
1
con w i =
σˆ i
2i
K
X
Ki
+
Observe que en general el modelo resultante no tiene término independiente, por
lo que las medidas de bondad del ajuste basadas en la fórmula habitual de
descomposición de la varianza pierden validez.
Pero hay ocasiones en las que no tenemos base teórica ni empírica para apostar
por una determinada hipótesis en este sentido. En este caso, podríamos estimar
2
2
σ i mediante e i, es decir, el cuadrado del residuo MCO correspondiente a cada
observación. El modelo a estimar sería, pues:
Y i = β 1 + β X 2i + ...+ β X Ki + U i
1
2
K
ei
e1
ei
ei
ei
Ejercicio 9.5. ¿Qué desventajas tiene esta propuesta?, ¿Cómo será el ajuste?.
Aplíquelo con E-Views a un ejemplo concreto
Como se advirtió en el capítulo anterior, las propiedades en muestras pequeñas de
los estimadores de MCGF son desconocidas y en la práctica es posible que,
cuando trabajamos con muestras pequeñas, sea incluso preferible estimar el
modelo por MCO que al menos proporciona estimadores insesgados. En este caso,
______________________________________
Manual de Econometría. Capítulo 9, página 20 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
si la muestra es grande, conviene emplear la corrección de White para estimar sus
varianzas.
Los estimadores de White de las varianzas de los estimadores MCO
Si optamos por el método de MCO, hay, como sabemos, un problema adicional.
La matriz de varianzas covarianzas de los estimadores MCO, como sabemos, es
2
[7.3], fórmula que contiene las varianzas desconocidas σ i. White (1980) demostró
2
i
que [7.3] se puede estimar consistentemente sustituyendo en ella σ
2
por e i,
siendo como de costumbre ei el residuo minimocuadrático de la observación iésima. Todos los paquetes econométricos dan la opción de calcular los
“estimadores consistentes de White”, o la “corrección de White” de la s varianzas
de los estimadores. Con esos términos, se están refiriendo a la estimación de la
matriz de varianzas-covarianzas de los estimadores MCO que acabamos de
presentar.
Ejemplo. Observa atentamente y comenta los siguientes resultados, del modelo
explicativo del salario de 600 licenciados universitarios con el que ya hemos
trabajado en el capítulo 6. ¿Qué se ha hecho en cada estimación y por qué?
Estimación 1
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Sample: 1 600
Included observations: 600
______________________________________
Manual de Econometría. Capítulo 9, página 21 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO
12.58346
0.017376
-0.000711
0.188897
0.145605
0.093852
-0.091262
0.195579
0.031638
0.016769
0.002316
9.23E-05
0.013384
0.016136
0.013465
0.009081
0.016143
0.009881
750.3996
7.503810
-7.706221
14.11378
9.023679
6.970193
-10.04968
12.11571
3.202046
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0014
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.476313
0.469224
0.110915
7.270516
472.5676
1.944500
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
12.75184
0.152242
-1.545225
-1.479271
67.19209
0.000000
Estimación 2
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Date: 10/28/01 Time: 18:25
Sample: 1 600
Included observations: 600
Weighting series: 1/RESID
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO
12.58582
0.017251
-0.000705
0.187151
0.141893
0.091417
-0.091320
0.193591
0.032478
0.002295
0.000291
1.03E-05
0.001405
0.001816
0.001488
0.000286
0.002048
0.000723
5484.304
59.25447
-68.17610
133.1850
78.13480
61.43859
-318.7607
94.54385
44.90079
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
Weighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
1.000000
1.000000
0.017002
0.170843
1597.819
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
12.79008
211.6233
-5.296063
-5.230109
22658.27
______________________________________
Manual de Econometría. Capítulo 9, página 22 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Durbin-Watson stat
0.028731
Prob(F-statistic)
0.000000
0.476236
0.469146
0.110923
1.942783
Mean dependent var
S.D. dependent var
Sum squared resid
12.75184
0.152242
7.271588
Unweighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat
Estimación 3
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Sample: 1 600
Included observations: 600
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO
12.58346
0.017376
-0.000711
0.188897
0.145605
0.093852
-0.091262
0.195579
0.031638
0.017261
0.002524
0.000100
0.012327
0.015941
0.012654
0.009088
0.020375
0.011118
729.0193
6.885542
-7.113170
15.32370
9.133909
7.416805
-10.04158
9.598800
2.845817
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0046
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.476313
0.469224
0.110915
7.270516
472.5676
1.944500
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
12.75184
0.152242
-1.545225
-1.479271
67.19209
0.000000
OTRAS FORMAS DE AFRONTAR LA HETEROCEDASTICIDAD: LAS SOLUCIONES
“AD HOC”
______________________________________
Manual de Econometría. Capítulo 9, página 23 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Se han sugerido otras soluciones prácticas para eliminar la heterocedasticidad,
mediante ciertas transformaciones del modelo, entre las que destacan:
a) Estimar el modelo con las variables en logaritmos
b) Tomar valores relativos (porcentaje de gasto sobre la renta en lugar de la
cifra de gasto en unidades monetarias)
c) Emplear deflactores cuando los datos son temporales y corresponden a
series largas
d) Dividir la muestra en submuestras más homogéneas en cuanto al
'tamaño' de sus individuos y estimar por separado.
Esos son procedimientos 'ad hoc' cuya justificación estadística se encuentra
fácilmente. Por ejemplo, podría ocurrir que el modelo 'verdadero' fuera doble-log y
la heterocedasticidad provocada por la especificación incorrecta de la relación, de
ahí que al tomar logaritmos se corrija el problema. (Está el lector capacitadopara
descubrir en qué casos las transformaciones b), c) y d) sugeridas pueden eliminar
la heterocedasticidad?).
5. LOS MODELOS ARCH DE HETEROCEDASTICIDAD CONDICIONAL
AUTOREGRESIVA
Engle (1982) propuso una clase de modelos llamados genéricamente ARCH
(Autoregressive Conditional Heterocedasticity) que han demostrado ser muy útiles
para explicar el comportamiento de muchas series financieras, como las
cotizaciones bursátiles o los tipos de cambio de las monedas y en general los
______________________________________
Manual de Econometría. Capítulo 9, página 24 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
2
precios en mercados especulativos . Se trata de modelos para datos temporales
que por construcción tienen varianzas condicionadas variables a lo largo del
período muestral. El término 'condicional' se refiere al conjunto de información
disponible en el momento t, es decir, a los datos históricos previos observados.
Un modelo ARCH sencillo es el ARCH(1):
Y t = δ Y t -1 + β X t + U t ; U t ~ N(0, ht )
Var( U t ) = ht = α 0 + α 1 U t2-1
La variable endógena depende de su propio valor con un retardo, en una regresión
de Y contra sí misma por lo que recibe el nombre autoregresivo y de alguna/s
exógenas. En este modelo, la varianza de la perturbación aleatoria en el momento
t condicionada a la información disponible hasta el período anterior, depende del
cuadrado de la propia perturbación en t-1 (de ahí que el orden de este sencillo
modelo ARCH sea 1) y por tanto el modelo es heterocedástico, en la medida en
que U va variando a lo largo del tiempo también lo hace la varianza ht. Los
modelos ARCH se estiman por procedimientos iterativos de estimación no lineal.
La propia existencia de efectos ARCH, es decir, de heterocedasticidad condicional,
puede contrastarse mediante contrastes específicos que se pueden encontrar
descritos en la literatura especializada.
─────────────────────────────────────────────
Caso .- Un modelo ARCH para los rendimientos de la bolsa de Madrid
A título ilustrativo, se presenta la salida de una estimación GARCH de los rendimientos de las
acciones en la bolsa de Madrid. Los datos corresponden a cotizaciones diarias al IBEX35 desde el
28-03-96 al 21-09-99. El alumno puede consultar la ayuda el E-Views para interperetar esos
resultados
2
Estos modelos se han generalizado a los GARCH, como el del ejemplo
______________________________________
Manual de Econometría. Capítulo 9, página 25 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
─────────────────────────────────────────────
CAPÍTULO 9. RESUMEN
La heterocedasticidad consiste en que las varianzas de las perturbaciones
difieren entre unidades muestrales o 'individuos'.
Generalmente, surge en muestras transversales: a) cuando los individuos son
agregados o promedios de unidades muestrales homocedásticas; b) cuando los
individuos tienen 'tamaño' muy diferente (grandes empresas y PYMES en la
misma muestra); c) cuando por error de especificación se ha estimado
incorrectamente la forma funcional. Un caso frecuente ocurre cuando el
modelo es doble-log y se estima una ecuación lineal.
Surge también en modelos de precios en mercados especulativos, para datos
temporales. En los modelos ARCH, que explican satisfactoriamente el
comportamiento de cotizaciones bursátiles y tipos de cambio, la varianza de la
perturbación Ut condicionada a la información disponible hasta t-1 depende de
2
______________________________________
U t-1 y por tanto, al variar a lo largo de la muestra,
es heterocedástica.
Manual de Econometría. Capítulo 9, página 26 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
heterocedasticidad existen diversos
contrastes.
Su Pompeu
hipótesis
Catedrático
Universidad
Fabra
2
Universidad
de Las Palmasque
de GC
homocedasticidad y difieren Catedrática
en la hipótesis
alternativa,
Para detectar la
nula siempre es
puede ser más o menos general. Hemos estudiado los test de Goldfeld y
Quandt y sus extensiones, el de Breusch y Pagan y el de White
Los estimadores MCO de un modelo heterocedásticos son insesgados pero no
óptimos. Para estimar su matriz de varianzas-covarianzas es recomendable
emplear el estimador consistente de White, que aplica [7.3] sustituyendo los
2
elementos de Σ por los cuadrados de los residuos MCO e i.
APENDICE 9.1
Si el verdadero modelo es log-lineal y se estima un modelo lineal, éste es
heterocedástico.
Demostración:
El modelo verdadero, log-lineal, suponiendo sin pérdida de generalidad un solo
regresor, es:
2
β
Y i = α X i eu i ; ui _N (0,σ )
ln Y i = α ′ + β ln X i + ui
con α ′ = ln α
El modelo estimado es lineal en x. Queremos demostrar que su error, vi, es
heterocedástico:
Y i = γ 0 + γ 1 X i + vi
i
Puesto que ui es normal, eu sigue una distribución log-normal, con:
1
i
E( eu ) = e 2 σ
i
2
2
2
Var( eu ) = eσ ( eσ - 1)
de forma que la esperanza del error del modelo estimado, vi, es:
E( vi ) = E( Y i - γ 0 - γ 1 X i ) =
E( α X iβ eui - γ 0 - γ 1 X i )
1
= α X iβ e 2 σ - γ 0 - γ 1 X i
2
y su varianza resulta ser:
______________________________________
Manual de Econometría. Capítulo 9, página 27 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Var( vi ) = E[ vi - E( vi ) ] 2
1
= E[ α X iβ eui - γ 0 γ 1 X i - α X iβ e 2 σ + γ 0 γ 1 X i ]
1
2
= E[ α X iβ ( eui - e 2 σ ) ] 2
2
= α 2 X i2 β eσ ( eσ - 1)
2
2
Vemos que vi es heterocedástica, ya que su varianza depende de los datos
muestrales de la variable exógena Xi. Concretamente, si β>0 es una función
creciente y si β<0 es una función decreciente de Xi.
______________________________________
Manual de Econometría. Capítulo 9, página 28 .
1
2
© Carlos Murillo Fort y Beatriz González López-Valcárcel (2000)
1
Catedrático Universidad Pompeu Fabra
2
Catedrática Universidad de Las Palmas de GC
Descargar