u X X Y +⋅⋅⋅⋅+ + = β β

Anuncio
APUNTES DE CLASE ECONOMETRÍA I
UDI ECONOMETRÍA E INFORMÁTICA
Prof. Ramón Mahía
[email protected]
HIPÓTESIS ESTRUCTURALES: CAMBIO DE ESTRUCTURA
¿Qué se entiende por Cambio Estructural en el marco del MBRL?:
Un modelo econométrico se plantea como una representación analítica de un
determinado sistema de relaciones entre variables; unas relaciones que, en su
conjunto, definen una determinada estructura.
Los modelos econométricos representan las relaciones de esa estructura a partir de un
conjunto de parámetros “ß” que ligan, para cada ecuación del modelo, la variable
endógena y las exógenas (o explicativas):
Yi = β 1 X 1 i + β 2 X 2 i + ⋅ ⋅ ⋅ ⋅ + u i
La definición analítica del modelo, establece como hipótesis de partida que los
parámetros “ßj” asociados a cada variable exógena son únicos y válidos para
representar la relación entre la endógena “yi” y cada una de las exógenas “xji” a lo
largo (o ancho) de la muestra de datos seleccionada en el análisis. Esto es, los
parámetros (la relación analítica) son idénticos para todas las observaciones
muestrales (los parámetros no tienes subíndice “i”); dicho de otro modo, la
representación analítica sostiene que la estructura de relaciones entre variables se
mantiene constante.
Ejemplo: Si planteamos un modelo temporal que trate de explicar el
crecimiento de las ventas de nuestra empresa en función de nuestro esfuerzo
publicitario y nuestros precios y, para la estimación de los parámetros,
decidimos tomar una muestra de datos que cubre el período 1970-2006, los
parámetros estimados utilizando esa información serán únicos para todo el
período. Esto implica, desde el punto de vista teórico, que la relación entre
publicidad y ventas, o entre precios y ventas, se ha mantenido constante en los
últimos 27 años. (No los valores de las ventas, publicidad y precios, sino la
relación que explica los cambios de las ventas ante variaciones en precios y
publicidad).
Si esta hipótesis de permanencia de los parámetros se incumple hablamos de
CAMBIO ESTRUCTURAL que, por tanto, se define como la evidencia de
alteración significativa de los parámetros del modelo a lo largo de la muestra
utilizada; en un caso como este, resultará difícil admitir, por tanto, que la realidad
puede representarse analíticamente con un único conjunto de parámetros “ß”.
¿Por qué se produce?:
1. Inicialmente, y en términos generales (aunque abstractos) debe decirse
que un cierto grado de cambio estructural es esencialmente inevitable, es
decir, que la hipótesis de permanencia estructural es, en la práctica, una
restricción. Efectivamente, la econometría se interesa en observar la
1
interrelación compleja entre las variables de un sistema o subsistema
económico. La mayor parte de los sistemas multivariantes, tanto en economía
como en otros contextos, no son sistemas estables, estáticos, en equilibrio:
tanto desde el punto de vista teórico, conceptual, como en el plano puramente
empírico, lo cierto es que no sólo las variables cambian (crecen, se aceleran,
decrecen,…) sino que, a lo largo del tiempo, también se modifican las
relaciones que existen entre ellas, aparecen nuevas variables relevantes, dejan
de tener importancia factores que antes eran decisivos….. En este contexto de
variabilidad, de dinamicidad, de cambio, parece por tanto algo restrictivo e
ingenuo sostener una visión estática del sistema. En definitiva, el propio marco
de análisis invita a pensar que, con mayor o menor relevancia cuantitativa, los
sistemas analizados mediante un enfoque econométrico presentarán siempre
cierta variabilidad estructural. Desde el punto de vista operativo no se discute
esta afirmación previa y, de hecho, no es operativamente importante que exista
un cambio estructural moderado, pero sí interesa observar hasta que punto ese
cambio estructural tiene suficiente envergadura como para poner en cuestión
los resultados obtenidos en un MBRL.
2. Junto a la cuestión de partida antes mencionada, esencial, difícil de evitar por
parte del modelizador, existen otras causas que generan cambios estructurales
explícitos, causas que, en mayor medida, sí deben ser resueltas o anticipadas
por el económetra. Hablamos aquí de una alteración exógena de la
estructura analítica a lo largo del período analizado. No se trata, en este
caso, de la evolución natural, progresiva de todo sistema, sino de un cambio
significativo, de mayor calado y generalmente más súbito en este sistema
analizado. La situación más característica es quizá la ocurrencia de un
acontecimiento puntual que genera un punto de ruptura que altera el sistema.
Un cambio en la legislación laboral, la introducción de un nuevo impuesto, la
firma de un acuerdo de libre comercio, un terremoto, son acontecimientos
puntuales que generan un antes y un después en el marco teórico de
referencia; su impacto sobre el marco de referencia puede ser temporal (un
terremoto, un proceso de regularización de extranjeros) o definitivo (la
introducción de un nuevo impuesto sobre el consumo) pero en todo caso hará
imposible que un único modelo de parámetros fijos pueda ajustar esas dos (o
más) realidades diferentes. Esta situación es la más comprometida desde el
punto de vista de su corrección ya que, en la mayoría de los casos exige, bien
una reducción de la base muestral utilizada (con el fin de utilizar el modelo para
representar una única estructura, la más reciente), bien la utilización de
variables ficticias.
3. Los cambios del marco analítico, progresivos o bruscos, causan la aparición de
problemas de cambio estructural pero a estas causas, que son inherentes al
propios sistema analizado, habría que añadir los problemas de cambio
estructural inducidos por un error de especificación. Hablamos ahora por
tanto de sistemas estables en los que sin embargo, y por error propio, nuestro
modelo presenta cambio problemas estructural.
o
La omisión de variables relevantes en la especificación de un
MBRL. Efectivamente, la sub-representación de la estructura, puede
provocar la inestabilidad de los coeficientes de las variables que sí han
sido explícitamente consideradas. Es decir, si omitimos parte de los
factores explicativos de la evolución de una determinada variable
endógena, es fácil suponer que el modelo “parcial” propuesto no sea
capaz de representar con solidez el problema analizado y muestre
2
cierta variabilidad en sus coeficientes en la medida en que los “factores
olvidados” presenten también cierta variabilidad. 1
o
-
Una inadecuada selección de la forma funcional en el modelo, es
susceptible también de generar problemas de cambio estructural. Así,
por ejemplo, si adoptamos un perfil de relación lineal entre producción y
coste total de la producción, siendo la verdadera relación de tipo
logístico, el modelo de regresión podría funcionar correctamente en el
tramo central de la curva, pero fracasaría en la primera sección (fase de
mayores rendimientos crecientes) y en la última sección (fase de
mayores rendimientos decrecientes).
Un apunte adicional de interés tiene que ver con el uso de modelos
transversales. Aunque hasta este punto se han empleado siempre ejemplos
temporales, el cambio estructural no es sólo un fenómeno asociado a los
estudios “temporales”; más aún, el riesgo de cambio estructural es aún mayor
en los modelos transversales. La razón de ese mayor riesgo estriba en que, en
los modelos transversales no hay ninguna restricción sobre cómo se compone
la muestra observada mientras que en los modelos temporales, el propio paso
del tiempo impone una secuencia de orden en los datos que se utilizan. Por
ejemplo, en un modelo temporal que analice el consumo en España en los
últimos 20 años, tomaríamos, por ejemplo, una muestra 1987-2006; si existe
cambio estructural en ese período, será un cambio endógeno, NO inducido por
la selección muestral; sin embargo, si analizamos el mismo fenómeno
mediante un modelo transversal para un conjunto de países, la selección de la
muestra concreta de países a considerar puede generar la aparición de un
cambio estructural (por mezclar, por ejemplo, países subdesarrollados y
desarrollados) o no.
¿Cómo se detecta?: La detección del cambio estructural puede llevarse a cabo de
muy distintos modos, Antonio Pulido y Julián Pérez (Modelos Econométricos, pg. 435),
clasifican los métodos en tres grupos de estrategias analíticas bien distintas que, en
realidad, pueden resumirse en dos:
-
Contrastes basados en la comparación de modelos restringidos y no
restringidos:
o
o
o
o
-
Test Chow
Contraste Wald
Ratios de Verosimilitud
Test del Multiplicador de Lagrange
Contrastes basados en estimaciones recursivas
o
o
CUSUM
CUSUM –SQ
1
Así, por ejemplo, piense en un modelo en que, para explicar las ventas de nuestra empresa, hayamos recurrido a
nuestra publicidad y nuestros precios pero hayamos olvidado la publicidad y los precios de la competencia. Es evidente
que nuestro esfuerzo publicitario, por citar sólo la primera explicativa, será más o menos efectivo en función del
esfuerzo realizado por la competencia y que, por tanto, si olvidamos incluir esta variable de competencia, el parámetro
estimado para la relación entre nuestro gasto publicitario y nuestras ventas no podrá ser constante.
3
Presentaremos en este documento introductorio el Test de Chow, como procedimiento
confirmatorio sencillo (aunque limitado) de detección de cambio estructural basado en
la comparación de modelos, e introduciremos la idea que subyace en la aplicación de
los contrastes recursivos.
-
Test de Chow
Dentro del primer conjunto de métodos, vamos a desarrollar aquí el llamado Test de
Chow2, un test paramétrico3 sobre los residuos de estimaciones alternativas cuya
aplicación precisa de los siguientes requisitos:
1. El test de Chow no “busca” cambios estructurales en la muestra, sino que
confirma o desmiente una sospecha previa de cambio estructural por parte del
modelizador. Así pues, debe conocerse el punto o los puntos de cambio de
estructura; en la práctica sospechamos, por tanto, y a priori, de la aparición de
un punto de ruptura, bien por la existencia de razones teóricas que avalen
conceptualmente ese cambio4, bien por observar, en los resultados obtenidos,
alguno de los síntomas habituales en presencia de un cambio estructural
(cambio o ruptura en la dinámica de los errores, intervalos de confianza
sistemáticamente amplios para las variables exógenas seleccionadas….)
2. Conviene que el punto de cambio “sospechoso” (por ejemplo, el año en que
sospechamos que la estructura empezó a cambiar) no se encuentre muy cerca
del principio o final de la muestra. Es decir, lo ideal es que este punto de
ruptura divida la muestra total en dos “trozos” (submuestras ) suficientemente
amplias. La razón de este requisito estriba en que, como se verá más adelante,
para poner en marcha el Test de Chow, vamos a estimar nuestro modelo, por
separado, en cada una de las dos submuestras (estructuras diferentes) así
que, en cada una de ellas, necesitamos un número suficiente de datos como
para poder estimar.
Una vez dadas estas condiciones de partida, la forma de operar para realizar el
contraste es sencilla; para el caso de un único punto de cambio estructural:
1. Se divide la muestra total de tamaño “n” en las dos submuestras que
determina el punto de corte de tamaños “n1” y “n2” respectivamente.
2. Además del modelo inicialmente estimado (el originalmente estimado
para el total de la muestra) se estiman ahora dos modelos más, uno en
cada una de las dos submuestras identificadas. De cada una de estas
dos nuevas estimaciones parciales se obtendrá, evidentemente, un
conjunto de parámetros diferentes así como unos errores de estimación
diferentes.
3. Utilizando los errores de la estimación original y de las dos estimaciones
parciales se elabora el siguiente contraste, cuya hipótesis nula será que
2
Los primeros trabajos relacionados con este test se encuentran en: Chow, C.G. Econométrica, Vol.28. Num. 3. 1960
aunque el desarrollo de la expresión simplificada que se presenta en el texto es obra de F.M Fisher. Econometrita. Vol.
38. Num 2. (1970).
3 Se entiende por test paramétrico aquel que cuyo resultado puede expresarse en términos de probabilidad recurriendo
a la utilización del contraste de hipótesis estadístico habitual (definición de un estadístico de contraste, establecimiento
de hipótesis nula, observación en tablas del valor crítico….)
4
Por ejemplo, en un modelo para explicar la generación de empleo en la economía española estimado entre 1990 y
2006 sabemos que, en determinados momentos de la muestra se han producido cambios legislativos importantes en
materia laboral que podrían haber afectado a las relaciones entre las variables del modelo.
4
los dos conjuntos de parámetros (los derivados de los sub-modelos de
las distintas sub-muestras) son iguales:
F( k , n1 + n2 − 2k ) =
( e ' e − ( e1' e1 + e '2e 2 )) / k
( e1' e1 + e '2e 2 ) /( n1 + n 2 − 2 k )
donde (e’e) es la suma cuadrática residual para el modelo global
estimado con “n” datos, (e1’e1) es la suma cuadrática residual para el
modelo estimado en la primera submuestra de tamaño “n1” y (e2 ’e2) es
la suma cuadrática residual para el modelo estimado en la segunda
submuestra de tamaño “n2”.
El contraste propuesto es extremadamente sencillo de comprender. Si se observa con
atención, se comprueba que el numerador de la expresión compara los residuos
obtenidos en el modelo único (e’e) frente a los residuos obtenidos en las dos
estimaciones parciales (e1’e1) y (e2’e2). Es decir, se están comparando dos estrategias
distintas de estimar el modelo: una estrategia en la que la muestra se utiliza al
completo (porque se entiende que no hay cambio estructural) con otra estrategia en la
que, en lugar de un único modelo, se estiman dos modelos, porque se entiende que
hay dos estructuras diferentes en la muestra.
El test trata de expresar, por tanto, si la estimación única genera más errores que una
estimación partida. Si fuera así, si los errores obtenidos con una única estimación
fueran claramente superiores a los obtenidos cuando se opta por dos modelos, debe
entenderse que existe cambio estructural. Por el contrario, si los errores cometidos con
la utilización de único modelo son similares a la suma de los errores cometidos con
dos modelos parciales no habría razón para pensar que la muestra contiene un
cambio estructural.
Podrá observarse en la expresión, que una vez computada la diferencia de errores,
esta se expresa en términos porcentuales, con el objeto de eliminar el efecto del
tamaño de las unidades de medida; y se corrige, como en todo contraste, numerador y
denominador, por los grados de libertad utilizados en cada expresión 5.
Evidentemente, desde el punto de vista matemático, aún cuando no existiera cambio
estructural el error cometido con una única estimación será siempre superior a la suma
de los errores parciales6; lo que el test trata de determinar es si esa ganancia es lo
suficientemente grande como para sospechar que existe un cambio estructural
relevante.
Puede comprobarse que este test se distribuye como una ratio “F” de modo que su
empleo para el contraste de la hipótesis nula es sencillo: cuando el valor de este
estadístico calculado supera al valor de tablas de una distribución “F” debe
considerarse que existe cambio de estructura (Es decir, cuando esta ratio toma un
valor muy grande, superior al de tablas, en nuestros cálculos, esto significa que el
error cometido con un único modelo es mucho mayor que la suma de errores
5
Los grados de libertad del numerador “k”, provienen de la combinación de los grados de libertad utilizados para el
cálculo de las sumas cuadráticas residuales expresadas en el mismo: (n-k) para el modelo total, (n1-k) para el modelo
estimado en la primera submuestra y (n2-k) para el modelo estimado en la segunda submuestra. Así, (n-k)-( (n 1-k )-(n2k))=k.
6
Las estructuras siempre cambian, aún de forma muy leve, por lo que fraccionar la estimación de un modelo en trozos
siempre generará menores errores totales. (Otra cosa distinta es la menor fiablidad de los resultados obtenidos con
muestras más pequeñas).
5
cometidos con dos estimaciones parciales lo que avala la existencia de un punto de
cambio estructural).
Las limitaciones de este contraste son obvias:
-
Sólo detecta cambios de estructura bruscos, que puedan asociarse de
hecho a “puntos de ruptura” en la muestra. En el caso de una alteración
menos súbita, progresiva, que se genere por ejemplo a lo largo de varios
años en un modelo temporal, el test tiene, evidentemente, claros problemas
de potencia (tiende a aceptar la ausencia de cambio estructural)7
-
Para su aplicación, debemos conocer previamente el punto corte, es decir,
no es un contraste con capacidad para “detectar” cambio de estructura, sino
para “confirmar” la sospecha de su existencia en un determinado punto.
-
El contraste pierde potencia a medida que el punto de corte se acerca a los
extremos dado que, en ese caso, una de las dos estructuras estará subrepresentada por la muestra y será difícil observar entonces el cambio en la
calidad de la estimación (y en los errores cuadráticos)
-
Es sensible a la presencia de heterocedasticidad. Efectivamente, la
presencia de heterocedasticidad (que puede no estar causada por diversos
problemas) se manifiesta en una evolución no constante de los errores de
la estimación (lo errores tienden a crecer o a decrecer según avanzamos en
la muestra), de modo que esa evolución en los errores puede provocar un
resultado significativo del test de Chow (que en definitiva también compara
los errores por subperíodos) y una falsa conclusión sobre la existencia de
un cambio estructural.
Además de la versión del test expuesta, existen algunas variaciones de este contraste
pensadas para situaciones especiales. Por ejemplo, es habitual que alguna de las dos
submuestras en las que puede dividirse el período no sea suficientemente amplia. En
este caso, no podríamos estimar el modelo en la muestra insuficiente al carecer de
grados de libertad y, por tanto conviene utilizar la denominada versión reducida del
Test de Chow que considera sólo los errores de la submuestra para la que tenemos
suficiente número de datos.
F( n2 −k ,n1 −k )
( e ' e − e1' e1 ) / n2 − k
=
( e1' e1 ) /( n1 − k )
La interpretación y el manejo del test son idénticos al expuesto para la expresión inicial
aunque, como puede observarse ahora sólo se compara la estimación total con una
única estimación parcial y no dos (la realizada sobre la muestra de datos de suficiente
tamaño)
-
Introducción al test de estimaciones recursivas
Esta familia de contrastes se apoya en la estrategia de realizar estimaciones
recursivas de un mismo modelo comparando una estimación inicial realizada sobre
7
Ante la sospecha de un cambio gradual de esta naturaleza, una sugerencia de utilidad general podría ser
aplicar el test de Chow comparando la estimación global con la suma de las dos estimaciones realizadas al
principio y al final de la muestra, eliminando los datos referidos al período de transición entre las dos
estructuras.
6
una muestra de tamaño mínimo de datos con estimaciones sucesivamente en las que
se van incorporando progresivamente el resto de observaciones muestrales hasta
agotar el conjunto de datos disponibles, tal y como se muestra en la siguiente
ilustración.
Ilustración simple de la estrategia
de la estimación recursiva
i=1
i=1
i=1
i=n
Muestra completa de “n” datos
i=s
Primera estimación con “s” datos para “s-k” suficiente
i=s+1
i=1
“n-s+1”
i=s+2
Estimaciones
i=1
i=s+3
i=1
recursivas
i=s+4
i=1
i=s+5
i=1
i=s+6
La idea del procedimiento es sencilla: en la medida en que la estructura cambie
notablemente alterándose los valores de los coeficientes del modelo, los resultados
obtenidos en las estimaciones recursivas deben variar notablemente, bien en sus
parámetros, bien en los residuos promedio obtenidos en cada uno de ellos, bien en
ambos.
La simple representación gráfica de los resultados obtenidos en las estimaciones
recursivas puede ayudarnos a calibrar la intensidad de un cambio estructural en el
modelo. Por ejemplo, el siguiente gráfico muestra la evolución creciente de un
determinado parámetro ( que denominamos c(1) ) de una regresión según se van
añadiendo observaciones muestrales en la estimación del modelo a partir de una
estimación inicial desde 1970 a 1992.
Ejemplo gráfico de estimaciones recursivas
para un parámetro
7
0.004
0.002
0.000
-0.002
-0.004
95
96
97
98
99
00
Recursive C(1) Estimates
01
02
± 2 S.E.
Del mismo modo, el gráfico siguiente ilustra sobre los errores (residuos recursivos),
también crecientes, que se van cometiendo en las estimaciones sucesivas del modelo:
Ejemplo gráfico de estimaciones recursivas
para un parámetro
80000
60000
40000
20000
0
-20000
-40000
-60000
-80000
92
93
94
95
96
97
Recursive Residuals
98
99
00
01
02
± 2 S.E.
No obstante, junto a las medidas gráficas puede elaborarse alguna medida cuantitativa
que nos permita contrastar si las variaciones en las estimaciones recursivas son
suficientemente amplias. Esta es la utilidad de los conocidos contrates CUSUM,
CUSUM-SQ o MOSUM 8 en cuyo desarrollo y aplicación no vamos a detenernos pero
cuya utilización es sencilla: todos estos contrastes se construyen a partir de la suma,
debidamente estandarizada, de los residuos recursivos expresados en términos
promedio; un valor de los contrastes por encima de los valores de tablas indican
cambio estructural.
¿Cuáles son las consecuencias del cambio estructural sobre el MBRL?:
En términos generales, los principales problemas derivados del cambio estructural
son:
-
En presencia de dos o más estructuras representadas con único modelo, la
estimación de un único modelo no puede capturar esas diversas realidades con
8
Los desarrollos completos de estos test pueden encontrarse en el libro Modelos Econométricos, de Antonio Pulido y
Julián Pérez, pg. 444 y 445.
8
un único conjunto de parámetros. Así pues, los parámetros obtenidos en una
estimación en presencia de cambio estructural son, por fuerza y en
comparación con los que obtendríamos con modelos estimados para
cada una de las submuestras independientes, sesgados e inconsistentes,
esto es, están alejados de los valores reales de los conjuntos de parámetros
existentes. Esto no significa que la estimación total sea, en si misma, sesgada
o inconsistente; la estimación del modelo con MCO garantiza ambas
propiedades para los parámetros en la muestra total; el sesgo y la
inconsistencia son, en este caso, incumplimientos relativos al comparar un
modelo único con dos modelos parciales.
-
Al mezclar datos correspondientes a estructuras diferentes, los errores que se
cometerán en la muestra total serán mayores (su varianza será mayor) que los
que se cometerían utilizando un modelo distinto para cada submuestra. Esta
ineficiencia en la muestra total se traducirá en contrastes “t” más exigentes,
al incrementarse la varianza de los parámetros estimados con relación a
la que se obtendría en estimaciones parciales (ineficiencia relativa), lo que
provocará frecuentes errores de tipo II en el contraste de la hipótesis de nulidad
de los parámetros (las variables tienden a rechazarse como explicativas aún
siéndolo) así como en otros contrastes en cuya base de cálculo intervenga el
estimador de la varianza de la perturbación aleatoria.
-
El ejercicio de predicción se complica, tanto más cuanto menor sea la
submuestra final, ya que se realizará tomando en consideración unos
parámetros que, en realidad, no representan ninguna estructura real, sino una
especie de promedio de dos o más estructuras mezcladas.
-
EN
RESUMEN:
Parámetros
SESGADOS,
INCONSISTENTES
e
INEFICIENTES respecto a cada una de las submuestras; errores en la
APLICACIÓN DE CONTRASTES, y en mayor o menor medida PREDICCIÓN
INCORECTA.
¿Cómo se corrige?:
La corrección de un cambio estructural pasa por determinar las causas de su
aparición.
-
Si el cambio de estructura puede asociarse a un claro error en la
especificación, podemos tratar de corregirlo revisando el planteamiento original
del modelo, es decir, en concreto revisando la forma funcional, o modificando la
selección de variables relevantes, en especial si hemos olvidado incluir alguna
variable relevante.
-
Si el cambio estructural es endógeno, no está relacionado con un error de
especificación, sino con un cambio genuino en el sistema analizado, podemos
tratar de:
o
Replantear la selección del período muestral tratando de ajustarlo, si
está analíticamente justificado, a una única estructura real.
o
Representar ese cambio en el modelo introduciendo, como
explicativas, lo que se denominan variables ficticias. Las variables
ficticias no son otra cosa que variables cuyos valores son decididos por
el analista de forma arbitraria, generalmente en forma dicotómica (0,1),
9
con el fin de capturar, de forma sencilla, cambios estructurales que no
pueden representarse con variables reales.
Ejemplo: si hemos realizado un modelo explicativo de nuestras exportaciones desde
1970 a 2003 y suponemos que a partir del año 1986 la estructura de nuestro comercio
exterior se alteró por nuestra incorporación al Mercado Común Europeo, podemos
incluir una nueva variable explicativa ficticia que tome valores 0 hasta 1986 y 1 a partir
de 1986; esta variable, representaría el concepto, difícilmente cuantificable, de “la
incorporación al Mercado Común” de una forma simple. La introducción de esta
variable permitiría calcular un parámetro asociado a este cambio que depuraría las
estimaciones del resto de parámetros eliminando el efecto del cambio estructural
sobre los mismos.
Respecto a la utilización de variables ficticias pueden señalarse las siguientes
puntualizaciones:
-
La utilización de ficticias sólo debe realizarse en ausencia de otras
variables más explícitas que también puedan representar ese cambio de
estructura (no se trata, por tanto, de un recurso alternativo a una adecuada
reforma de la especificación sino de un recurso de última instancia en ausencia
de estrategias más formales de mejora). En este sentido, toda variable ficticia
debe justificarse en dos sentidos: (1) debe haberse probado la existencia de un
cambio estructural en términos analíticos y (2) debe argumentarse analítica y
teóricamente la falta de variables explícitas para recoger ese cambio.
-
Con relación al punto anterior, y en términos generales, se desaconseja el
uso de variables ficticias de forma generalizada para mejorar la estimación
en puntos o períodos en los que no exista evidencia estadística clara de
cambio estructural. La corrección de valores atípicos con variables ficticias
debe realizarse con moderación sólo en la medida en que creamos que la
mejora global para el modelo compensa la pérdida de control sobre la
especificación (una variable ficticia implica siempre, en mayor o menor medida,
una cierta renuncia a la real comprensión analítica del fenómeno analizado)
-
Las variables ficticias no son siempre dicotómicas, sino que sus valores
son definidos por el analista de la forma que mejor representen el
fenómeno del cambio estructural. Así, por ejemplo, si suponemos que a
partir de un determinado año, por ejemplo 1986, se ha producido un cambio
estructural que afecta al comportamiento del modelo de forma creciente hasta
el final de la muestra, la ficticia podría definirse con valores “0” hasta 1986 y
valores en progresión (1,2,3,4,……) a partir de ese momento. De igual forma, si
entendemos que, por ejemplo, el cambio estructural opera sólo durante un
período (por ejemplo un fenómeno extraordinario puntual, sin efectos sobre el
resto de períodos), podríamos definir una ficticia con valores “0” para toda la
muestra excepto para el año del cambio, en el que tomaría valor 1.
-
Cada una de las ficticias utilizadas en un modelo debe referirse a un aspecto
analítico concreto; debe evitarse utilizar una misma variable ficticia para
recoger cambios de estructura en distintos períodos que se refieran a
cuestiones de fondo diferentes.
-
Al utilizar variables dicotómicas, debe evitarse la denominada “trampa de
las ficticias”. Este fenómeno consiste en introducir varias ficticias por
subperíodos de forma que se genere una combinación lineal de ficticias que
iguale al término independiente. En este caso tendríamos un problema de
10
multicolinealidad exacta que impediría la estimación de los parámetros del
modelo.
La introducción de variables ficticias es un recurso común para enfrentar la presencia
de cambios de estructura pero no es la única alternativa. Existen procedimientos
analíticos más elaborados que permiten afrontar este problema, por ejemplo, la
utilización de modelos de parámetros cambiantes (switching regresions) en sus
distintas aproximaciones técnicas.
BREVES APUNTES SOBRE EL TEST DE CHOW EN E-VIEWS
Para realizar el test de Chow sobre una regresión cuyos datos tenemos cargados en
un Worfile de E-Views, caben dos alternativas:
-
Computar el test de Chow “ a mano”, es decir, estimando las dos regresiones
parciales en cada una de las dos submuestras en las que, el posible punto de
cambio, divide la muestra total. Por ejemplo, si en un modelo estimado entre
1980 y 2004 queremos observar si existe un cambio de estructura puntual en
1986, podemos estimar un primer submodelo desde 1980 a 1985 y un segundo
submodelo desde 1986 a 2004. Para estimar estas dos regresiones parciales
no hace falta generar objetos e regresión nuevos; cambiar la muestra de
estimación es simple, basta con abrir la regresión original a evaluar y
seleccionar la opción SAMPLE en el menú. Una vez estimadas los dos submodelos, el “estimation output” de la ecuación muestra, para cada una de ellas,
la suma cuadrática residual con la que puede computarse el test F de Chow.
-
Si se desea elaborar el test de forma automática, abrimos la regresión a
analizar y elegimos en la ventana de vistas (View) la opción Stability Test –
Chow Breakpoints Test y especificamos el año en el que pensamos que existe
un cambio estructural:
El resultado que ofrecerá E-Views será el valor de la “Fk,n-2k ” y el nivel de significación
a partir del cual el valor calculado en nuestro caso supera el valor de referencias en
tablas.
Chow Breakpoint Test: 1986
F-statistic
2.404744
Probability
11
0.078022
Log likelihood ratio
8.246343
Probability
0.041186
Recordamos que la hipótesis nula del test de Chow es la NO-Existencia de cambio
Estructural de modo que, en nuestro caso, con un 8% de nivel de significación (92%
de nivel de confianza) el valor calculado supera al valor tabulado indicando la
existencia de un cambio estructural en 1986.
-
Una segunda cuestión relevante para asegurar si efectivamente existe un
cambio de estructura y si, sobre todo, la variable ficticia incluida para corregirlo
se ha seleccionado adecuadamente, consiste en realizar la regresión
incluyendo ahora la variable ficticia y observar la ratio de significación individual
“t” de la variable ficticia.
12
Descargar