APUNTES DE CLASE ECONOMETRÍA I UDI ECONOMETRÍA E INFORMÁTICA Prof. Ramón Mahía [email protected] HIPÓTESIS ESTRUCTURALES: CAMBIO DE ESTRUCTURA ¿Qué se entiende por Cambio Estructural en el marco del MBRL?: Un modelo econométrico se plantea como una representación analítica de un determinado sistema de relaciones entre variables; unas relaciones que, en su conjunto, definen una determinada estructura. Los modelos econométricos representan las relaciones de esa estructura a partir de un conjunto de parámetros “ß” que ligan, para cada ecuación del modelo, la variable endógena y las exógenas (o explicativas): Yi = β 1 X 1 i + β 2 X 2 i + ⋅ ⋅ ⋅ ⋅ + u i La definición analítica del modelo, establece como hipótesis de partida que los parámetros “ßj” asociados a cada variable exógena son únicos y válidos para representar la relación entre la endógena “yi” y cada una de las exógenas “xji” a lo largo (o ancho) de la muestra de datos seleccionada en el análisis. Esto es, los parámetros (la relación analítica) son idénticos para todas las observaciones muestrales (los parámetros no tienes subíndice “i”); dicho de otro modo, la representación analítica sostiene que la estructura de relaciones entre variables se mantiene constante. Ejemplo: Si planteamos un modelo temporal que trate de explicar el crecimiento de las ventas de nuestra empresa en función de nuestro esfuerzo publicitario y nuestros precios y, para la estimación de los parámetros, decidimos tomar una muestra de datos que cubre el período 1970-2006, los parámetros estimados utilizando esa información serán únicos para todo el período. Esto implica, desde el punto de vista teórico, que la relación entre publicidad y ventas, o entre precios y ventas, se ha mantenido constante en los últimos 27 años. (No los valores de las ventas, publicidad y precios, sino la relación que explica los cambios de las ventas ante variaciones en precios y publicidad). Si esta hipótesis de permanencia de los parámetros se incumple hablamos de CAMBIO ESTRUCTURAL que, por tanto, se define como la evidencia de alteración significativa de los parámetros del modelo a lo largo de la muestra utilizada; en un caso como este, resultará difícil admitir, por tanto, que la realidad puede representarse analíticamente con un único conjunto de parámetros “ß”. ¿Por qué se produce?: 1. Inicialmente, y en términos generales (aunque abstractos) debe decirse que un cierto grado de cambio estructural es esencialmente inevitable, es decir, que la hipótesis de permanencia estructural es, en la práctica, una restricción. Efectivamente, la econometría se interesa en observar la 1 interrelación compleja entre las variables de un sistema o subsistema económico. La mayor parte de los sistemas multivariantes, tanto en economía como en otros contextos, no son sistemas estables, estáticos, en equilibrio: tanto desde el punto de vista teórico, conceptual, como en el plano puramente empírico, lo cierto es que no sólo las variables cambian (crecen, se aceleran, decrecen,…) sino que, a lo largo del tiempo, también se modifican las relaciones que existen entre ellas, aparecen nuevas variables relevantes, dejan de tener importancia factores que antes eran decisivos….. En este contexto de variabilidad, de dinamicidad, de cambio, parece por tanto algo restrictivo e ingenuo sostener una visión estática del sistema. En definitiva, el propio marco de análisis invita a pensar que, con mayor o menor relevancia cuantitativa, los sistemas analizados mediante un enfoque econométrico presentarán siempre cierta variabilidad estructural. Desde el punto de vista operativo no se discute esta afirmación previa y, de hecho, no es operativamente importante que exista un cambio estructural moderado, pero sí interesa observar hasta que punto ese cambio estructural tiene suficiente envergadura como para poner en cuestión los resultados obtenidos en un MBRL. 2. Junto a la cuestión de partida antes mencionada, esencial, difícil de evitar por parte del modelizador, existen otras causas que generan cambios estructurales explícitos, causas que, en mayor medida, sí deben ser resueltas o anticipadas por el económetra. Hablamos aquí de una alteración exógena de la estructura analítica a lo largo del período analizado. No se trata, en este caso, de la evolución natural, progresiva de todo sistema, sino de un cambio significativo, de mayor calado y generalmente más súbito en este sistema analizado. La situación más característica es quizá la ocurrencia de un acontecimiento puntual que genera un punto de ruptura que altera el sistema. Un cambio en la legislación laboral, la introducción de un nuevo impuesto, la firma de un acuerdo de libre comercio, un terremoto, son acontecimientos puntuales que generan un antes y un después en el marco teórico de referencia; su impacto sobre el marco de referencia puede ser temporal (un terremoto, un proceso de regularización de extranjeros) o definitivo (la introducción de un nuevo impuesto sobre el consumo) pero en todo caso hará imposible que un único modelo de parámetros fijos pueda ajustar esas dos (o más) realidades diferentes. Esta situación es la más comprometida desde el punto de vista de su corrección ya que, en la mayoría de los casos exige, bien una reducción de la base muestral utilizada (con el fin de utilizar el modelo para representar una única estructura, la más reciente), bien la utilización de variables ficticias. 3. Los cambios del marco analítico, progresivos o bruscos, causan la aparición de problemas de cambio estructural pero a estas causas, que son inherentes al propios sistema analizado, habría que añadir los problemas de cambio estructural inducidos por un error de especificación. Hablamos ahora por tanto de sistemas estables en los que sin embargo, y por error propio, nuestro modelo presenta cambio problemas estructural. o La omisión de variables relevantes en la especificación de un MBRL. Efectivamente, la sub-representación de la estructura, puede provocar la inestabilidad de los coeficientes de las variables que sí han sido explícitamente consideradas. Es decir, si omitimos parte de los factores explicativos de la evolución de una determinada variable endógena, es fácil suponer que el modelo “parcial” propuesto no sea capaz de representar con solidez el problema analizado y muestre 2 cierta variabilidad en sus coeficientes en la medida en que los “factores olvidados” presenten también cierta variabilidad. 1 o - Una inadecuada selección de la forma funcional en el modelo, es susceptible también de generar problemas de cambio estructural. Así, por ejemplo, si adoptamos un perfil de relación lineal entre producción y coste total de la producción, siendo la verdadera relación de tipo logístico, el modelo de regresión podría funcionar correctamente en el tramo central de la curva, pero fracasaría en la primera sección (fase de mayores rendimientos crecientes) y en la última sección (fase de mayores rendimientos decrecientes). Un apunte adicional de interés tiene que ver con el uso de modelos transversales. Aunque hasta este punto se han empleado siempre ejemplos temporales, el cambio estructural no es sólo un fenómeno asociado a los estudios “temporales”; más aún, el riesgo de cambio estructural es aún mayor en los modelos transversales. La razón de ese mayor riesgo estriba en que, en los modelos transversales no hay ninguna restricción sobre cómo se compone la muestra observada mientras que en los modelos temporales, el propio paso del tiempo impone una secuencia de orden en los datos que se utilizan. Por ejemplo, en un modelo temporal que analice el consumo en España en los últimos 20 años, tomaríamos, por ejemplo, una muestra 1987-2006; si existe cambio estructural en ese período, será un cambio endógeno, NO inducido por la selección muestral; sin embargo, si analizamos el mismo fenómeno mediante un modelo transversal para un conjunto de países, la selección de la muestra concreta de países a considerar puede generar la aparición de un cambio estructural (por mezclar, por ejemplo, países subdesarrollados y desarrollados) o no. ¿Cómo se detecta?: La detección del cambio estructural puede llevarse a cabo de muy distintos modos, Antonio Pulido y Julián Pérez (Modelos Econométricos, pg. 435), clasifican los métodos en tres grupos de estrategias analíticas bien distintas que, en realidad, pueden resumirse en dos: - Contrastes basados en la comparación de modelos restringidos y no restringidos: o o o o - Test Chow Contraste Wald Ratios de Verosimilitud Test del Multiplicador de Lagrange Contrastes basados en estimaciones recursivas o o CUSUM CUSUM –SQ 1 Así, por ejemplo, piense en un modelo en que, para explicar las ventas de nuestra empresa, hayamos recurrido a nuestra publicidad y nuestros precios pero hayamos olvidado la publicidad y los precios de la competencia. Es evidente que nuestro esfuerzo publicitario, por citar sólo la primera explicativa, será más o menos efectivo en función del esfuerzo realizado por la competencia y que, por tanto, si olvidamos incluir esta variable de competencia, el parámetro estimado para la relación entre nuestro gasto publicitario y nuestras ventas no podrá ser constante. 3 Presentaremos en este documento introductorio el Test de Chow, como procedimiento confirmatorio sencillo (aunque limitado) de detección de cambio estructural basado en la comparación de modelos, e introduciremos la idea que subyace en la aplicación de los contrastes recursivos. - Test de Chow Dentro del primer conjunto de métodos, vamos a desarrollar aquí el llamado Test de Chow2, un test paramétrico3 sobre los residuos de estimaciones alternativas cuya aplicación precisa de los siguientes requisitos: 1. El test de Chow no “busca” cambios estructurales en la muestra, sino que confirma o desmiente una sospecha previa de cambio estructural por parte del modelizador. Así pues, debe conocerse el punto o los puntos de cambio de estructura; en la práctica sospechamos, por tanto, y a priori, de la aparición de un punto de ruptura, bien por la existencia de razones teóricas que avalen conceptualmente ese cambio4, bien por observar, en los resultados obtenidos, alguno de los síntomas habituales en presencia de un cambio estructural (cambio o ruptura en la dinámica de los errores, intervalos de confianza sistemáticamente amplios para las variables exógenas seleccionadas….) 2. Conviene que el punto de cambio “sospechoso” (por ejemplo, el año en que sospechamos que la estructura empezó a cambiar) no se encuentre muy cerca del principio o final de la muestra. Es decir, lo ideal es que este punto de ruptura divida la muestra total en dos “trozos” (submuestras ) suficientemente amplias. La razón de este requisito estriba en que, como se verá más adelante, para poner en marcha el Test de Chow, vamos a estimar nuestro modelo, por separado, en cada una de las dos submuestras (estructuras diferentes) así que, en cada una de ellas, necesitamos un número suficiente de datos como para poder estimar. Una vez dadas estas condiciones de partida, la forma de operar para realizar el contraste es sencilla; para el caso de un único punto de cambio estructural: 1. Se divide la muestra total de tamaño “n” en las dos submuestras que determina el punto de corte de tamaños “n1” y “n2” respectivamente. 2. Además del modelo inicialmente estimado (el originalmente estimado para el total de la muestra) se estiman ahora dos modelos más, uno en cada una de las dos submuestras identificadas. De cada una de estas dos nuevas estimaciones parciales se obtendrá, evidentemente, un conjunto de parámetros diferentes así como unos errores de estimación diferentes. 3. Utilizando los errores de la estimación original y de las dos estimaciones parciales se elabora el siguiente contraste, cuya hipótesis nula será que 2 Los primeros trabajos relacionados con este test se encuentran en: Chow, C.G. Econométrica, Vol.28. Num. 3. 1960 aunque el desarrollo de la expresión simplificada que se presenta en el texto es obra de F.M Fisher. Econometrita. Vol. 38. Num 2. (1970). 3 Se entiende por test paramétrico aquel que cuyo resultado puede expresarse en términos de probabilidad recurriendo a la utilización del contraste de hipótesis estadístico habitual (definición de un estadístico de contraste, establecimiento de hipótesis nula, observación en tablas del valor crítico….) 4 Por ejemplo, en un modelo para explicar la generación de empleo en la economía española estimado entre 1990 y 2006 sabemos que, en determinados momentos de la muestra se han producido cambios legislativos importantes en materia laboral que podrían haber afectado a las relaciones entre las variables del modelo. 4 los dos conjuntos de parámetros (los derivados de los sub-modelos de las distintas sub-muestras) son iguales: F( k , n1 + n2 − 2k ) = ( e ' e − ( e1' e1 + e '2e 2 )) / k ( e1' e1 + e '2e 2 ) /( n1 + n 2 − 2 k ) donde (e’e) es la suma cuadrática residual para el modelo global estimado con “n” datos, (e1’e1) es la suma cuadrática residual para el modelo estimado en la primera submuestra de tamaño “n1” y (e2 ’e2) es la suma cuadrática residual para el modelo estimado en la segunda submuestra de tamaño “n2”. El contraste propuesto es extremadamente sencillo de comprender. Si se observa con atención, se comprueba que el numerador de la expresión compara los residuos obtenidos en el modelo único (e’e) frente a los residuos obtenidos en las dos estimaciones parciales (e1’e1) y (e2’e2). Es decir, se están comparando dos estrategias distintas de estimar el modelo: una estrategia en la que la muestra se utiliza al completo (porque se entiende que no hay cambio estructural) con otra estrategia en la que, en lugar de un único modelo, se estiman dos modelos, porque se entiende que hay dos estructuras diferentes en la muestra. El test trata de expresar, por tanto, si la estimación única genera más errores que una estimación partida. Si fuera así, si los errores obtenidos con una única estimación fueran claramente superiores a los obtenidos cuando se opta por dos modelos, debe entenderse que existe cambio estructural. Por el contrario, si los errores cometidos con la utilización de único modelo son similares a la suma de los errores cometidos con dos modelos parciales no habría razón para pensar que la muestra contiene un cambio estructural. Podrá observarse en la expresión, que una vez computada la diferencia de errores, esta se expresa en términos porcentuales, con el objeto de eliminar el efecto del tamaño de las unidades de medida; y se corrige, como en todo contraste, numerador y denominador, por los grados de libertad utilizados en cada expresión 5. Evidentemente, desde el punto de vista matemático, aún cuando no existiera cambio estructural el error cometido con una única estimación será siempre superior a la suma de los errores parciales6; lo que el test trata de determinar es si esa ganancia es lo suficientemente grande como para sospechar que existe un cambio estructural relevante. Puede comprobarse que este test se distribuye como una ratio “F” de modo que su empleo para el contraste de la hipótesis nula es sencillo: cuando el valor de este estadístico calculado supera al valor de tablas de una distribución “F” debe considerarse que existe cambio de estructura (Es decir, cuando esta ratio toma un valor muy grande, superior al de tablas, en nuestros cálculos, esto significa que el error cometido con un único modelo es mucho mayor que la suma de errores 5 Los grados de libertad del numerador “k”, provienen de la combinación de los grados de libertad utilizados para el cálculo de las sumas cuadráticas residuales expresadas en el mismo: (n-k) para el modelo total, (n1-k) para el modelo estimado en la primera submuestra y (n2-k) para el modelo estimado en la segunda submuestra. Así, (n-k)-( (n 1-k )-(n2k))=k. 6 Las estructuras siempre cambian, aún de forma muy leve, por lo que fraccionar la estimación de un modelo en trozos siempre generará menores errores totales. (Otra cosa distinta es la menor fiablidad de los resultados obtenidos con muestras más pequeñas). 5 cometidos con dos estimaciones parciales lo que avala la existencia de un punto de cambio estructural). Las limitaciones de este contraste son obvias: - Sólo detecta cambios de estructura bruscos, que puedan asociarse de hecho a “puntos de ruptura” en la muestra. En el caso de una alteración menos súbita, progresiva, que se genere por ejemplo a lo largo de varios años en un modelo temporal, el test tiene, evidentemente, claros problemas de potencia (tiende a aceptar la ausencia de cambio estructural)7 - Para su aplicación, debemos conocer previamente el punto corte, es decir, no es un contraste con capacidad para “detectar” cambio de estructura, sino para “confirmar” la sospecha de su existencia en un determinado punto. - El contraste pierde potencia a medida que el punto de corte se acerca a los extremos dado que, en ese caso, una de las dos estructuras estará subrepresentada por la muestra y será difícil observar entonces el cambio en la calidad de la estimación (y en los errores cuadráticos) - Es sensible a la presencia de heterocedasticidad. Efectivamente, la presencia de heterocedasticidad (que puede no estar causada por diversos problemas) se manifiesta en una evolución no constante de los errores de la estimación (lo errores tienden a crecer o a decrecer según avanzamos en la muestra), de modo que esa evolución en los errores puede provocar un resultado significativo del test de Chow (que en definitiva también compara los errores por subperíodos) y una falsa conclusión sobre la existencia de un cambio estructural. Además de la versión del test expuesta, existen algunas variaciones de este contraste pensadas para situaciones especiales. Por ejemplo, es habitual que alguna de las dos submuestras en las que puede dividirse el período no sea suficientemente amplia. En este caso, no podríamos estimar el modelo en la muestra insuficiente al carecer de grados de libertad y, por tanto conviene utilizar la denominada versión reducida del Test de Chow que considera sólo los errores de la submuestra para la que tenemos suficiente número de datos. F( n2 −k ,n1 −k ) ( e ' e − e1' e1 ) / n2 − k = ( e1' e1 ) /( n1 − k ) La interpretación y el manejo del test son idénticos al expuesto para la expresión inicial aunque, como puede observarse ahora sólo se compara la estimación total con una única estimación parcial y no dos (la realizada sobre la muestra de datos de suficiente tamaño) - Introducción al test de estimaciones recursivas Esta familia de contrastes se apoya en la estrategia de realizar estimaciones recursivas de un mismo modelo comparando una estimación inicial realizada sobre 7 Ante la sospecha de un cambio gradual de esta naturaleza, una sugerencia de utilidad general podría ser aplicar el test de Chow comparando la estimación global con la suma de las dos estimaciones realizadas al principio y al final de la muestra, eliminando los datos referidos al período de transición entre las dos estructuras. 6 una muestra de tamaño mínimo de datos con estimaciones sucesivamente en las que se van incorporando progresivamente el resto de observaciones muestrales hasta agotar el conjunto de datos disponibles, tal y como se muestra en la siguiente ilustración. Ilustración simple de la estrategia de la estimación recursiva i=1 i=1 i=1 i=n Muestra completa de “n” datos i=s Primera estimación con “s” datos para “s-k” suficiente i=s+1 i=1 “n-s+1” i=s+2 Estimaciones i=1 i=s+3 i=1 recursivas i=s+4 i=1 i=s+5 i=1 i=s+6 La idea del procedimiento es sencilla: en la medida en que la estructura cambie notablemente alterándose los valores de los coeficientes del modelo, los resultados obtenidos en las estimaciones recursivas deben variar notablemente, bien en sus parámetros, bien en los residuos promedio obtenidos en cada uno de ellos, bien en ambos. La simple representación gráfica de los resultados obtenidos en las estimaciones recursivas puede ayudarnos a calibrar la intensidad de un cambio estructural en el modelo. Por ejemplo, el siguiente gráfico muestra la evolución creciente de un determinado parámetro ( que denominamos c(1) ) de una regresión según se van añadiendo observaciones muestrales en la estimación del modelo a partir de una estimación inicial desde 1970 a 1992. Ejemplo gráfico de estimaciones recursivas para un parámetro 7 0.004 0.002 0.000 -0.002 -0.004 95 96 97 98 99 00 Recursive C(1) Estimates 01 02 ± 2 S.E. Del mismo modo, el gráfico siguiente ilustra sobre los errores (residuos recursivos), también crecientes, que se van cometiendo en las estimaciones sucesivas del modelo: Ejemplo gráfico de estimaciones recursivas para un parámetro 80000 60000 40000 20000 0 -20000 -40000 -60000 -80000 92 93 94 95 96 97 Recursive Residuals 98 99 00 01 02 ± 2 S.E. No obstante, junto a las medidas gráficas puede elaborarse alguna medida cuantitativa que nos permita contrastar si las variaciones en las estimaciones recursivas son suficientemente amplias. Esta es la utilidad de los conocidos contrates CUSUM, CUSUM-SQ o MOSUM 8 en cuyo desarrollo y aplicación no vamos a detenernos pero cuya utilización es sencilla: todos estos contrastes se construyen a partir de la suma, debidamente estandarizada, de los residuos recursivos expresados en términos promedio; un valor de los contrastes por encima de los valores de tablas indican cambio estructural. ¿Cuáles son las consecuencias del cambio estructural sobre el MBRL?: En términos generales, los principales problemas derivados del cambio estructural son: - En presencia de dos o más estructuras representadas con único modelo, la estimación de un único modelo no puede capturar esas diversas realidades con 8 Los desarrollos completos de estos test pueden encontrarse en el libro Modelos Econométricos, de Antonio Pulido y Julián Pérez, pg. 444 y 445. 8 un único conjunto de parámetros. Así pues, los parámetros obtenidos en una estimación en presencia de cambio estructural son, por fuerza y en comparación con los que obtendríamos con modelos estimados para cada una de las submuestras independientes, sesgados e inconsistentes, esto es, están alejados de los valores reales de los conjuntos de parámetros existentes. Esto no significa que la estimación total sea, en si misma, sesgada o inconsistente; la estimación del modelo con MCO garantiza ambas propiedades para los parámetros en la muestra total; el sesgo y la inconsistencia son, en este caso, incumplimientos relativos al comparar un modelo único con dos modelos parciales. - Al mezclar datos correspondientes a estructuras diferentes, los errores que se cometerán en la muestra total serán mayores (su varianza será mayor) que los que se cometerían utilizando un modelo distinto para cada submuestra. Esta ineficiencia en la muestra total se traducirá en contrastes “t” más exigentes, al incrementarse la varianza de los parámetros estimados con relación a la que se obtendría en estimaciones parciales (ineficiencia relativa), lo que provocará frecuentes errores de tipo II en el contraste de la hipótesis de nulidad de los parámetros (las variables tienden a rechazarse como explicativas aún siéndolo) así como en otros contrastes en cuya base de cálculo intervenga el estimador de la varianza de la perturbación aleatoria. - El ejercicio de predicción se complica, tanto más cuanto menor sea la submuestra final, ya que se realizará tomando en consideración unos parámetros que, en realidad, no representan ninguna estructura real, sino una especie de promedio de dos o más estructuras mezcladas. - EN RESUMEN: Parámetros SESGADOS, INCONSISTENTES e INEFICIENTES respecto a cada una de las submuestras; errores en la APLICACIÓN DE CONTRASTES, y en mayor o menor medida PREDICCIÓN INCORECTA. ¿Cómo se corrige?: La corrección de un cambio estructural pasa por determinar las causas de su aparición. - Si el cambio de estructura puede asociarse a un claro error en la especificación, podemos tratar de corregirlo revisando el planteamiento original del modelo, es decir, en concreto revisando la forma funcional, o modificando la selección de variables relevantes, en especial si hemos olvidado incluir alguna variable relevante. - Si el cambio estructural es endógeno, no está relacionado con un error de especificación, sino con un cambio genuino en el sistema analizado, podemos tratar de: o Replantear la selección del período muestral tratando de ajustarlo, si está analíticamente justificado, a una única estructura real. o Representar ese cambio en el modelo introduciendo, como explicativas, lo que se denominan variables ficticias. Las variables ficticias no son otra cosa que variables cuyos valores son decididos por el analista de forma arbitraria, generalmente en forma dicotómica (0,1), 9 con el fin de capturar, de forma sencilla, cambios estructurales que no pueden representarse con variables reales. Ejemplo: si hemos realizado un modelo explicativo de nuestras exportaciones desde 1970 a 2003 y suponemos que a partir del año 1986 la estructura de nuestro comercio exterior se alteró por nuestra incorporación al Mercado Común Europeo, podemos incluir una nueva variable explicativa ficticia que tome valores 0 hasta 1986 y 1 a partir de 1986; esta variable, representaría el concepto, difícilmente cuantificable, de “la incorporación al Mercado Común” de una forma simple. La introducción de esta variable permitiría calcular un parámetro asociado a este cambio que depuraría las estimaciones del resto de parámetros eliminando el efecto del cambio estructural sobre los mismos. Respecto a la utilización de variables ficticias pueden señalarse las siguientes puntualizaciones: - La utilización de ficticias sólo debe realizarse en ausencia de otras variables más explícitas que también puedan representar ese cambio de estructura (no se trata, por tanto, de un recurso alternativo a una adecuada reforma de la especificación sino de un recurso de última instancia en ausencia de estrategias más formales de mejora). En este sentido, toda variable ficticia debe justificarse en dos sentidos: (1) debe haberse probado la existencia de un cambio estructural en términos analíticos y (2) debe argumentarse analítica y teóricamente la falta de variables explícitas para recoger ese cambio. - Con relación al punto anterior, y en términos generales, se desaconseja el uso de variables ficticias de forma generalizada para mejorar la estimación en puntos o períodos en los que no exista evidencia estadística clara de cambio estructural. La corrección de valores atípicos con variables ficticias debe realizarse con moderación sólo en la medida en que creamos que la mejora global para el modelo compensa la pérdida de control sobre la especificación (una variable ficticia implica siempre, en mayor o menor medida, una cierta renuncia a la real comprensión analítica del fenómeno analizado) - Las variables ficticias no son siempre dicotómicas, sino que sus valores son definidos por el analista de la forma que mejor representen el fenómeno del cambio estructural. Así, por ejemplo, si suponemos que a partir de un determinado año, por ejemplo 1986, se ha producido un cambio estructural que afecta al comportamiento del modelo de forma creciente hasta el final de la muestra, la ficticia podría definirse con valores “0” hasta 1986 y valores en progresión (1,2,3,4,……) a partir de ese momento. De igual forma, si entendemos que, por ejemplo, el cambio estructural opera sólo durante un período (por ejemplo un fenómeno extraordinario puntual, sin efectos sobre el resto de períodos), podríamos definir una ficticia con valores “0” para toda la muestra excepto para el año del cambio, en el que tomaría valor 1. - Cada una de las ficticias utilizadas en un modelo debe referirse a un aspecto analítico concreto; debe evitarse utilizar una misma variable ficticia para recoger cambios de estructura en distintos períodos que se refieran a cuestiones de fondo diferentes. - Al utilizar variables dicotómicas, debe evitarse la denominada “trampa de las ficticias”. Este fenómeno consiste en introducir varias ficticias por subperíodos de forma que se genere una combinación lineal de ficticias que iguale al término independiente. En este caso tendríamos un problema de 10 multicolinealidad exacta que impediría la estimación de los parámetros del modelo. La introducción de variables ficticias es un recurso común para enfrentar la presencia de cambios de estructura pero no es la única alternativa. Existen procedimientos analíticos más elaborados que permiten afrontar este problema, por ejemplo, la utilización de modelos de parámetros cambiantes (switching regresions) en sus distintas aproximaciones técnicas. BREVES APUNTES SOBRE EL TEST DE CHOW EN E-VIEWS Para realizar el test de Chow sobre una regresión cuyos datos tenemos cargados en un Worfile de E-Views, caben dos alternativas: - Computar el test de Chow “ a mano”, es decir, estimando las dos regresiones parciales en cada una de las dos submuestras en las que, el posible punto de cambio, divide la muestra total. Por ejemplo, si en un modelo estimado entre 1980 y 2004 queremos observar si existe un cambio de estructura puntual en 1986, podemos estimar un primer submodelo desde 1980 a 1985 y un segundo submodelo desde 1986 a 2004. Para estimar estas dos regresiones parciales no hace falta generar objetos e regresión nuevos; cambiar la muestra de estimación es simple, basta con abrir la regresión original a evaluar y seleccionar la opción SAMPLE en el menú. Una vez estimadas los dos submodelos, el “estimation output” de la ecuación muestra, para cada una de ellas, la suma cuadrática residual con la que puede computarse el test F de Chow. - Si se desea elaborar el test de forma automática, abrimos la regresión a analizar y elegimos en la ventana de vistas (View) la opción Stability Test – Chow Breakpoints Test y especificamos el año en el que pensamos que existe un cambio estructural: El resultado que ofrecerá E-Views será el valor de la “Fk,n-2k ” y el nivel de significación a partir del cual el valor calculado en nuestro caso supera el valor de referencias en tablas. Chow Breakpoint Test: 1986 F-statistic 2.404744 Probability 11 0.078022 Log likelihood ratio 8.246343 Probability 0.041186 Recordamos que la hipótesis nula del test de Chow es la NO-Existencia de cambio Estructural de modo que, en nuestro caso, con un 8% de nivel de significación (92% de nivel de confianza) el valor calculado supera al valor tabulado indicando la existencia de un cambio estructural en 1986. - Una segunda cuestión relevante para asegurar si efectivamente existe un cambio de estructura y si, sobre todo, la variable ficticia incluida para corregirlo se ha seleccionado adecuadamente, consiste en realizar la regresión incluyendo ahora la variable ficticia y observar la ratio de significación individual “t” de la variable ficticia. 12