EL PROBLEMA DE LA PREDICCIÓN EN LAS ECONOMÍAS REGIONALES. UNA APLICACIÓN PARA EL CASO DE CATALUÑA Mónica Reyes1 Equipo de Análisis Cuantitativo Regional Departamento de Econometría Estadística y Economía Española Avda. Diagonal, 690 08034 - Barcelona Universidad de Barcelona Junio 2000 RESUMEN En el presente trabajo se realiza un estudio comparativo de distintos métodos para predecir la evolución de una economía en un entorno regional. Para ello se utilizan diferentes técnicas econométricas de modelización, fundamentalmente de tipo multivariante. En concreto, se estiman modelos especificados en términos de mecanismo de corrección del error por un lado, y por el otro modelos especificados siguiendo la metodología VAR. A continuación se analiza la bondad de cada una de las metodologías empleadas para la predicción del comportamiento de una economía regional, tratando el caso particular de Cataluña. Palabras clave: métodos de predicción, cointegración, modelos VAR 1 Con el apoyo del Comissionat per a Universitats i Recerca de la Generalitat de Catalunya. 2 1. INTRODUCCIÓN Las economías regionales presentan una serie de características que hacen que sea interesante el estudio de la predicción en este entorno. De ellas cabe destacar dos: el hecho de que la economía regional esté fuertemente ligada a otra de ámbito superior, economía que influirá de forma importante en su evolución y, el hecho de que la disponibilidad de información para estimar los modelos que facilitarán la predicción no es la deseable. A partir de la constatación de esta realidad se considera como objetivo del presente trabajo la comparación de diferentes métodos de predicción de la evolución de las variables de VAB sectorial en una economía regional, siendo en este caso la economía catalana. Para ello el trabajo se estructura como sigue: en primer lugar se realiza una breve presentación de los métodos de predicción considerados. A continuación se analiza la información estadística disponible a nivel de Cataluña para determinar cuáles de estos métodos podrán ser utilizados. En tercer lugar, se especifican y estiman los modelos para posteriormente realizar una predicción ex-post para los dos últimos años disponibles. El análisis de los resultados obtenidos permite establecer unas primeras conclusiones sobre el método que presenta mejores propiedades en términos de capacidad predictiva. 2. MÉTODOS DE PREDICCIÓN Como es sabido, para realizar predicciones sobre las principales macromagnitudes de una economía en la literatura se han propuesta distintos métodos. Existen distintas clasificaciones de los métodos de predicción según diferentes autores (un esquema de estas distintas clasificaciones se puede encontrar en Aznar, 1997). En el presente trabajo los métodos de predicción considerados para su posible aplicación a nivel regional se dividen en dos grandes grupos: métodos basados en la teoría económica, y métodos basados en series temporales. Los métodos basados en la teoría económica toman como punto de partida las relaciones existentes entre variables según esta teoría económica para determinar el comportamiento futuro de las variables de interés. El uso de la teoría económica permite utilizar a su vez distintas especificaciones según el tipo de teoría considerada. Por ejemplo, se puede considerar la información contenida en tablas input-output (ejemplos de este uso se pueden encontrar en el trabajo de Rey (1998). Otro tipo importante de modelización es la basada en modelos macroeconométricos. Se trata de modelos cuya especificación se basa en la teoría macroeconómica, partiendo desde especificaciones sencillas como las dadas por los modelos denominados de base económica (modelos basados en la división de los sectores económicos en básicos y no básicos según su influencia en economías externas a la de la región de interés) hasta llegar a planteamientos más complejos que utilicen postulados keynesianos, monetaristas, o bien que incluyan expectativas. Dentro de la última década se pueden encontrar distintos ejemplos de modelización basada en la macroeconometría. Los métodos que utilizan la base económica han sido muy utilizados para distintas regiones de la economía española. Éstos se encuentran, por ejemplo, en el trabajo de Serrano (1995) para la Comunidad Valenciana, Ramos et al. (1999) para Cataluña, Márquez (1998) para Extremadura o Trívez y Mur (1994) para la economía aragonesa. Ejemplos de modelos que utilizan teorías keynesianas y monetaristas se pueden encontrar en el trabajo de Whitley (1994), mientras que Hall et al. (1994) aplican la introducción de las expectativas para analizar la evolución de la economía inglesa. En el momento de especificar un modelo según la macroeconomía para una economía regional puede existir un problema muy importante con la disponibilidad de información estadística para estimar el modelo. Ésta acostumbra a ser insuficiente, lo cual limita las 3 posibilidades de aplicar las teorías macroeconómicas. Una solución que se suele dar a este problema es la de considerar una aproximación a estas teorías económicas a través de modelos de indicadores. Ello implica que en la estimación de la variable objetivo no se considera la teoría económica de forma estricta, pero sí la utilización de variables con influencia en la evolución de ésta. Un ejemplo es el trabajo de Artís et al. (1997) para la economía catalana. Por otro lado existen los métodos basados en series temporales. Dentro de este tipo de métodos se pueden encontrar distintas modelizaciones que parten desde las especificaciones ARIMA pasando por los modelos VAR, VAR bayesianos, o bién las funciones de transferencia. Como ejemplos se encuentran los trabajos de Jacobs y Van der Horst (1996) para la economía holandesa, de Crone y McLaughlin (1999) para la economía de Philadelphia y el de DeBenedictis (1997) para la economía de Columbia. Ambos métodos presentan ventajas y inconvenientes. Los primeros se ayudan de la teoría económica para establecer las relaciones entre variables, pero reciben la crítica de que los supuestos teóricos utilizados pueden ser muy restrictivos. Además, en el momento de querer realizar predicciones ex-ante normalmente no se dispondrá del valor de las variables exógenas en el momento requerido, por lo que será necesario predecirlas también. El requerimiento de la predicción de las variables exógenas implica una pérdida en la eficacia de las predicciones de las endógenas, ya que los errores cometidos al predecir las exógenas se trasladarán a éstas. Por otro lado, los métodos del segundo grupo utilizan el máximo de información sobre el comportamiento de la variable y generalmente endogeneizan todas las variables utilizadas, lo que evita el problema de realizar una predicción aparte de las variables exógenas, pero pueden llevar a problemas de sobreparametrización en algunos casos. Es muy importante tener en cuenta este último aspecto en la predicción en economías regionales, ya que las series disponibles no resultan muy largas y ello podría llevar a problemas de grados de libertad en el momento de estimar las ecuaciones. Existe otro tipo de clasificación dentro de la modelización necesaria para establecer una predicción a nivel regional. En este tipo de clasificación se considera la relación que tiene la economía regional de interés con el resto de economías de su entorno (Artís et al, 1997). En primer lugar se puede distinguir entre modelos que destacan la influencia existente de ésta sobre la economía superior en la cual se encuentra incluida (normalmente la nacional), y al revés. En este sentido se distingue entre modelos denominados Bottom-Up y Top-Down. Los modelos Bottom-Up (o ascendentes) estiman en primer lugar la variable objetivo en las economías regionales para posteriormente poder agregarla de forma ponderada para obtener su valor en el área superior. Este enfoque no se acostumbra a aplicar con frecuencia por la problemática existente con los datos: éstos no son homogéneos en las distintas áreas, la información a nivel regional acostumbra a ser escasa.... Pero, presenta como ventajas la estimación de forma directa de la actividad económica y considera las relaciones económicas entre la región y la nación (existencia de feedback). Los modelos Top-Down (o descendentes) parten del valor de la variable objetivo a nivel nacional, por lo que se suelen utilizar las variables nacionales como explicativas para poder estimar su valor en las economías regionales. La ventaja que presentan es que no requieren mucha información estadística. Pero, tienen el inconveniente de que son métodos indirectos dónde sólo se da causalidad de la nación a la región, pero no se tienen en cuenta las posibles relaciones entre la región y la nación. Otro tipo de clasificación que se puede establecer a nivel regional es la que considera la utilización de modelos uniregionales frente a modelos multiregionales. En los modelos uniregionales se considera únicamente la economía de la región de interés, sin tener en cuenta su posible relación con otras regiones de su entorno. En cambio, en la especificación de 4 modelos multiregionales se tiene en cuenta la economía de otras regiones con las cuáles puedan existir interacciones económicas. En cuanto a las ventajas e inconvenientes de cada tipo de modelización se puede destacar el inconveniente que presenta la uniregional al no recoger las relaciones con otras economías a su mismo nivel, pero presenta la ventaja respecto de la multiregional de no requerir de una cantidad de información estadística tan importante. En el momento de establecer un método para realizar predicción a nivel regional se debe tener en cuenta, por lo tanto, las características de éste siguiendo las clasificaciones establecidas en este punto del trabajo. Dada la información disponible resulta clara la elección del tipo de modelización regional: modelos de tipo Top-Down uniregionales. En cambio, la elección de una modelización considerando una base teórica o de series temporales no resulta tan clara según la ventajas e inconvenientes presentados. Es por ello que el siguiente paso dentro de este trabajo consiste en la aplicación práctica de estas teorías para poder decidir cual ofrece mejores resultados en la estimación del VAB sectorial de la economía catalana. 3. LAS VARIABLES UTILIZADAS Un aspecto básico a considerar en el momento de realizar predicciones para una región es el de la información disponible, ya que la cantidad y calidad de la misma determinará el tipo de métodos que se podrán utilizar para hacer esta predicción. En este sentido es importante destacar que dentro del ámbito de las economías regionales en España no existe información oficial de macromagnitudes de todas ellas hasta el año 1980, año en el cual empieza el Instituto Nacional de Estadística la denominada Contabilidad Regional Española (CRE). Dentro de esta Contabilidad se obtienen datos de VAB a precios corrientes para distintas ramas de actividad de la economía, además de la ocupación dentro de éstas, todo ello a nivel provincial. Esta tardanza de la aparición de datos oficiales a nivel de Comunidades Autónomas ha llevado a que diversos grupos de investigación hayan realizado un esfuerzo para obtener estimaciones de las macromagnitudes económicas regionales (principalmente del VAB sectorial), especialmente para los años en que no hay información oficial de la CRE. En este sentido cabe destacar el trabajo llevado a cabo por el Banco Bilbao Vizcaya para estimar el VAB provincial por distintas ramas de actividad de forma bianual desde el año 1955. También se pueden incluir los trabajos realizados por la Fundación Fondo para la Investigación Económica y Social de las Cajas de Ahorros Confederadas, en los cuales se incluyen estimaciones del crecimiento del PIB por Comunidades Autónomas a precios corrientes y constantes. Un último proyecto que se puede incluir en este apartado es el realizado por el proyecto Hispalink. En este caso se ofrecen datos de VAB sectorial desde principios de la década de los setenta a precios constantes. La información de VAB ofrecida por el proyecto Hispalink es la utilizada dentro de este trabajo para poder estimar los modelos que permitirán predecirlo de forma sectorial para Cataluña. Se predecirá en principio la evolución de los sectores siguientes: agrícola, industrial, construcción, servicios venta y servicios no venta2. Para los tres primeros sectores se utilizarán datos desde el año 1972 hasta el año 1995, mientras que para los servicios, por falta de información de alguna de las variables exógenas utilizadas, en principio se utilizarán datos desde el año 1977 hasta el año 1995. Dentro de las variables exógenas utilizadas se consideran tanto variables de tipo regional como variables de tipo nacional, de forma que se considera la importancia que tiene el hecho de encontrarse fuertemente influida por la economía superior a la cual pertenece. Se debe comentar también el hecho de que se ha trabajado con las variables transformadas en logaritmos. 2 No se ha considerado un número mayor de sectores para poder evitar errores en la especificación debidos a la falta de información estadística. 5 4. LA ESTIMACIÓN DE LOS MODELOS Tal como se ha destacado en la introducción el objetivo del presente trabajo es el de poder comparar distintos tipos de predicción posibles para una economía regional, en concreto la catalana. En este apartado se presentan los modelos estimados, así como el análisis de su capacidad predictiva. Los dos tipos de métodos utilizados son, por un lado, un modelo de indicadores y, por el otro, un modelo VAR. 4.1. MODELO DE INDICADORES Se ha estimado un modelo de indicadores como aproximación a los modelos teóricos. La disponibilidad de información en la economía catalana ha hecho que, en este caso, fuera difícil utilizar especificaciones teóricamente más complejas para la estimación de los modelos. Se debe destacar el hecho de que la última tabla input-output calculada para la economía catalana data del año 1987. Dado el tiempo transcurrido resulta difícil trabajar con esta tabla input-output para realizar predicciones, por lo que en principio todas las opciones que comprenden esta modalidad resultan rechazadas. La estrategia seguida ha sido la siguiente: en primer lugar se han estimado de forma uniecuacional las ecuaciones para cada sector, y posteriormente se han añadido identidades contables que relacionan los distintos sectores de forma que se obtiene el valor final del VAB sectorial. Para determinar la ecuación para cada sector se ha utilizado una metodologia stepwise, en la cual se estiman los modelos considerando como explicativas los distintos indicadores disponibles, observando la bondad del modelo según las variables utilizadas. A partir de aquí se elige para cada sector el modelo que presente una mayor capacidad explicativa. Antes de realizar las estimaciones se han estudiado las características de las variables para determinar la posible existencia de raíces unitarias en su evolución. Para ello se ha utilizado la representación de la FAS y la FAP de cada variable, y posteriormente se han aplicado los tests de Dickey-Fuller Ampliado, Philips y Perron, y el KPSS. La conclusión a la que se llega es que todas las variables son integradas de orden 1 excepto el VAB agrario y la producción de vino, que son estacionarias. Al descubrir la existencia de integrabilidad en las variables se puede optar por dos estrategias distintas. La primera sería diferenciarlas para eliminar la raíz unitaria, y la segunda sería buscar relaciones de cointegración. El hecho de buscar relaciones de cointegración resulta importante, ya que, al diferenciar las variables, es posible que se pierda información de las relaciones que puedan tener éstas en el largo plazo. Si se encuentran estas relaciones en el largo plazo el modelo se puede especificar utilizando un mecanismo de corrección del error para recogerlas y de esta forma mejorar la estimación de este modelo. El test utilizado para encontrar relaciones de cointegración es el de Kremers, Ericsson y Dolado, y, aplicado sobre cuatro sectores3, muestra la existencia de relaciones de cointegración en el sector industrial y en el de los servicios no a la venta, por lo que se aplicará el mecanismo de corrección del error al encontrar las ecuaciones de estos sectores, estimadas a través del método de mínimos cuadrados no lineales. Las ecuaciones para el resto de sectores se estiman a través de mínimos cuadrados ordinarios, diferenciando aquellas variables que presenten raíces unitarias. Los resultados son los siguientes. 3 No se considera el de la agricultura, ya que el VAB agrícola es integrado de orden cero. 6 Tabla 1. Ecuaciones estimadas para cada sector según el modelo de indicadores. lnVABAG = 9.2727 + 0.3296*lnVI-0.3113*∆lnPAG-0.0759*D90+e14 (7.957) (2.271) (-1.293) (-2.047) R 2 = 0.272 D.W.=2.302 B-J=0.911 QB-P(1) = 1.43 QB-P(2) = 1.43 QB-P(3) = 1.55 QB-P(4) = 1.76 QL-B(1) = 1.62 QL-B(2) = 1.62 QL-B(3) = 1.77 QL-B(4) = 2.05 LMB-G(1) = 1.88 LMB-G(2) = 0.92 LMB-G(3) = 0.58 LMB-G(4) = 0.405 ∆lnVABIN = 0.1262*∆lnPVEH+0.7912*∆lnVABESP-0.8826*[lnVABIN(-1) ( 3.857) (2.662) (-4.128) +0.112*lnPIN-0.749lnVABESP(-1)-0.173lnPVEH(-1)]+e26 (11.71) (-57.14) (-10.25) 2 R = 0.978 D.W.=1.818 B-J=0.99 QB-P(1) = 0.05 QB-P(2) = 1.96 QB-P(3) = 2.16 QB-P(4) = 2.34 QL-B(1) = 0.05 QL-B(2) = 2.33 QL-B(3) = 2.59 QL-B(4) = 2.81 Tabla 1 (continua). Ecuaciones estimadas para cada sector según el modelo de indicadores. ∆lnVABCON = 0.349*∆lnOCON+0.380*∆lnCCIM+e37 (1.998) (2.777) 2 R = 0.702 D.W.=2.035 B-J=0.035 QB-P(1) = 0.11 QB-P(2) = 3.41 QB-P(3) = 4.72 QB-P(4) = 4.80 QL-B(1) = 0.13 QL-B(2) = 4.05 QL-B(3) = 5.69 QL-B(4) = 5.80 LMB-G(1) = 0.01 LMB-G(2) = 0.19 LMB-G(3) = 0.12 LMB-G(4) = 0.11 ∆lnVABSV = 0.011+0.630*∆lnVAB+0.156*∆lnOSV+e48 (3.974) (7.541) (3.804) 2 R = 0.842 D.W.=2.327 B-J=0.62 QB-P(1) = 1.54 QB-P(2) = 1.67 QB-P(3) = 1.74 QB-P(4) = 2.25 QL-B(1) = 1.81 QL-B(2) = 1.97 QL-B(3) = 2.07 QL-B(4) = 2.80 LMB-G(1) = 1.42 LMB-G(2) = 4.43 LMB-G(3) = 2.73 LMB-G(4) = 2.14 ∆lnVABSNV=0.054*∆lnISNV -0.170*[lnVABSNV(-1)-0.947*lnLLITS(-1)(2.155) (-3.088) (-14.41) 0.397*lnISNV(-1)]+e59 (-7.869) 2 R = 0.993 D.W.=1.885 B-J=0.77 QB-P(1) = 0.00 QB-P(2) = 1.03 QB-P(3) = 1.11 QB-P(4) = 3.32 QL-B(1) = 0.00 QL-B(2) = 1.29 QL-B(3) = 1.39 QL-B(4) = 4.55 4 VABAG es el VAB agrícola catalán, VI es la producción de vino en hectolitros en Cataluña, PAG es el deflactor de los precios agrarios españoles, y D90 es una variable fictícia incluída para recoger un cambio en el comportamiento de la producción de vino. 5 R2 representa el valor del coeficiente de determinación corregido por los grados de libertad del modelo, D.W. es el valor del estadístico de Durbin-Watson, B-J representa el estadístico de Bera-Jarque, QB-P representa el valor del contraste Q de autocorrelación serial de Box-Pierce de orden i, QL-B muestra el valor del contraste Q de autocorrelación serial de Ljung-Box, y LMB-G muestra el contraste de autocorrelación serial de los multiplicadores de Lagrange de Breusch-Godfrey. 6 VABIN es el VAB industrial catalán, PVEH es la producción de vehículos en Cataluña, PIN es el deflactor de los precios industriales españoles, y VABESP es el VAB total español. 7 VABCON es el VAB de la construcción catalán, OCON es la ocupación en el sector de la construcción en Cataluña, y CCIM es el consumo de cemento en Cataluña. Raymond y Matas (1991) obtienen un modelo similar para la especificación del modelo del sector de la construcción para Cataluña. 8 VABSV es el VAB de los servicios a la venta en Cataluña, MATUR es el número de vehículos matriculados en Cataluña, VAB es el VAB total catalán y OSV es el número de ocupados en el sector en Cataluña. 9 VABSNV es el VAB de los servicios no a la venta en Cataluña, ISNV es la inversión realizada en Cataluña en los servicios no a la venta, LLITS es el número de camas en funcionamiento en centros hospitalarios públicos. 7 Con la excepción del sector agrario, las demás ecuaciones presentan unos resultados de especificación aceptables, ya que los valores de la R2 corregida son elevados, y los de Durbin y Watson (D.W.) no se alejan del valor 2, además de que el contraste de Bera-Jarque (B-J) permite no rechazar que éstos se distribuyen según la normal. Los estadísticos de Box-Pierce (QB-P) y Ljung-Box (QL-B) permiten no rechazar la hipótesis de no autocorrelación para distintos órdenes, igual que los contrastes de multiplicadores de Lagrange de Breusch y Godfrey (LMBG). En todas las ecuaciones existen variables que no son significativas, pero su exclusión empeora las características del modelo determinado. Después de haber especificado las ecuaciones para cada sector se consideran las identidades contables en la tabla 2 para obtener finalmente los valores de los VAB sectoriales. Tabla 2. Identidades utilizadas VAB=VABAG+VABIN+VABCON+VABSV+VABSNV VABSER=VABSNV+VABSV En el momento en que se han determinado las ecuaciones del modelo se puede comprobar la capacidad predictiva del modelo en un entorno ex-post10. Para ello se estiman éstas sin considerar el valor para los dos últimos años y posteriormente se incluyen las variables de estos dos últimos años (1994 y 1995) para predecir el valor del VAB para estos años. A partir de aquí se mide su bondad predictiva a través de distintos estadísticos, como el error porcentual absoluto medio (EPAM), el error cuadrático medio porcentual (ECMP) y el coeficiente de desiguladad de Theil (U de Theil). El EPAM es un buen indicador de la bondad de la predicción, pero puede verse influido por cambios de escala en las variables, problema que se soluciona con el cálculo del ECMP. El estadístico U de Theil valora un posible error sistemático en la predicción. En todos los casos valores más cercanos a cero permitirán realizar una valoración positiva de la capacidad predictiva del modelo. Tabla 3. Estadísticos evaluadores de la capacidad predictiva del VAB sectorial SECTOR Agrícola Industrial Construcción Servicios venta Servicios no venta Total11 EPAM 8.784 2.070 2.299 0.828 3.969 0.766 ECMP 1.105 0.043 0.063 0.007 0.157 0.005 U de Theil 0.004691 0.000111 0.000170 0.000019 0.000379 0.000014 Tal como puede observarse en general los resultados de la predicción resultan aceptables exceptuando el caso del sector agrícola, donde las medidas de error son más elevadas. Ello no sorprende por las peores características que presenta la especificación de la ecuación de este sector. Por ello se ha optado por la estimación de todos los sectores sin considerar el sector agrícola para poder comprobar si existe algún cambio sustancial que aconseje prescindir de él en la predicción para mejorar los resultados del resto de sectores. Los estadísticos de bondad de predicción en este caso son los siguientes: 10 Es importante destacar el hecho de que se trata de una predicción realizada de forma ex-post. En este caso se conocen los valores de las variables exógenas de forma real. No obstante, en el momento de querer realizar la predicción para la economía en años futuros será necesario proceder también a la predicción de las exógenas. Por ello las medidas de bondad de la predicción del modelo resultan una primera aproximación a esta bondad, pero no se pueden considerar completas al no haber realizado las predicciones de las exógenas. 11 El VAB total se calcula como la suma de los VAB sectoriales 8 Tabla 4. Estadísticos evaluadores de la capacidad predictiva del VAB sectorial, sin considerar el VAB agrícola SECTOR Industrial Construcción Servicios venta Servicios no venta Total no agrario12 EPAM 2.097 2.357 0.631 3.888 0.784 ECMP 0.044 0.067 0.004 0.151 0.006 U de Theil 0.000111 0.000170 0.000011 0.000379 0.000158 Tal como puede apreciarse existen ligeras mejoras en los sectores de servicios venta y no venta, mientras que el resto de sectores empeora ligeramente. Por lo tanto no se considera necesaria la eliminación del VAB agrícola para conseguir mejores predicciones del resto de sectores, pero sí que se tendrá en cuenta que las predicciones de este sector resultan alejadas del valor real de la variable. 4.2. MODELO VAR El siguiente paso dentro del trabajo es el de estimar un modelo VAR para los distintos sectores de la economía catalana. La estimación de un modelo VAR permite establecer una relación entre las variables de forma que cada una de las variables incluídas en éste dependa de retardos del resto de ellas, por lo que a la vez que se estima la variable de interés también se estima la evolución de otras que influyen y a la vez son influídas por ella, lo que hace que las variables participantes en el modelo sean consideradas como endógenas. De todas formas, es posible incluir variables exógenas cuando éstas influyen en la variable de interés y, en cambio, no existe esta influencia desde la variable de interés hacia dichas exógenas. Un ejemplo muy claro se podría encontrar en el caso de una variable regional que se afectada de forma importante por el comportamiento de una nacional, y al revés no sucede lo mismo. Un aspecto a considerar dentro del modelo VAR es el número de retardos que se incluyen en cada ecuación. Se trata de una cuestión importante, ya que cuando es necesario incluir un número alto de retardos dentro del modelo puede dar problemas de sobreespecificación, además de que resulta problemático cuando el número de observaciones disponible es pequeño. Existen diversos métodos que se pueden aplicar para determinar los retardos dentro de un modelo VAR, entre los que se encuentran los utilizados en este trabajo, que son los denominados criterios de AIC (Criterio de Información de Akaike) y de SC (Criterio de Schwartz). Se trata de estimar el modelo VAR para cada número de retardos que se cree que pueden tener las variables en éste (y que sea factible). El modelo que presente un valor de estos dos criterios más bajo será el que será elegido, considerando entonces su número de retardos. Los modelos VAR utilizados para estimar el VAB sectorial incluyen las variables y los retardos incluídos en la tabla 5. Se ha procurado que se de entre las variables causalidad en el sentido de Granger. Se trata de un hecho importante, ya que la causalidad en el sentido de Granger implica que una variable se predice mejor usando valores retardados de ambas variables que si sólo se usan valores retardados de la variable de interés. Por ello, la inclusión de información entre la cual se da causalidad en el sentido de Granger permite mejorar las predicciones en el modelo VAR. En la tabla 5 también se incluyen diversos estadísticos relacionados con las propiedades del modelo VAR estimado, como son el logaritmo de la función de verosimilitud y los criterios AIC y SC. 12 El VAB total no agrícola se calcula como la suma de los VAB sectoriales exceptuando el agrícola. 9 Tabla 5. Variables incluídas en los modelos VAR sectoriales y número de retardos lnVABIN lnVABCON lnVABSV lnVABSNV lnLOCIN lnLPIN D845 lnVABESP13 (4) lnV=188.47 AIC=-21.78 SC=-19.71 C lnOCON lnICON (1)14 lnV=78.52 AIC=-11.84 SC=-11.25 lnVAB lnOSV (3)15 lnV=164.09 AIC=-25.09 SC=-23.86 lnOSNV lnISNV (3)16 lnV=128.16 AIC=-19.96 SC=-18.73 Tal como se puede observar, no se realiza estimación del sector agrícola, dada la dificultad existente para encontrar un modelo adecuado para predecir la actividad agrícola a nivel catalán. Para el resto de sectores, en cuanto se han obtenido sus modelos se procede a analizar su capacidad predictiva de forma ex-post, igual que se ha hecho con los modelos de indicadores. Para ello se eliminan de la serie de variables los valores para los dos últimos años (1994 y 1995) en el momento de estimar los modelos, y se procede posteriormente a su predicción. La predicción del VAB total no agrícola se considera como la suma de los valores predichos en el resto de sectores. Los estadísticos que valoran la capacidad predictiva de los modelos se muestran en la tabla 6. Tabla 6. Estadísticos evaluadores de la capacidad predictiva del VAB sectorial, sin considerar el VAB agrícola17 SECTOR Industrial Construcción Servicios venta Servicios no venta Total EPAM 1.036 1.884 4.238 2.499 0.336 ECMP 0.017 0.044 0.187 0.064 0.001 U de Theil 0.0000838 0.0009992 0.0009945 0.0003171 0.0000058 Los resultados valoran de forma favorable las predicciones realizadas con los modelos VAR especificados, siendo el sector de servicios a la venta el que presenta unos resultados algo peores a los demás. 5. CONCLUSIONES El objetivo final del trabajo es proceder a una primera evaluación de la bondad de la predicción entre distintas metodologías aplicadas. Pero se debe destacar que, mientras que la metodología presentada en el punto 4.2 puede considerarse tanto para predicciones ex-post 13 VABIN es el VAB industrial catalán, OCIN es la ocupación industrial en Cataluña, PIN es el deflactor de los precios industriales en España y VABESP es el VAB total español. Esta última variable se incluye de forma exógena, ya que se considera que la influencia del VAB industrial catalán sobre ella resulta mucho menor que la que pueda tener el VAB español total sobre el VAB industrial catalán. Lo mismo sucede con la variable D845, ya que se trata de una ficticia que pretende corregir posibles discontinuidades en la estimación de los precios. 14 VABCON es el VAB del sector de la construcción en Cataluña, OCON es la ocupación en el sector de la construcción en Cataluña y ICON es la inversión en el mismo sector para Cataluña. 15 VABSV es el VAB del sector servicios a la venta en Cataluña, VAB es el VAB total catalán, y OSV es la ocupación en el sector en Cataluña. 16 VABSNV es el VAB del sector servicios no a la venta en Cataluña, OSNV es la ocupación del sector en Cataluña y ISNV es la inversión del sector en Cataluña. 17 Al utilizar modelos VAR para predecir los valores de VAB sectorial también se obtienen predicciones del resto de variables endógenas que se utilizan. Pero, dado que el objetivo de este trabajo es el de comparar predicciones de VAB no se han considerado estos resultados. 10 como para predicciones ex-ante, la metodología presentada en el punto 4.1 sólo puede considerarse para evaluación de predicciones ex-post, ya que no se ha analizado la problemática de la predicción de las exógenas. Ello puede llevar a presentar la cuestión del sentido que puede tener el estudio de la predicción ex-post, ya que lo que resulta interesante de la predicción es precisamente poder realizarla antes de que se de la situación económica en el tiempo. Pero, este primer análisis de forma ex-post permite pasar un primer filtro que permita determinar la bondad del modelo ya que, si los estadísticos de bondad de predicción no ofrecen un resultado aceptable no se considerará la posibilidad de continuar con el modelo para encontrar la forma de predecir las exógenas y así utilizarlas en la predicción ex-ante. Los resultados obtenidos en estos estadísticos permiten, para este caso, continuar en su análisis para poder realizar estas predicciones ex-ante. En lo referente a la predicción con el modelo VAR, se ha observado que los estadísticos de medida de la bondad de la predicción presentan un buen resultado de éste. Pero, de todas formas, se puede considerar ésta como una primera aproximación a la predicción con modelos VAR, ya que existen ecuaciones con un número importante de variables que pueden llevar a problemas dados por la sobreespecificación. Otro aspecto a considerar en el momento de evaluar los modelos descritos en este trabajo es el de la longitud de las series utilizadas, con poco más de veinte observaciones. Una mejora del análisis realizado se encuentra en el hecho de poder utilizar series más largas que permitan trabajar con un número mayor de grados de libertad y por lo tanto incluir más variables que puedan mejorar las estimaciones. En este sentido se prevee la aparición durante el verano del 2000 de los datos definitivos de las variables regionales que da la Contabilidad Regional para los años 1995 y 1996, los datos provisionales para los años 1997 y 1998, y el avance para el 1999. Ello permitirá introducir mejoras en el presente estudio, y también, en el momento de realizar el análisis de la bondad de las predicciones, utilizar datos más recientes que los ya lejanos de 1994 y 1995. 6. BIBLIOGRAFIA Allen et al. (1994), The new London Business School model of the UK economy. Centre for Economic Forecasting. London Business School. Discussion Paper n.DP18-94. Artís et al. (1997), Metodologia per a l’anàlisi de les previsions econòmiques en l’àmbit regional: una aplicació al cas de Catalunya. Generalitat de Catalunya, Departament d’Economia i Finances, DG de Programació Econòmica, Barcelona. Aznar (1997), ¿Se puede predecir en economía? Cuadernos Económicos Escuela y Despensa, Universidad de Zaragoza. Crone et al. (1999), The Philadelphia story: a new forecasting model for the region. Federal Reserve of Philadelphia Business Review, Sept/Oct. DeBenedictis, L.F. (1997), “A VAR model of the British Columbia regional economy”. Applied economics, n.29. Jacobs et al. (1996), VAR-ing the economy of The Netherlands. CCSO Series n.24. Lütkepohl (1991), Introduction to multiple time series analysis. Springer, Berlin. 11 Márquez, M.A. (1998), Modelización estadístico-econométrica regional: el caso de la economía extremeña. Tesis doctoral. Facultad de Ciencias Económicas y Empresariales, Universidad de Extremadura. Ramos et al. (2000), “Comparación de la capacidad predictiva de los modelos de coeficientes fijos frente a variables en los modelos econométricos regionales: un análisis para Cataluña”. Estudios de Economía Aplicada (en prensa) Raymond y Matas (1992), “Avaluació del creixement del Producte Interior Brut a Catalunya l’any 1991”. Nota d’Economia, nº43 Rey, S. (1998), “The performance of alternative integration strategies for combining regional econometric and input-output models”. International Regional Science Review, vol. 21, n.1. Serrano, G. (1995), Modelización Regional: una aplicación a la economía valenciana. Documento de Trabajo, Departamento de Análisis Económico Universidad de Valencia. Trívez y Mur (1994), “El modelo econométrico regional sectorial Hispalink Aragón”. Cuadernos Aragoneses de Economía (2ª época), vol.4, nº2, 1994. Whitley (1994), A course in macroeconomic modelling and forecasting. Haverster Wheatsheaf, London. 12