ESTADÍSTICA ESPAÑOLA Vol. 50, Núm. 167, 2008, págs. 5 a 24 Evolución espacio-temporal del mercado inmobiliario en Zaragoza mediante el uso de efectos de vecindad por Mª ASUNCIÓN BEAMONTE, PILAR GARGALLO Departamento de Estructura Económica, Historia Económica y Economía Pública Escuela Universitaria de Estudios Empresariales de Zaragoza MANUEL SALVADOR Departamento de Estructura Económica, Historia Económica y Economía Pública Facultad de Ciencias Económicas y Empresariales de Zaragoza RESUMEN En este trabajo se propone un modelo espacio-temporal autorregresivo (STAR) que utiliza efectos de vecindad con el fin de estudiar la evolución del mercado inmobiliario en un área concreta de la ciudad de Zaragoza. El modelo recoge, por una parte, la influencia de características estructurales de los inmuebles, tradicionalmente capturadas con un modelo hedónico de precios, y, por otra, permite incorporar efectos temporales y de localización de una manera flexible y realista. Además, su estimación está basada en procedimientos MCO por lo que su coste computacional no es excesivamente alto. Palabras Clave: Modelos STAR, Modelo Hedónico de Precios, Mercado Inmobiliario, Efectos de Vecindad. Clasificación AMS: 91B72, 91B24, 91B82. 6 1 ESTADÍSTICA ESPAÑOLA INTRODUCCIÓN La evolución del mercado inmobiliario español constituye un objeto de estudio de extraordinario interés tanto desde un punto de vista práctico como académico. La marcada importancia del sector de la construcción en la economía española, el elevado nivel de endeudamiento de las familias que dedican un gran porcentaje de sus presupuestos a la compra de una vivienda, así como el riesgo bancario debido al creciente número de créditos hipotecarios concedidos con unas cuantías cada vez más elevadas, son algunas de las razones que justifican dicho interés. Desde un punto de vista estadístico-económico el modelo tradicionalmente utilizado para analizar la evolución de los precios de vivienda es el método hedónico. Dicho método fue propuesto inicialmente por Haas (1922) para analizar precios de parcelas agrícolas y por Court (1939) para el análisis de la evolución de los precios de los automóviles (ver, Colwell y Dilmore, 1999). Posteriormente, fue fundamentado teóricamente por Rosen (1974) desde un punto de vista económico. El método hedónico establece que el precio de un bien es función de sus características y utiliza técnicas de regresión para estimar dicha función. En el caso particular del mercado inmobiliario la variable dependiente es el precio de la vivienda o alguna transformación suya (habitualmente el logaritmo con el fin de aumentar el grado de normalidad y homocedasticidad de los términos de error del modelo) y como variables independientes aquellas características de la misma que se consideran más relevantes para describir la variación de precios observada (Ridker y Henning, 1967; Li y Brown, 1980; Dubin y Sung, 1990, Basu y Thiboudeau, 1998). Dichas características suelen estar relacionadas con aspectos estructurales de la vivienda (tamaño, antigüedad, tipo de vivienda, calefacción, ascensor, garaje, trastero, aire acondicionado, número de cuartos de baño, exterior, planta, orientación, piscina comunitaria, etc.) o con su localización (distancia al centro, a colegios, guarderías, estaciones de metro y autobús, supermercados, niveles de contaminación de la zona, nivel socio-económico de los vecinos del inmueble, etc). El método hedónico es, en particular, muy utilizado para la elaboración de números índices que describan la evolución espacio-temporal de los precios de la vivienda (ver, por ejemplo, Bailey y otros (1963) o David y otros (2002)). Ello es debido a su capacidad para separar la evolución de la calidad de las viviendas, de la evolución de los precios de las mismas. Sin embargo, en la mayor parte de las ocasiones, no se dispone de información acerca de todas las características espacio-temporales relevantes para el problema. Por dicha razón, se suele observar la presencia de correlaciones espacio-temporales EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 7 en los residuos de los modelos. Para tratar este tipo de problemas se introducen efectos espaciales en la estructura del error (Can, 1990; Dubin, 1988, 1992, 1998; Basu y Thibodeau, 1998; Pace y Gilley, 1998) o, más generalmente, efectos aleatorios (Gelfand y otros, 1998) así como variables temporales dummy como proxy para medir la influencia de factores dinámicos de tipo económico, político, sociológico, etc en la evolución de dichos precios (Gelfand y otros, 2004). Estas formas de tratamiento del problema suelen ser, sin embargo, computacionalmente muy costosas y difíciles de manejar a la hora de realizar predicciones extramuestrales. Recientemente, sin embargo, Pace y otros (1998, 2000) han desarrollado una metodología basada en modelos autorregresivos espacio-temporales (STAR) que permite capturar una gran cantidad de efectos de carácter local y cuya estimación no es computacionalmente muy costosa al estar basada en procedimientos MCO. En este trabajo proponemos una modificación de dicha metodología que reduce el número de parámetros del modelo, consiguiendo una mayor parsimonia e inteligibilidad de los resultados obtenidos. Dicha metodología se aplica al análisis de la evolución del precio de la vivienda en un área concreta de la ciudad de Zaragoza. El plan del trabajo es como sigue: en la sección 2 se describe el modelo utilizado para analizar la evolución del mercado inmobiliario; en la sección 3 se describen los datos y las variables utilizadas mostrando los resultados obtenidos. Finalmente, la sección 4 presenta las conclusiones más relevantes y las futuras líneas de trabajo. 2. METODOLOGÍA ESTADÍSTICA Sea Y(nx1) = (yi; i=1,…,n) el vector de observaciones de la variable dependiente donde yi = log(pi) siendo pi el precio escriturado de la i-ésima transacción de vivienda observada en un periodo de tiempo determinado, estando dichas transacciones ordenadas de acuerdo con la fecha en la que se produjeron de forma que p1 corresponde a la transacción más antigua, p2 a la segunda más antigua, …, y pn a la transacción más reciente en el tiempo. Para explicar dicha evolución se observan, además, los valores de k variables explicativas X1,…, Xk relacionadas con características estructurales de la vivienda transaccionada así como con su localización y externalidades de la misma que nos permitan explicar el valor del precio observado así como la predicción de precios de viviendas de características similares puestas a la venta. Supondremos, sin pérdida de generalidad, que X1 = 1. 8 ESTADÍSTICA ESPAÑOLA El modelo utilizado es una modificación del modelo espacio-temporal autorregresivo (STAR) propuesto por Pace y otros (2000) y viene dado por la siguiente expresión: Y=Xβ+ φTX T(Y-Xβ) + φ SX S(Y-Xβ) + φ TSX TS(Y-Xβ)+ φ STX ST(Y-Xβ)+φT TY +φ SSY+ φST STY + φ TS TSY + ε donde: – X(nxk) es la matriz de las observaciones correspondientes a las variables independientes que ejercen algún efecto de carácter espacio-temporal siendo β(kx1) el vector de coeficientes de regresión que determinan el tipo de efecto ejercido – S(nxn) es la matriz que especifica las relaciones espaciales entre las transacciones observadas – T(nxn) es la matriz que especifica las relaciones temporales entre dichas transaccio- nes. – −1 < φi < 1 i ε {TX, SX, TSX, STX, T, S, TS, ST} son los coeficientes autorregresivos del modelo que determinan el efecto ejercido por las características y los precios de transacciones previas a la observada, cercanas en el espacio y/o en el tiempo. – ε ~ Nn (0, σ2 In) Las matrices S y T son triangulares inferiores (es decir, verifican que j ≥ i ↔ Sij = 0 y Tij = 0) con el fin de que las influencias espacio-temporales se ejerciten desde el pasado hasta el presente. Dichas matrices son, además, estocásticas por filas verificando que S1n = 1n y T1n = 1n (1n denota el vector de n unos) y Sij ≥ 0, Tij ≥ 0; i,j=1,..,n lo cual les dota de un carácter de filtros lineales (Davidson y MacKinnon, 1993) que facilita la interpretación de los resultados obtenidos. Las matrices TS y ST son, a su vez, triangulares inferiores y permiten la modelización de efectos espacio-temporales compuestos. De esta forma los términos X β recogen la influencia que las características de la vivienda y su localización ejercen en su precio de transacción. Los términos φTXT(YXβ) y φTTY recogen la influencia de las tendencias temporales del mercado medidas a través de las características y del precio de las viviendas cuyas transacciones tuvieron lugar previamente en el tiempo. Por su parte, los términos φSXS(Y-Xβ) y φSSY recogen la influencia del entorno espacial de la vivienda medida mediante las características y los precios de las transacciones correspondientes a las viviendas más cercanas. El resto de los términos modelan posibles interacciones de los efectos anteriores. EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 9 Las matrices S de efectos espaciales vienen dadas por expresiones de la forma: mS ∑λ S S= l =1 mS l l ∑λ l l =1 ( ) donde Sl = sijl de forma que s ijl = 1 si la transacción j-ésima es la l-ésima más cercana espacialmente a la transacción i-ésima y 0 en otro caso. Los elementos S por lo tanto, sólo toman valores no nulos para las mS transacciones previas más cercanas espacialmente a una dada y les asigna un peso proporcional a λl. Por su parte, la matriz T de efectos temporales utiliza las mT transacciones previas a una dada de forma que: i ≥ j ≥ (i-mT) ↔ Tij = 1 mT La estimación de los parámetros del modelo se realiza por el método de máximaverosimilitud, el cual no resulta muy complicado al coincidir con la estimación mínimo-cuadrática ordinaria (ver Pace y otros (1998, 2000)). La función de verosimilitud toma como dadas de antemano las n0 primeras transacciones puesto que no disponen de un número apropiado de vecinos previos ni en el espacio ni en el tiempo, evitando así su influencia en el proceso de estimación. 3. APLICACIÓN AL MERCADO INMOBILIARIO ZARAGOZANO En esta sección se aplica el modelo descrito anteriormente al análisis del mercado inmobiliario de Zaragoza. 3.1 Descripción de la Base de Datos Los datos analizados corresponden a una muestra de 788 transacciones de vivienda llevadas a cabo entre noviembre de 2002 y diciembre de 2004 en la zona que compete al Registro de la Propiedad número 5 de Zaragoza (ver Figura 1). La parte noroeste del área considerada es el centro económico (no histórico) de la ciudad con la presencia de los inmuebles de valor más elevado. Conforme nos desplazamos hacia el sur y hacia el este en el mapa, nos aproximamos a zonas periféricas, incluso en algún caso de extrarradio de la ciudad, con viviendas de muy baja calidad. 10 ESTADÍSTICA ESPAÑOLA Figura 1 LOCALIZACIÓN DENTRO DE ZARAGOZA DE LAS TRANSACCIONES DE LA BASE DE DATOS La información utilizada procede de las siguientes entidades administrativas oficiales: Oficina Regional del Catastro, Instituto Aragonés de Estadística, Gerencia de Urbanismo del Ayuntamiento de Zaragoza y Colegio de Registradores de la Propiedad, Bienes Muebles y Mercantiles de España. La Oficina Regional del Catastro proporcionó la antigüedad del edificio y la superficie de los inmuebles. El Instituto Aragonés de Estadística cedió la información procedente del censo de viviendas del año 2001 de las características propias de cada inmueble (número de habitaciones, tipo de calefacción y refrigeración), del edificio en el que se encontraba (accesibilidad, tipo de portero, entrada de gas, agua caliente central, garaje y número de plazas), así como variables de percepción subjetiva de los moradores sobre el entorno próximo a la vivienda (ruidos exteriores, delincuencia, limpieza, contaminación, zonas verdes). La sección de Urbanismo del Ayuntamiento de Zaragoza proporcionó las coordenadas UTM para la localización geográfica de los inmuebles. Finalmente, la información del Colegio de Registradores de la Propiedad, Bienes Muebles y Mercantiles de España recogía los movimientos en la titularidad de los inmuebles, así como el precio escriturado, el tipo de adquisición y si la vivienda era de protección oficial. EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 11 Los datos fueron depurados eliminando todos los registros que no presentaban información de las variables objetivas consideradas en el trabajo, todos aquellos inmuebles situados bajo rasante y dedicados a actividades no residenciales así como las transacciones cuyos precios eran anormalmente altos o bajos de acuerdo con los límites para España publicados en la Estadística Registral Inmobiliaria. Anuario de 2004. En las Tablas 1, 2 y 3 se muestran las características de las viviendas analizadas. Se observa, en particular, que para un 28% de los casos (221 transacciones) no se dispone de información acerca de algunas de las características cualitativas y cuantitativas de la vivienda. Con el fin de analizar la existencia de posibles sesgos incluimos en el estudio una variable indicadora de dichos casos como variable independiente del modelo. Tabla 1 CARACTERÍSTICAS CUANTITATIVAS DE LAS VIVIENDAS ANALIZADAS Nº Casos Mínimo Máximo Media Desviación Típica Precio (Euros) 788 3.125,26 601.012,1 121.336,82 73.540,28 Superficie útil 788 27 490 77.19 32,57 Antigüedad 788 0,83 91,71 34,25 13,02 Nº habitaciones(*) 567 2 9 4.61 1,02 (*) Excluyendo la cocina y baños 12 ESTADÍSTICA ESPAÑOLA Tabla 2 CARACTERÍSTICAS CUALITATIVAS DE LAS VIVIENDAS ANALIZADAS (%) VPO Adquisición Refrigeración Calefación Accesibilidad Portero Libre 57,9 Protegida 42,1 Compraventa 75,3 Herencia 17,5 7,2 Si 15,7 No 56,2 NS/NC Colectiva 23,2 Individual 26,8 Aparatos NS/NC 22,0 28,0 Total 100 Otros títulos 100 100 28,0 Con ascensor 56,3 Sin ascensor 43,7 Automático 74,9 Ambos 19,8 100 100 Ninguno 5,3 100 Si No Garaje en el edificio 16,8 83,2 100 Entrada de gas 58,8 41,2 100 Agua caliente central 31,1 68,9 100 Tabla 3 EXTERNALIDADES SUBJETIVAS DE LAS VVIENDAS ANALIZADAS. (%) SI NO NS/NC Total Ruido Exterior 23,7 48,2 28 100 Contaminación 15,5 56,5 28 100 Zonas Verdes 55,2 16,8 28 100 Delincuencia 17,8 54,2 28 100 Limpieza Calles 54,4 17,5 28 100 3.2 Resultados En la Figura 2 se muestran las autocorrelaciones espaciales de las transacciones analizadas junto con las bandas de confianza del 95% suponiendo ruido blanco. Se observa la existencia de autocorrelaciones positivas significativas sobre todo en los primeros retardos que reflejan la existencia de dependencias espacio-temporales en la determinación del precio de cada transacción. EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 13 Figura 2 AUTOCORRELACIONES ESPACIALES El modelo hedónico tradicional ignora las dependencias espaciales y temporales presentes en los datos, ya que expresa el precio de una vivienda únicamente en función de sus características estructurales y su localización. Con el fin de capturar dichas dependencias proponemos utilizar el modelo STAR presentado en la Sección 2, tomando como variables independientes las coordenadas UTM de la vivienda, así como las características mostradas en las Tablas 1 a 3. Con el fin de evitar problemas de identificabilidad, las variables categóricas no binarias se incorporan en el modelo utilizando una codificación tipo indicador, tomando como categoría de referencia la clase modal. Los valores de los parámetros mS, mT y λ se estiman utilizando un proceso de búsqueda tomando como criterio de selección de modelos el criterio BIC. Todos los resultados expuestos en el trabajo fueron obtenidos utilizando el programa MATLAB 6.5. El proceso de búsqueda se realizó para mS, mT∈{5,10,15,…,35} y λ∈{0.5, 0.55, ..., 0.95, 1}. El valor máximo de mS se determinó analizando el correlograma espacial de la Figura 2 en el que se aprecia la posible existencia de correlaciones significativas hasta un número alrededor de 35 vecinos. Por su parte mT = 35 corresponde a un mes de transacciones, aproximadamente. Por último, la red de valores de λ es la misma que la considerada en Pace y otros (2000). Tal y como se ha comentado en la sección 3.1 la estimación de los parámetros del modelo se realizó condicionando a las n0 = 163 primeras observaciones (hasta el 31 de Marzo de 2003). Los valores óptimos correspondieron a mS = 20 (20 transac- 14 ESTADÍSTICA ESPAÑOLA ciones más cercanas en espacio), mT = 5 (5 transacciones más cercanas en tiempo) y λ = 1. Con fines comparativos, se estimó también el modelo hedónico tradicional que corresponde a los valores mS = mT = 0. En la Tabla 4 se muestran las estimaciones de los parámetros de la parte hedónica de ambos modelos. Así mismo, y dado el alto número de variables explicativas del modelo, se aplicó un proceso de selección de variables tipo step-wise. Las estimaciones de los coeficientes de este modelo aparecen en las dos últimas columnas de las Tablas 4 y 5 bajo el título modelo STAR simplificado. Se observa que, en general, los valores y signos de los coeficientes de las variables explicativas más influyentes se mantienen en los 3 modelos analizados sin que se aprecien diferencias significativas entre los modelos STAR y STAR simplificado. Tabla 4 ESTIMACIONES DE LOS PARÁMETROS DE REGRESIÓN DE LOS MODELOS HEDÓNICO, STAR Y STAR SIMPLIFICADO(*) (Continúa) Modelos Hedónico STAR Beta t-estadístico Beta t-estadístico Constante 9,1410 31,0099 2,6334 0,7118 UTM (coord. X) -0,0003 -2,4598 -0,0002 -2,3095 UTM (coord. Y) 0,0001 1,5717 0,0001 1,0042 Log(superficie) 0,7721 11,7987 0,7179 Log(antigüedad) -0,2179 -7,5498 VPO 0,0022 0,0565 Herencia -0,5037 Otros títulos -0,3551 Variables STAR simplificado Beta t-estadístico -0,0004 -5,3003 10,1148 0,6963 13,8734 -0,1207 -3,7012 -0,1045 -5,0342 -0,0187 -0,4660 -10,1740 -0,4288 -6,8608 -0,4120 -8,9717 -4,9884 -0,3266 -5,0495 -0,3016 -4,9715 Ruidos exteriores 0,1037 2,1639 0,0628 1,2704 Contaminación -0,0016 -0,0291 -0,0121 -0,2099 Zonas verdes -0,0669 -1,3393 -0,0323 -0,5954 Delincuencia 0,0271 0,5323 0,0120 0,2281 Refrigeración -0,0010 -0,0193 -0,0150 -0,2721 Calefacción colectiva 0,1629 2,7693 0,1192 1,8641 (*) En negrita los significativos al 5%. La estimación de los parámetros se ha llevado a cabo por MCO tal y como describen Pace y otros (1998, 2000). Los errores estándar fueron calculados mediante el método delta. EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 15 Tabla 4 ESTIMACIONES DE LOS PARÁMETROS DE REGRESIÓN DE LOS MODELOS HEDÓNICO, STAR Y STAR SIMPLIFICADO(*) (Conclusión) Modelos Variables Otros aparatos Hedónico STAR Beta t-estadístico Beta t-estadístico 0,0503 0,9788 0,0635 1,2028 < 4 habitaciones 0,0518 0,6996 0,0600 0,7036 4 habitaciones -0,0297 -0,6084 0,0069 0,1386 > 5 habitaciones 0,0290 0,4046 0,0011 0,0160 Ascensor 0,0808 1,4534 0,0765 1,3064 Portero ambos 0,0926 1,6312 0,0683 1,1185 Ningún portero -0,1927 -2,2965 -0,1817 -2,7635 Garaje -0,0917 -1,6409 -0,1012 -1,9369 Gas -0,0182 -0,4826 -0,0133 -0,3394 Agua caliente central 0,0092 0,2018 -0,0159 -0,3660 Limpieza calles 0,0035 0,0688 0,0086 0,1590 Indicador missing -0,0886 -1,0643 -0,0514 -0,5629 σ 0,4384 0,4193 STAR simplificado Beta t-estadístico -0,2122 -3,4812 0,4296 (*) En negrita los significativos al 5%. La estimación de los parámetros se ha llevado a cabo por MCO tal y como describen Pace y otros (1998, 2000). Los errores estándar fueron calculados mediante el método delta. Las variables que ejercen influencia significativa en el modelo STAR son: la coordenada X (UTM), el logaritmo de la superficie, el logaritmo de la antigüedad, el tipo de adquisición y la ausencia de portería. La coordenada X (UTM) presenta un efecto negativo significativo, reflejando el hecho de que al alejarse del centro de la ciudad en el sentido Oeste-Este el inmueble se va situando en barrios periféricos de características socio-económicas menos privilegiadas y, por tanto, con un precio inferior. Con respecto a la superficie de los inmuebles y a la antigüedad del edificio los signos son los esperados: positivo para la primera variable, indicando que a mayor superficie mayor precio y negativo para la segunda, reflejando la penalización que tiene en el precio la edad del edificio. Conviene hacer notar que, al estar estas variables en logaritmos, sus coeficientes se interpretan como elasticidades. Así, un incremento de la superficie de un 1% incrementaría el precio de la vivienda en torno a un 0,7% y un incremento de la antigüedad del 1% disminuiría dicho precio en torno a un 0,1%. El hecho de que el tipo de adquisición no sea una compraventa (herencias, donaciones, etc.) ejerce una influencia negativa sobre el precio debido a la necesidad de imputar un valor a la vivienda con el único fin del pago de impuestos. Más concreta- 16 ESTADÍSTICA ESPAÑOLA mente si el tipo de adquisición es una herencia el precio escriturado de la vivienda tiende a ser alrededor de un 40% menor y en el caso de otros títulos de adquisición (donaciones fundamentalmente) esta disminución se cifraría en torno a un 30%. Finalmente, la falta de cualquier tipo de portero en la vivienda (conserje, portero automático…) tiene un efecto claramente negativo sobre el precio del inmueble cifrándose en algo más de un 20% la disminución sobre el precio escriturado debido, muy probablemente, a la baja calidad de este tipo de inmuebles. Se observa, además, que las estimaciones de los coeficientes de regresión de ambos modelos son similares con una gran concordancia en el signo de las mismas. En la Tabla 5 se muestran las estimaciones de los parámetros del modelo STAR que recogen las dependencias espacio-temporales no explicadas por el modelo hedónico. Se observa que los coeficientes φT y φS son significativamente positivos poniendo de manifiesto la existencia de tendencias locales crecientes de carácter temporal y espacial no capturadas por la parte hedónica del modelo. Dichas tendencias pueden ser el reflejo de la influencia de variables omitidas y/o de la posible existencia de una burbuja de precios. Conviene hacer notar que el valor estimado de mT = 5 (ver Tabla 6) es un valor muy bajo debido al rápido movimiento de los precios en el periodo de tiempo considerado. Por otro lado para capturar las tendencias espaciales se necesita un número mayor de vecinos, mS = 20, que además reciben un mismo peso, λ = 1 , en su determinación (ver Tabla 6) debido, muy probablemente, al alto grado de homogeneidad del área considerada. Tabla 5 ESTIMACIÓN DE LOS PARÁMETROS ESPACIO-TEMPORALES DEL MODELO STAR Y STAR SIMPLIFICADO(*) Modelos STAR STAR simplificado Coeficiente t-estadístico ΦTX ΦSX 0,0028 -0,0021 1,2030 -0,8289 Coeficiente t-estadístico ΦTSX -0,0022 -0,4584 ΦSTX 0,0065 0,8393 2,1380 0,1830 3,2207 0,6047 9,6575 ΦT 0,1745 ΦS 0,6245 3,7235 ΦTS 0,2441 0,9436 ΦST 0,2388 1,6357 (*) En negrita los significativos al 5% EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 17 3.3 Bondad de ajuste del modelo y comparación de modelos En esta sección se comparan los modelos considerados en el trabajo, analizando su bondad de ajuste y su comportamiento predictivo extramuestral. En la Tabla 6 se analiza el comportamiento de los residuos de dichos modelos. Se observa que los modelos STAR se ajustan mejor a los datos que el modelo hedónico tradicional, tanto en términos de los coeficientes de determinación múltiple de los precios y del logaritmo de los precios, del criterio BIC o aplicando el test de razón de verosimilitudes. Además, los residuos de los modelos STAR tienden a estar más concentrados en torno a cero, fruto de un seguimiento más ajustado a la evolución observada de los precios de las transacciones analizadas en el trabajo. Así mismo, analizando la autocorrelación residual (ver Figura 3), se observa que el modelo STAR captura de forma adecuada las dependencias residuales espaciales. 18 ESTADÍSTICA ESPAÑOLA Tabla 6 COMPARACIÓN DE MODELOS(*) (Continúa) Modelos ERRORES INTRAMUESTRALES Hedónico STAR STAR simplificado Mínimo -3,3129 -3,3465 -3,4647 1% -1,3307 -1,3379 -1,3818 5% -0,7336 -0,7511 -0,7309 10% -0,4659 -0,4482 -0,4601 25% -0,2004 -0,1842 -0,1684 50% 0,0398 0,0291 0,0473 75% 0,2693 0,2594 0,2544 90% 0,4435 0,3941 0,4022 95% 0,5843 0,4839 0,5423 99% 0,8796 0,8589 0,9014 Máximo 1,1542 1,0699 1,0745 Media 0,0000 -0,0170 -0,0003 RMSE 0,4388 0,4193 0,4299 Mediana |e| 0,3085 0,2897 0,2938 MAD 0,2423 0,2184 0,2109 N 626 626 626 λ 0 1,0 1,0 mT 0 5 5 mS 0 20 20 -2*LLF/LPRED -1.030,7 -1.086,6 -1.056,2 BIC R2 log-precio -396,27 -433,84 -502,33 0,4486 0,4957 0,4706 R2 precio 0,5539 0,6027 0,5805 99,52 99,52 99,52 99,68 99,68 99,84 CUB95 CUB99 (*) La Tabla muestra los percentiles de las distribuciones de los errores de predicción intra y extramuestrales así como los valores de diversos criterios de ajuste: RMSE (raíz del error cuadrático medio), MAD (desviación absoluta media), LLF (valor de la logverosimilitud), LPRED (logaritmo de la densidad predictiva extramuestral), BIC (criterio de 2 2 Schwarz), R precio (coeficiente de determinación ajustado a los precios), R log-precio (coeficiente de determinación ajustado a los log-precios) y CUB95, CUB99 (% de residuos comprendidos en los intervalos del 95% y 99% suponiendo normalidad) EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 19 Tabla 6 COMPARACIÓN DE MODELOS(*) (Conclusión) Modelos ERRORES EXTRAMUESTRALES Hedónico STAR STAR simplificado Mínimo 1% 5% 10% 25% 50% 75% 90% 95% 99% Máximo Media RMSE Mediana |e| MAD N -1,6497 -1,5586 -1,5055 -1,1926 -1,2613 -1,1543 -0,5845 -0,6117 -0,7013 -0,3555 -0,3866 -0,3694 -0,0258 -0,0849 -0,0277 0,1913 0,0841 0,1297 0,3472 0,3218 0,2893 0,5176 0,4330 0,3979 0,6149 0,4811 0,5011 0,6880 0,5641 0,6872 0,7209 0,5736 0,7552 0,1203 0,0554 0,0701 0,3691 0,3562 0,3514 0,3002 0,2718 0,2730 0,2512 0,2527 0,2579 133 133 133 λ 0 1,0 1,0 mT mS -2*LLF/LPRED BIC R2 log-precio R2 precio 0 5 5 0 20 20 -63,59 -54,50 -56,41 0,4553 0,5307 0,5363 0,6742 0,6888 0,7254 98,49 97,74 96,99 99,25 98,50 99,25 CUB95 CUB99 (*) La Tabla muestra los percentiles de las distribuciones de los errores de predicción intra y extramuestrales así como los valores de diversos criterios de ajuste: RMSE (raíz del error cuadrático medio), MAD (desviación absoluta media), LLF (valor de la logverosimilitud), LPRED (logaritmo de la densidad predictiva extramuestral), BIC (criterio de 2 2 Schwarz), R precio (coeficiente de determinación ajustado a los precios), R log-precio (coeficiente de determinación ajustado a los log-precios) y CUB95, CUB99 (% de residuos comprendidos en los intervalos del 95% y 99% suponiendo normalidad) 20 ESTADÍSTICA ESPAÑOLA Figura 3 AUTOCORRELACIONES ESPACIALES RESIDUALES DEL MODELO STAR(*) (*) En línea rayada negra se muestran las bandas de confianza al 95%. Finalmente, se realizó un proceso de validación extramuestral tipo rolling tomando el periodo comprendido hasta el 30 de junio de 2004 para estimar el modelo y el resto como periodo de validación, dando lugar a un total de 133 observaciones extramuestrales. Los resultados obtenidos se muestran en la Figura 4 y en la Tabla 6. La Figura 4 presenta las predicciones del modelo STAR simplificado así como los límites de los intervalos predictivos para niveles de confianza del 95% y del 99%. En la Tabla 6 se analiza la distribución de los errores de predicción tanto del modelo STAR como del modelo STAR simplificado y se comparan con la de los residuos del modelo hedónico. Se observa que, en general, los modelos STAR capturan de forma adecuada la evolución de los precios, no observándose la existencia de sesgos importantes en la distribución de los errores que se distribuye simétricamente en torno al 0. El modelo hedónico, por su parte, muestra una tendencia significativa a infrapredecir el valor de los precios, como lo demuestran los claros valores positivos tomados por la media y la mediana de los errores (ver Tabla 6). Ello es debido a la EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 21 existencia de una tendencia creciente en el periodo extramuestral analizado no capturada por el modelo hedónico y sí por los modelos STAR, como lo pone de manifiesto tanto la inexistencia de sesgos en los errores predictivos (valores medios y medianos más cercanos a 0) como un mejor comportamiento en términos del logaritmo de la densidad predictiva extramuestral LPRED. Por último, se aprecia un adecuado cubrimiento de los intervalos predictivos, tanto al nivel del 95% como del 99%, sobre todo para el modelo STAR simplificado debido a su mayor grado de parsimoniosidad. Cabe concluir, por tanto, que los modelos STAR presentan una mejora significativa con respecto al modelo hedónico tradicional. Figura 4 PREDICCIONES EXTRAMUESTRALES DEL MODELO STAR SIMPLIFICADO y ypred lim95 lim99 15 14 Log-Precio 13 12 11 10 9 0 20 40 60 80 Numero de Observacion 100 120 22 ESTADÍSTICA ESPAÑOLA CONCLUSIONES Y LÍNEAS FUTURAS DE INVESTIGACIÓN En este trabajo se ha realizado un estudio del mercado inmobiliario en un área concreta de la ciudad de Zaragoza mediante un modelo espacio-temporal autorregresivo (STAR) similar al propuesto en Pace y otros (1998, 2000). Nuestro modelo reduce el número de parámetros consiguiendo una mayor parsimonia y flexibilidad. Además, mejora significativamente la bondad de ajuste de un modelo hedónico tradicional al capturar las dependencias espacio-temporales presentes en la evolución de dicho mercado, reduciendo los sesgos observados en el comportamiento predictivo extramuestral del modelo hedónico. En este modelo se han considerado únicamente dependencias de carácter espacial de tipo geográfico. Sin embargo, es de esperar la existencia de otro tipo de dependencias más ligadas con características estructurales de la vivienda así como con su localización (por ejemplo, su proximidad a centros comerciales, colegios, etc). Por ello, una línea de investigación en la que estamos actualmente trabajando es la incorporación de este tipo de información, tanto en las variables explicativas del modelo como en la construcción de las matrices de dependencia espacial S. Por otra parte, el área analizada, si bien es representativa de los diferentes estatus socio-económico de la ciudad, no lo es en cuanto a la escasez de vivienda nueva en la zona por ser barrios ya conformados en su estructura y no de nueva creación. Es, por ello, necesario extender el análisis realizado a un contexto espacio-temporal más amplio del aquí expuesto, siendo éste otro de los objetivos más inmediatos que abordaremos en futuros estudios. REFERENCIAS BAILEY, M., MUTH, R. Y NOURSE, H. (1963). «A Regression Method for Real Estate Price Index Construction». Journal of the American Statistical Association, 58, 933-942. BASU, S. Y THIBODEAU, T.G. (1998). «Análisis of Spatial Correlation in House Prices». Journal of Real Estate Finance and Economics 17, 61-85. CAN, A. (1990). «The Measurement of Neighborhood Dynamics in Urban Housing Prices». Economic Geography 66, 254-272. COLEGIO DE REGISTRADORES DE LA PROPIEDAD, «Bienes Muebles y Mercantiles de España». Estadística Registral Inmobiliaria. Anuario de 2004. EVOLUCIÓN ESPACIO-TEMPORAL DEL MERCADO INMOBILIARIO EN ZARAGOZA MEDIANTE EL USO ... 23 COLWELL, F. Y DILMORE, G. (1999). «Who was first?. An examination of an Early Hedonic Study». Land Economics, 75, No. 4, 620-626. COURT, A.T. (1939). «The Dynamics of Automobile Demand». New York. General Motors. DAVID, A.; DUBUJET, F; GOURIEROUX, C. Y LAFERRÈRE, A. (2002). «Les indices de prix des logements anciens». INSEE Méthode, 98, 119 p. DAVIDSON, R. Y MACKINNON, J. (1993). «Estimation and Inference in Econometrics». Oxford University Press, Oxford. DUBIN, R.A. (1988). «Estimation of Regression Coefficients in the Presence of Spatial Autocorrelation Error Terms». Review of Economics and Statistics, 70, 466-474. DUBIN, R.A. (1992). «Spatial Autocorrelation and Neighborhood Quality». Regional Science and Urban Economics 22, 433-452. DUBIN, R.A. (1998). «Predicting House Prices Using Multiple Listings Data». Journal of Real Estate Finance and Economics 17, 35-59. DUBIN, R.A. AND SUNG, C. H. (1990). «Specification of hedonic Regressions»: Nonnested Tests on Measures of Neighborhood Quality. Journal of Urban Economics 27, 97-110. GELFAND, A.E.; ECKER, M. D.; KNIGTH, J.R. Y SIRMANS, C.F. (2004). «The Dynamics of Location in Home Price». Journal of Real Estate Finance and Economics, 29, 149-166. GELFAND, A.E.; GHOSH, S.K.; KNIGTH, J.R. Y SIRMANS, C.F. (1998). «Spatio-Temporal Modeling of Residential Sales Data». Journal of Business and Economics Statistics 16, 312-321. HAAS, G.C. (1922). «Sale Prices as a Basis for Farm Land Appraisal», Technical Bulletin 9, Agricultural Experiment Station, University of Minnesota. LI, M. Y BROWN, H.J. (1980). «Micro-neighborhood Externalities and Hedonic Housing Prices». Land Economics 56, 125-141. PACE, R.K.; BARRY, R.; CLAPP, J.M. Y RODRIGUEZ, M. (1998). «Spatiotemporal Autorregressive Models of Neighborhood Effects». Journal of Real Estate Finance and Economics, 17, 15-33. PACE, R.K.; BARRY, R.; GILLEY, O.W. Y SIRMANS, C.F. (2000). «A method for spatialtemporal forecasting with an application to real estate prices». International Journal of Forecasting, 16, 229-246. 24 ESTADÍSTICA ESPAÑOLA PACE, R.K. Y GILLEY, O.W. (1998). «Generalising OLS and the Grid Estimator». Real Estate Economics 26, 331-347. RIDKER, R.G. Y HENNING, J.A. (1967). «The Determinants of Property Values with Special Reference to Air Pollution». The Review of Economics and Statistics, 49, 246-257. ROSEN, S. (1974). «Hedonic Prices and Implicit Markets»: Product Differentiation in Pure Competition. The Journal of Political Economics 82, 34-55. SPATIO-TEMPORAL EVOLUTION OF THE ZARAGOZA REAL ESTATE MARKET USING NEIGHBOURHOOD EFFECTS ABSTRACT In this paper we propose an autoregressive spatio-temporal model (STAR) using neighbourhood effects to analyse the evolution of the Real Estate Market in a specific area of Zaragoza. The model captures the influence of the structural characteristics of dwellings traditionally incorporated by hedonic price models. In addition, it allows incorporate temporal and spatial neighbourhood effects in a flexible and realistic way. Furthermore, the estimation of the model parameters is carried out by OLS procedures, what makes it low cost computationally. Key words: STAR Models, Hedonic Models, Real Estate Market, Neighbourhood Effects. AMS Classification: 91B72, 91B24, 91B82.