Análisis descriptivo de series temporales aplicadas al precio medio de la vivienda en España Justo Puerto Marı́a Paz Rivera * MaMaEuSch** Management Mathematics for European Schools 94342 - CP - 1 - 2001 - DE - COMENIUS - C21 * Universidad de Sevilla Este proyecto ha sido desarrollado con ayuda parcial de la Unión Europea dentro del marco del programa Sócrates. El contenido no refleja necesariamente la posición de la Unión Europea ni implica ninguna responsabilidad por parte de la Unión Europea. ** 0 1. Series temporales Llamamos serie temporal, cronológica, histórica o de tiempo a una sucesión de observaciones cuantitativas de un fenómeno en el tiempo. Interesa su estudio porque permite analizar la evolución que en el transcurso del tiempo ha experimentado una variable, tanto para construir un modelo descriptivo de la historia del fenómeno, como para predecir sus valores futuros mediante métodos de alisado (que no estudiaremos en este trabajo). Es importante entender que, en una serie temporal es esencial la ordenación que el tiempo induce en los datos, de forma que cada observación deberá estar asociada a un determinado periodo. Luego, en esencia, una serie temporal es una distribución de frecuencias bidimensional (t, yt ) donde la variable endógena o dependiente yt es la magnitud en estudio, y la exógena o independiente es el tiempo t. Pero, sólo existe una variable yt que constituye lo que se conoce como modelo univariante de serie temporal que se autoexplica por su propio pasado, no existiendo ninguna variable explicativa o exógena que nos permita establecer una relación causa-efecto como sucede en la regresión y correlación. Se estudia el pasado histórico de yt (sus componentes) de forma descriptiva y, bajo el supuesto de que su estructura va a permanecer constante, se hacen predicciones para el futuro. Ası́ serán series temporales las ventas de una empresa en cada uno de los últimos diez años, los costes financieros, la renta disponible de los clientes potenciales, etc. Todo análisis de series temporales ha de iniciarse con una representación gráfica de la misma, utilizando los ejes cartesianos, de forma que en el eje de abcisas representaremos el tiempo y en el de ordenadas, la serie observada yt , con lo que obtendremos una serie de puntos (t, yt ) que, al unirlos, nos dan un impacto gráfico de la serie del que se pueden sacar unas primeras conclusiones de la evolución histórica de la misma. Antes de proseguir hemos de tener en cuenta el carácter de introducción que pretende tener este trabajo. Intentar explicar la evolución de una variable económica a partir del simple paso del tiempo, es algo que no nos permite ir más allá de un mero estudio descriptivo de unos datos concretos en un intervalo de tiempo concreto. Un análisis más profundo de la evolución temporal de una variable, tanto a partir de los valores de otra que presumiblemente influye en ella, como de su propia historia (según sus hábitos adquiridos, tal y como sucede con el consumo, o según capacidad máxima, caso de la producción), requiere técnicas de análisis mucho más perfeccionadas que las que vamos a exponer a continuación, que se han de interpretar simplemente como una primera aproximación descriptiva a las técnicas rigurosas de análisis de series temporales que actualmente se están utilizando. 1 1.1. Componentes de una serie temporal En el estudio clásico de las series temporales se considera que la magnitud estudiada, en un determinado valor y en un determinado periodo, es consecuencia de la actuación de cuatro componentes o fuerzas, la tendencia, las variaciones cı́clicas, las variaciones estacionales y las variaciones accidentales. Vamos a definirlas. Tendencia (T): es una componente de la serie que refleja su evolución a largo plazo. Este largo plazo será distinto según sea la naturaleza de la serie, pero cuántos más periodos se tengan mejor será el análisis. Esta componente, en el conjunto de toda la serie, puede ser de naturaleza estacionaria o constante (se representa por una paralela al eje de abcisas), de naturaleza lineal, de naturaleza exponencial, u otras posibilidades. Las variaciones cı́clicas (C): es una componente de la serie que recoge las oscilaciones periódicas de amplitud superior a un año. Estas oscilaciones no son regulares y se presentan en los fenómenos económicos cuando se dan de forma alternativa etapas de prosperidad o de depresión. Normalmente, en una serie económica se superponen distintos ciclos de esta clase, lo que hace que en la práctica ésta sea la componente más difı́cil de determinar. Como es natural, cuanto mayor sea el periodo de un ciclo que afecta a nuestra variable, mayor ha de ser el número de observaciones para que aquel sea reconocible. Las variaciones estacionarias (E): es una componente de la serie que recoge oscilaciones que se producen en periodos de repetición iguales o inferiores a un año. Su nombre proviene precisamente de las estaciones climatológicas. Si se considera el año como periodo marco, de repetición pueden observarse las fluctuaciones de la magnitud a lo largo de sus meses, trimestres, cuatrimestres, etc. Ası́ como si tomamos como periodo de repetición el mes, podrı́amos observar las fluctuaciones de la magnitud en sus distintos dı́as, semanas, etc. El origen de las variaciones estacionales puede estar en factores fı́sico-naturales, como son las estaciones climatológicas, o en factores culturales y de tradición, como son las fiestas navideñas, las vacaciones, los horarios comerciales, etc. El clima afecta a la venta de una serie de productos, los helados y refrescos se venderán fundamentalmente en verano y la ropa de abrigo en invierno. Las variaciones accidentales (A): es una componente de la serie temporal que recoge las fluctuaciones erráticas que se dan por la ocurrencia de fenómenos imprevisibles, que afectan a la variable en estudio de manera esporádica y no permanente (un pedido extraordinario a una empresa, una huelga, una catástrofe, etc). También reciben el nombre de variaciones irregulares, residuales o erráticas. 2 1.2. Hipótesis de estudio Ahora cabe hacerse una pregunta básica: ¿Cómo actúan las cuatro componentes para que den como resultado los distintos valores de la serie observada? En el estudio clásico de las series temporales se han manejado dos hipótesis de trabajo: 1. Los valores observados de cualquier serie temporal son el resultado de la suma de las cuatro componentes: yt = Tt + Ct + Et + At . Esta expresión se conoce con el nombre de esquema o hipótesis aditiva. 2. Los valores observados de cualquier serie temporal son el resultado de la multiplicación de las cuatro componentes: yt = Tt ∗ Ct ∗ Et ∗ At . Esta expresión admite variantes para recoger el supuesto de que la componente accidental o errática es independiente de las demás y no sigue ninguna regularidad periódica como ocurre con las otras. Esta independencia implica que la componente A aparece de forma aditiva: yt = Tt ∗ Ct ∗ Et + At . ¿Cómo decidiremos que hipótesis seguir? Para resolver el problema de cual debe ser el esquema o hipótesis a utilizar en cada caso, habrá que efectuar un análisis previo de la serie. Una forma analı́tica de determinar el esquema de trabajo más adecuado se consigue mediante el método de las diferencias y cocientes estacionales. Veamos que entendemos por diferencia y cociente estacional: La diferencia estacional se obtiene como diferencia entre dos datos de años consecutivos, pero de la misma estación. La notaremos como dt,i . dt,i = yt,i − yt−1,i . El cociente estacional se calcula por división entre dos datos de años consecutivos, pero de la misma estación. La notaremos como ct,i . ct,i = yt,i /yt−1,i . donde yt,i = valor de la serie en el año t, en la estación i. Una vez aclarados los conceptos de diferencia y cociente estacional vamos a explicar los pasos que habrı́a que seguir para la aplicación de este método. 3 1. Cálculo de todos los cocientes y diferencias estacionales. Lógicamente, en este cálculo perderı́amos las observaciones correspondientes a un año. 2. Obtención del coeficiente de variación (CV) para las diferencias y cocientes estacionales dados por las siguientes expresiones: Desviación tı́pica(d) , CV (d) = media(d) Desviación tı́pica(c) . CV (c) = media(c) 3. Aplicar la siguiente regla de decisión: Si CV (c) > CV (d) elegirı́amos el modelo aditivo. Si CV (c) ≤ CV (d) elegirı́amos el modelo multiplicativo. La obtención de las diferencias estacionales equivale a tomar la serie de incrementos interanuales. Los cocientes estacionales, sin embargo, tienen más que ver con la serie de crecimiento. Por lo tanto lo que implı́citamente se está diciendo es que, si el crecimiento interanual para cada estación tiene menor variabilidad que en términos de incrementos, esto indicarı́a una asociación multiplicativa entre tendencia y estacionalidad. Si sucediera lo contrario serı́a más plausible la hipótesis aditiva. Nota histórica; Los primeros análisis de series económicas temporales aplicaron los instrumentos que surgieron en el ámbito de la astronomı́a y de la meteorologı́a en el siglo XVII, cuando los estudiosos de las órbitas planetarias introdujeron la posibilidad de diferenciar entre los distintos tipos de movimientos que aparecen en las series de datos, que reflejan cualquier tipo de fenómeno fı́sico. Esta diferenciación se plasmó en una nueva idea para el tratamiento de series temporales, basada en que toda serie es el resultado de la agregación de cuatro componentes denominados no observados, y que podrı́an estudiarse por separado. Este enfoque, que comenzó a aplicarse en economı́a aproximadamente a mediados del siglo XIX, en la actualidad se conoce como el enfoque clásico de las series temporales, y supuso el punto de partida de todo el análisis posterior de este tipo de datos económicos. 4 2. Serie del precio medio del metro cuadrado de la vivienda La vivienda es un componente fundamental de la riqueza de las familias. En España el valor de las viviendas supone en torno a 2/3 de la riqueza total de las familias y sirve de garantı́a a casi 1/3 de los activos totales de las entidades de crédito españolas. El primer problema al que hay que enfrentarse al analizar el precio de la vivienda es su propia definición. La vivienda no es un bien homogéneo, sino que varı́a en función de su localización, tamaño, estructura (viviendas unifamiliares, bloques de viviendas...), calidad de la construcción, etc. Además, las caracterı́sticas de las viviendas existentes varı́an en el tiempo. En este trabajo, la fuente de información utilizada para estudiar el precio medio de la vivienda ha sido elaborada por el Ministerio de Fomento, a partir de las tasaciones realizadas por diversas sociedades de tasaciones de todo el territorio español. Desde 1976, el precio medio de las viviendas españolas se ha multiplicado por 16 en términos nominales y duplicado en términos reales. Esta estadı́stica incluye datos trimestrales desde el primer trimestre de 1987, y se distinguen las viviendas por; Antigüedad; se refiere a la fecha en la que fueron terminadas o a la correspondiente a la última gran rehabilitación. Situación geográfica; factores como la intensidad de la demanda de la vivienda, los diferentes submercados, la mayor o menor oferta, las distintas tipologı́as de la vivienda, ası́ como la segregación social del territorio, determinan que las diferencias de precios sean muy importantes. Superficie construida; se entiende por superficie útil la del suelo de la vivienda cerrada por el perı́metro definido por la cara interior de sus cerramientos con el exterior o con otras viviendas locales de cualquier uso, incluyendo la superficie del suelo de los espacios exteriores de uso privativo de la vivienda. A mayor superficie de vivienda más barato costará el metro cuadrado. Para la obtención de los precios medios se procede en dos fases: En primer lugar, se calculan los precios medios por m2 de las viviendas de las que se ha recibido información de una antigüedad determinada y que pertenecen al mismo código postal. El precio medio se obtiene como media aritmética simple de los precios individuales correspondientes a cada tramo de antigüedad. En el caso de los municipios con más de un código postal, el precio medio municipal se calcula como la media aritmética simple de los precios medios por código postal. 5 En segundo lugar, los precios medios por m2 por municipio se ponderan por la población. Para consultar la metodologı́a llevada a cabo en este estudio, consulten la página web del Ministerio español de fomento http://www.mfom.es En primer lugar, tenemos que ver a qué tipo de hipótesis se ajusta nuestro modelo. Para ello según lo visto en la sección 1.2, calcularemos las series del cociente y de las diferencias entre dos observaciones consecutivas de la misma estación. En la tabla 1 se ve la serie de los precios medios del metro cuadrado desde Enero de 1987 hasta Octubre del 2003, estos datos han sido suministrados por el Ministerio de Fomento. 6 Años 1987 1T 2T 3T 4T 1988 1T 2T 3T 4T 1989 1T 2T 3T 4T 1990 1T 2T 3T 4T 1991 1T 2T 3T 4T 1992 1T 2T 3T 4T 1993 1T 2T 3T 4T 1994 1T 2T 3T 4T 1995 1T 2T 3T 4T Precio metro cuadrado Diferencia estacional 289,89 308,64 324,99 345,55 369,13 79,24 389,79 81,15 404,39 79,40 423,12 77,57 456,58 87,45 480,17 90,38 502,72 98,33 516,43 93,31 550,40 93,82 559,73 79,56 570,77 68,05 580,60 64,17 613,42 63,02 637,90 78,17 652,80 82,03 681,23 100,63 650,49 37,07 635,70 -2,20 633,78 -19,02 630,72 -50,51 625,44 -25,05 634,83 -0,87 639,69 5,91 640,61 9,89 634,72 9,28 636,80 1,97 644,36 4,67 642,63 2,02 652,92 18,20 661,06 24,26 665,46 21,10 667,47 24,84 7 Cociente estacional 1,27 1,26 1,24 1,22 1,24 1,23 1,24 1,22 1,21 1,17 1,14 1,12 1,11 1,14 1,14 1,17 1,06 1,00 0,97 0,93 0,96 1,00 1,01 1,02 1,01 1,00 1,01 1,00 1,03 1,04 1,03 1,04 Años 1996 1T 2T 3T 4T 1997 1T 2T 3T 4T 1998 1T 2T 3T 4T 1999 1T 2T 3T 4T 2000 1T 2T 3T 4T 2001 1T 2T 3T 4T 2002 1T 2T 3T 4T 2003 1T 2T 3T Precio metro cuadrado 669,98 674,79 675,18 676,45 677,74 683,06 686,64 691,78 694,34 709,66 723,95 738,58 755,21 780,25 803,89 829,81 857,25 891,76 926,36 953,42 994,50 1.030,77 1.065,78 1.096,57 1.148,23 1.193,66 1.254,09 1.287,73 1.349,11 1.402,57 1.450,60 varianza desv.tı́pica media desv.tı́pica/media Diferencia estacional 17,06 13,73 9,72 8,98 7,76 8,27 11,46 15,33 16,60 26,60 37,31 46,80 60,87 70,59 79,94 91,23 102,04 111,51 122,47 123,61 137,25 139,01 139,42 143,15 153,73 162,89 188,31 191,16 200,88 208,91 196,51 3.865,50 62.17 128,36 0.4843 Cociente estacional 1,03 1,02 1,01 1,01 1,01 1,01 1,02 1,02 1,02 1,04 1,05 1,07 1,09 1,10 1,11 1,12 1,14 1,14 1,15 1,15 1,16 1,16 1,15 1,15 1,15 1,16 1,18 1,17 1,17 1,18 1,16 0,01 0,09 1,10 0,0788 Cuadro 1: Método de las diferencias y cocientes estacionales 8 Como podemos observar, el coeficiente de variación (coef.variación=varianza/media) del cociente es menor que el coeficiente de variación de las diferencias, por lo tanto nos encontramos con un modelo de serie temporal sujeta a la hipótesis multiplicativa. Para el cálculo de estas diferencias y cocientes estacionales, como ya mencionamos anteriormente, tomaremos la observación en una estación determinada y las restaremos o dividiremos respectivamente con su observación anterior, por lo tanto para el año 1987 no podremos calcular dichos coeficientes (pues necesitarı́amos los datos del año 1986). Y en los restantes casos su cálculo será el siguiente, Año 1988-1T 1988-2T 1988-3T 1988-4T Diferencia estacional 369,13-289,89=79,24 389,79-308,79=81,15 404,39-324,99=79,40 423,12-345,55=77,57 Cociente estacional 369,13/289,89=1,27 389,79/308,79=1,26 404,39/324,99=1,24 423,12/345,55=1,22 Pasemos ahora al cálculo de cada una de las componentes de la serie. Para ello hay que tener en cuenta que existen diversos métodos para su cálculo. En este trabajo nos limitaremos a métodos clásicos y sencillos de descomposición de series temporales. 2.1. Cálculo de la tendencia Necesitamos: 1. Hallar la serie desestacionalizada: Tomemos una media móvil centrada de la serie, de periodicidad anual, que denominaremos M Mt . La media móvil es una serie amortiguada o suavizada obtenida por el cálculo reiterado de valores medios. Su cálculo es el siguiente: • Partimos de la serie temporal observada yt . • Se obtienen sucesivas medias aritméticas para cada yt con un número de observaciones anteriores y posteriores que se ha fijado de antemano (en nuestro caso tomaremos cuatro, pues los datos son dados por trimestres). Si el número de observaciones utilizado es impar, la media y t (está centrada) coincide con el periodo t. Si el número utilizado es par la y t no coincide con el periodo t (esta descentrada) y hay que volver calcular una nueva media aritmética y t utilizando los y t , con lo que se obtiene una serie de medias móviles centradas con los periodos de tiempo. 9 Ya hemos dicho que en nuestro caso tomaremos 4 observaciones, i.e., su cálculo es el siguiente; y 2,5 = y1 + y2 + y3 + y4 289,89 + 308,64 + 324,99 + 345,55 = = 317,27, 4 4 y2 + y3 + y4 + y5 308,64 + 324,99 + 345,55 + 369,13 = = 337,08, 4 4 324,99 + 345,55 + 369,13 + 389,79 y3 + y4 + y5 + y6 = = 357,37, y 4,5 = 4 4 y4 + y5 + y6 + y7 345,55 + 369,13 + 389,79 + 404,39 y 5,5 = = = 377,22. 4 4 Puede verse que dichas medias se corresponden con periodos ficticios, que 0 no existen en la serie observada que son t = 2,5; 3,5; 4,5; 5,5. O sea que la media aritmética 317.27 corresponde a un periodo irreal que está justo entre 0 el periodo dos y el tres, la segunda 337.08 está en t = 3,5, que está entre el tres y el cuarto, etc. Para centrar estas medias con los periodos reales de las observaciones se vuelven a promediar los valores y t0 dos a dos, obteniéndose la serie y t que está centrada en los periodos observados t: y 3,5 = y3 = y 2,5 + y 3,5 317,27 + 337,08 = = 327,17, 2 2 y 3,5 + y 4,5 337,08 + 357,37 = = 347,22, 2 2 y 2,5 + y 3,5 357,37 + 377,22 y5 = = = 367,29. 2 2 De esa forma calcularemos la media móvil (MMA) de la serie original. Hemos de tener en cuenta que, según este método, perderemos las dos primeras y las dos últimas observaciones. (Véase en la tercera columna de la 2) y4 = Al ser anual, habremos eliminado en gran parte la componente estacional, y también la accidental, ya que al agregar las observaciones de un año, se compensarán valores positivos y negativos de esta última componente, por lo que M Mt puede interpretarse como el producto de las componentes tendencial y cı́clica: Tt ∗ Ct . Por tanto el cociente de la serie original entre su media móvil, i.e., yt /M Mt (véase en la cuarta columna de la tabla 2), es un porcentaje tomando valores alrededor de 1, que contiene información acerca de las componentes estacional y accidental. 10 Con objeto de eliminar la componente accidental, se calculan las medias aritméticas a nivel de cada estación de yt /M Mt (en nuestro caso de todos los trimestres, ası́ que serán 4, M1 , M2 , M3 , M4 ). Estas medias representan de forma aislada la importancia de la componente estacional. En nuestro caso tenemos; M1 = 1,005 + 1,0071 + 1,0177 + · · · + 1,0009 = 0,99955, 16 1,074 + 1,006 + 1,0043 + · · · + 0,9972 = 1,00080, 15 0,9933 + 0,9923 + 1,004 + · · · + 1,0065 M3 = = 1,00030, 16 0,9952 + 0,9845 + 0,9886 + · · · + 0,9927 M4 = = 0,9974. 16 M2 = Obtención de los ı́ndices de variación estacional: se calcula la media aritmética anual M A de las medias estacionales, i.e. MA = M1 + M2 + M3 + M4 0,99955 + 1,00080 + 1,00030 + 0,9974 = = 0,99951, 4 4 que será la base de los ı́ndices de variación estacional expresados en porcentaje: I1 = 0,99955 M1 ∗ 100 = · 100 = 100,004, MA 0,99951 I2 = M2 1,0008 ∗ 100 = · 100 = 100,128, MA 0,99951 I3 = 1,00030 M3 ∗ 100 = · 100 = 100,079, MA 0,99951 I4 = M4 0,9974 ∗ 100 = · 100 = 99,789. MA 0,99951 Si obtenemos un ı́ndice del 80 % quiere decir que por el mero hecho de ser una estación, la magnitud en estudio es un 20 % más baja que su tendencia media. En nuestro caso, observamos que estos ı́ndices estacionales son prácticamente insignificantes, esto quiere decir que el precio medio de la vivienda tiene un comportamiento similar en todas sus estaciones, es decir, no se contemplan fuertes subidas o bajadas de precio según la estación en la que nos encontremos. 11 Por último una vez obtenidos los ı́ndices de variación estacional puede desestacionalizarse la serie observada dividiendo cada valor de la correspondiente estación por su ı́ndice correspondiente, expresados en tantos por uno (véase en la quinta columna de la tabla 2). 2. Estimar un modelo de regresión lineal de esta versión desestacionalizada de la serie, ytd y obtendremos ası́ la tendencia de la serie. En nuestro caso trataremos con el ajuste lineal mediante el método de los mı́nimos cuadrados. Consiste en minimizar la suma de los cuadrados de las diferencias entre valores observados en los distintos periodos y los estimados por la ecuación de la recta: yt = a + bt, siendo las ecuaciones normales: n X yt = na + b t, (1) t=1 t=1 n X n X n X tyt = a t+b t2 , (2) t=1 t=1 t=1 n X donde n es el número total de observaciones, que coincide con el número de periodos de tiempo. El sistema de ecuaciones normales 2 se simplifica efectuando un cambio de variable 0 t = t − Ot si el número de periodos es impar (como es nuestro caso, ya que tenemos el estudio en 17 años, tomaremos Ot = 1995), siendo Ot el valor que ocupa el lugar central de la Pserie 0de instantes o periodos t. Haciendo este cambio de variables el sistema 2, al ser nt0 =1 t = 0, queda reducido a: n X yt = na, t=1 n X 0 yt t = b t=1 n X t2 . t=1 Despejando los parámetros de la recta que son las incógnitas del sistema queda: Pn yt a = t=1 , n 12 (3) Pn 0 t=1 yt t P b= n 02 , t0 =1 t (4) que nos permite establecer la recta estimada como: 0 yt = a + bt , y deshaciendo el cambio de variables tendremos la ecuación que nos da la recta de regresión: yt = a + b(t − Ot ). Cuando las observaciones estén dadas en periodos inferiores al año (como es nuestro caso, periodos trimestrales), antes de hacer el ajuste conviene calcular las medias anuales para eliminar la componente estacional que nos puede distorsionar el resultado. Una vez ajustada la recta de regresión a la nube de observaciones, es importante disponer de una medida de la bondad del ajuste realizado y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de determinación, definido como sigue (St0 yt )2 R = 2 2 . St0 Syt 2 0 Donde St20 yt es la covarianza entre la variable t y yt , es decir, St0 yt N 1 X 0 = t yti − t0 · yt . N i=1 i 0 Y tanto St20 como Sy2t representan las varianzas marginales de t y de yt respectivamente. Que se calculan según las siguientes fórmulas; Sy2t St20 N 1 X 2 yti − (yt )2 , = N i=1 N 1 X 0 2 = (ti ) − (t0 )2 . N i=1 Este coeficiente es un número entre -1 y 1, la fiabilidad del modelo será mejor cuanto más se acerque a 1 en caso de existencia de correlación positiva, y a -1 en caso de correlación negativa. 13 Siguiendo los pasos explicados obtendrı́amos con nuestra serie los siguientes resultados; a = 731,27 b = 50,10. La recta de regresión de la serie desestacionalizada es la siguiente: yt = 731,27 + 50,10(t − 1995) = 50,10t − 99222,45, con un coeficiente de determinación R2 = 1445887,84 = 0,83. 24 · 72629,06 (En la sección 4.1 se verá un cálculo más detallado sobre la recta de regresión, mediante el método de los mı́nimos cuadrados.) Con lo cual la tendencia tomará los valores expresados en la tabla 2; 14 Años 1987 1T 2T 3T 4T 1988 1T 2T 3T 4T 1989 1T 2T 3T 4T 1990 1T 2T 3T 4T 1991 1T 2T 3T 4T 1992 1T 2T 3T 4T 1993 1T 2T 3T 4T 1994 1T 2T 3T 4T 1995 1T 2T 3T 4T Precio medio 289,89 308,64 324,99 345,55 369,13 389,79 404,39 423,12 456,58 480,17 502,72 516,43 550,40 559,73 570,77 580,60 613,42 637,90 652,80 681,23 650,49 635,70 633,78 630,72 625,44 634,83 639,69 640,61 634,72 636,80 644,36 642,63 652,92 661,06 665,46 667,47 MMA yt /MMA 327,17 347,22 367,29 386,91 407,54 429,77 453,36 477,31 500,70 522,38 540,83 557,35 573,25 590,90 610,93 633,76 650,97 655,33 652,68 643,99 634,54 631,30 631,93 633,91 636,30 637,71 638,54 639,38 641,90 647,21 652,88 658,62 663,86 667,71 0,99333 0,99519 1,00501 1,00744 0,99227 0,98453 1,00711 1,00599 1,00403 0,98862 1,01770 1,00426 0,99567 0,98257 1,00408 1,00653 1,00281 1,03952 0,99665 0,98713 0,99880 0,99908 0,98973 1,00146 1,00532 1,00455 0,99402 0,99597 1,00383 0,99292 1,00006 1,00370 1,00241 0,99964 15 Serie.desest 289,880 308,244 324,735 346,279 369,117 389,290 404,073 424,013 456,564 479,554 502,326 517,520 550,380 559,012 570,322 581,825 613,398 637,082 652,288 682,668 650,467 634,885 633,283 632,051 625,417 634,016 639,188 641,962 634,697 635,983 643,854 643,986 652,896 660,212 664,938 668,878 Tendencia 325,96 338,485 351,01 363,535 376,06 388,585 401,11 413,635 426,16 438,685 451,21 463,735 476,26 488,785 501,31 513,835 526,36 538,885 551,41 563,935 576,46 588,985 601,51 614,035 626,56 639,085 651,61 664,135 676,66 689,185 701,71 714,235 726,76 739,285 751,81 764,335 Años 1996 1T 2T 3T 4T 1997 1T 2T 3T 4T 1998 1T 2T 3T 4T 1999 1T 2T 3T 4T 2000 1T 2T 3T 4T 2001 1T 2T 3T 4T 2002 1T 2T 3T 4T 2003 1T 2T 3T Precio medio 669,98 674,79 675,18 676,45 677,74 683,06 686,64 691,78 694,34 709,66 723,95 738,58 755,21 780,25 803,89 829,81 857,25 891,76 926,36 953,42 994,50 1.030,77 1.065,78 1.096,57 1.148,23 1.193,66 1.254,09 1.287,73 1.349,11 1.402,57 1.450,60 MMA 670,64 672,98 675,07 677,07 679,54 682,89 686,88 692,28 700,27 710,78 724,24 740,67 759,49 780,89 805,05 831,74 860,99 891,75 924,35 958,89 993,69 1.029,01 1.066,12 1.105,70 1.149,60 1.197,03 1.246,04 1.297,26 1.347,94 yt /MMA 0,99902 1,00269 1,00016 0,99908 0,99735 1,00025 0,99965 0,99928 0,99153 0,99842 0,99960 0,99717 0,99436 0,99919 0,99857 0,99768 0,99566 1,00002 1,00217 0,99430 1,00082 1,00171 0,99968 0,99174 0,99881 0,99718 1,00646 0,99265 1,00087 Serie.desest 669,956 673,924 674,650 677,877 677,716 682,184 686,101 693,240 694,315 708,750 723,382 740,139 755,183 779,249 803,259 831,561 857,219 890,616 925,633 955,432 994,464 1029,448 1064,944 1098,884 1148,189 1192,129 1253,106 1290,447 1349,061 1400,771 1449,462 Cuadro 2: Cálculo de la tendencia 16 Tendencia 776,86 789,385 801,91 814,435 826,96 839,485 852,01 864,535 877,06 889,585 902,11 914,635 927,16 939,685 952,21 964,735 977,26 989,785 1002,31 1014,835 1027,36 1039,885 1052,41 1064,935 1077,46 1089,985 1102,51 1115,035 1127,56 1140,085 1152,61 2.2. Cálculo de la componente cı́clica Se calcula el cociente de la serie desestacionalizada, ytd , entre la tendencia, Tt , y se obtiene ası́ el producto de las componentes cı́clica y accidental, Ct ∗ At . Al ser ytd y Tt series compatibles en magnitud, el producto Wt = Ct ∗ At tiene forma de porcentaje, tomando valores alrededor de la unidad. Finalmente para separar la componente cı́clica, se calcula la media móvil de la serie Wt y obtendremos como resultado una estimación de la componente cı́clica. La tabla 3 recoge los resultados del cálculo de la componente cı́clica en porcentajes, estos cálculos son los mismos que los realizados para el cálculo de la media móvil de la serie original. Años 1987 2T 3T 4T 1988 2T 3T 4T 1989 2T 3T 4T 1990 2T 3T 4T 1991 2T 3T 4T 1T 1T 1T 1T 1T serie desest./tendencia= Media móvil Ct*At primera de Ct*At 0,889368928 0,910638004 0,919410849 0,925124174 0,942469 0,952512289 0,965257551 0,981601533 0,985817515 1,001792208 1,003956158 1,007364029 1,026409219 1,025066862 1,049245815 1,071413778 1,075720041 1,093138591 1,098442605 1,113260931 1,119515645 1,11595712 1,132143872 1,155705938 1,138238271 1,143651498 1,142322531 1,137638527 1,144754813 1,132294162 1,154390945 1,165435064 1,165711078 1,182196027 1,185266608 1,182919058 1,176021741 1,210516283 1,149949281 17 Media móvil segunda de Ct*At*100 = comp.cı́clica, Ct ( %) 93,09399243 95,38632755 97,55375329 99,48868364 101,5182689 103,7827517 106,2482928 108,7081323 110,8979125 112,5829758 113,5191071 114,0280401 114,3538672 114,9572879 116,0051011 117,5488843 118,0644174 116,2985511 Años 1992 2T 3T 4T 1993 2T 3T 4T 1994 1994 3T 4T 1995 2T 3T 4T 1996 2T 3T 4T 1997 2T 3T 4T 1998 2T 3T 4T 1999 2T 3T 4T 1T 1T 1T 2T 1T 1T 1T 1T 1T serie desest./tendencia= Media móvil Ct*At primera de Ct*At 1,128455595 1,117419106 1,077906188 1,072119434 1,052798359 1,039566136 1,029317593 1,018101087 0,998242404 1,000130228 0,99204599 0,984448868 0,980914924 0,969400075 0,966592153 0,952084668 0,938047231 0,936238519 0,922784363 0,919996648 0,917530328 0,910091171 0,901624672 0,902650485 0,898425319 0,894375359 0,89302162 0,887742296 0,884429823 0,878747562 0,875092423 0,868920831 0,862446383 0,858134778 0,853714694 0,84743921 0,841285611 0,836722751 0,832310152 0,826445052 0,819580548 0,817437631 0,812603899 0,809821766 0,805255924 0,80284947 0,801846692 0,798873975 0,791691364 0,798025016 0,79670192 0,799863237 0,801860086 0,805581799 0,809199576 0,813718337 0,814565613 0,824142068 0,829248074 0,837326933 0,84355501 0,852991475 0,861939035 0,870626411 18 Media móvil segunda de Ct*At*100 = comp.cı́clica, Ct ( %) 113,3684194 109,476927 105,5842785 102,8833611 100,9115657 99,22895478 97,69244712 96,07423711 94,41615932 92,81175836 91,50439095 90,63708277 89,85129217 89,10588275 88,32449292 87,38341965 86,35278043 85,27869939 84,20809806 83,15839018 82,19413414 81,3629698 80,63356175 80,08617223 79,84494953 79,89441261 80,27225178 80,9650068 81,89302027 83,07345005 84,51592042 86,18089434 Años 2000 2T 3T 4T 2001 2T 3T 4T 2002 2T 3T 4T 2003 1T 1T 1T 1T serie desest./tendencia= Media móvil Ct*At primera de Ct*At 0,877223783 0,89060753 0,899787817 0,910483906 0,923479484 0,933188996 0,941444539 0,955727368 0,968044144 0,977829308 0,989941304 1,000432224 1,011887244 1,024849742 1,031856203 1,050786203 1,065714219 1,081956565 1,093687146 1,113315036 1,136568692 1,146017008 1,157290088 1,196522108 Media móvil segunda de Ct*At*100 = comp.cı́clica, Ct ( %) 88,06169706 90,05457179 92,1836451 94,44581819 96,67783377 98,91307656 101,2640983 103,7817973 106,6371384 109,76358 112,9666022 Cuadro 3: Cálculo de la componente cı́clica 2.3. Cálculo de la componente accidental Obtendremos una estimación de la componente accidental dividiendo el cociente Wt entre la estimación de la componente cı́clica, i.e, At = Wt /Ct . Estos cálculos se recogen en la tabla 4 y su cálculo para las cuatro primeras iteraciones es; Año 1987-3T 1987-4T 1988-1T 1988-2T 2.4. Componente accidental 0,9251/0,9309 · 100=99.3752 0,95251/0,9533 · 100=99.8583 0,9815/0,9755 · 100=100.621 0,9816/0,9948 · 100=10.694 Cálculo de la componente estacional Como ya vimos en el cálculo de los coeficientes estacionales, al dividir la serie inicial entre la serie móvil obtenı́amos el producto Et ∗ At . Ası́ pues, ahora dividiremos este producto entre la estimación obtenida de la componente accidental At y conseguiremos ası́ una estimación de la componente estacional, Et . Veamos ahora en la tabla 4 los resultados obtenidos en el cálculo de las componentes estacional y accidental en porcentajes. 19 Años 1987 2T 3T 4T 1988 2T 3T 4T 1989 2T 3T 4T 1990 2T 3T 4T 1991 2T 3T 4T 1992 2T 3T 4T 1993 2T 3T 4T 1994 2T 3T 4T 1T 1T 1T 1T 1T 1T 1T 1T serie desest./ tendencia= Ct*At 0,889368928 0,910638004 0,925124174 0,952512289 0,981601533 1,001792208 1,007364029 1,025066862 1,071413778 1,093138591 1,113260931 1,11595712 1,155705938 1,143651498 1,137638527 1,132294162 1,165435064 1,182196027 1,182919058 1,210516283 1,128455595 1,077906188 1,052798359 1,029317593 0,998242404 0,99204599 0,980914924 0,966592153 0,938047231 0,922784363 0,917530328 0,901624672 Estimación de la componente cı́clica,Ct ( %) Estimación de la componente accidental,At ( %) serie original yt/ Estimación de (media móvil yt la componente * At) estacional,Et( %) 93,09399243 95,38632755 97,55375329 99,48868364 101,5182689 103,7827517 106,2482928 108,7081323 110,8979125 112,5829758 113,5191071 114,0280401 114,3538672 114,9572879 116,0051011 117,5488843 118,0644174 116,2985511 113,3684194 109,476927 105,5842785 102,8833611 100,9115657 99,22895478 97,69244712 96,07423711 94,41615932 92,81175836 91,50439095 90,63708277 99,37528191 99,85836682 100,621606 100,6940861 99,22982736 98,77044546 100,8405641 100,5572047 100,3861034 99,12307895 101,807173 100,2956376 99,484045 98,49694464 100,4641221 100,5705868 100,1926816 104,0869616 99,53879584 98,45966798 99,71165917 100,0470418 98,92249687 99,97545497 100,4084709 100,6088815 99,35240297 99,42537231 100,2717267 99,47635611 0,999573725 0,9965983 0,998801058 1,000496033 0,999975277 0,996788391 0,998716005 1,00041492 1,000167657 0,997365394 0,999636913 1,001303222 1,000833297 0,997560775 0,99944328 1,000823858 1,000880751 0,998705368 1,001266303 1,002575875 1,001688592 0,998609519 1,000508427 1,001703103 1,001233976 0,998469992 1,000498749 1,001728841 1,001108185 0,998150224 20 99,9573725 99,65983004 99,88010577 100,0496033 99,99752768 99,67883912 99,87160053 100,041492 100,0167657 99,73653939 99,96369126 100,1303222 100,0833297 99,75607748 99,94432799 100,0823858 100,0880751 99,87053676 100,1266303 100,2575875 100,1688592 99,86095192 100,0508427 100,1703103 100,1233976 99,8469992 100,0498749 100,1728841 100,1108185 99,81502242 Años 1995 2T 3T 4T 1996 2T 3T 4T 1997 2T 3T 4T 1998 2T 3T 4T 1999 2T 3T 4T 2000 2T 3T 4T 2001 2T 3T 4T 2002 2T 3T 4T 2003 1T 1T 1T 1T 1T 1T 1T 1T 1T serie desest./ tendencia= Ct*At 0,898425319 0,89302162 0,884429823 0,875092423 0,862446383 0,853714694 0,841285611 0,832310152 0,819580548 0,812603899 0,805255924 0,801846692 0,791691364 0,79670192 0,801860086 0,809199576 0,814565613 0,829248074 0,84355501 0,861939035 0,877223783 0,899787817 0,923479484 0,941444539 0,968044144 0,989941304 1,011887244 1,031856203 1,065714219 1,093687146 1,136568692 1,157290088 1,196522108 Estimación de la componente cı́clica, Ct ( %) 89,85129217 89,10588275 88,32449292 87,38341965 86,35278043 85,27869939 84,20809806 83,15839018 82,19413414 81,3629698 80,63356175 80,08617223 79,84494953 79,89441261 80,27225178 80,9650068 81,89302027 83,07345005 84,51592042 86,18089434 88,06169706 90,05457179 92,1836451 94,44581819 96,67783377 98,91307656 101,2640983 103,7817973 106,6371384 109,76358 112,9666022 Estimación de la componente accidental, At ( %) 99,9902503 100,2202764 100,1341524 100,1439891 99,87476702 100,1087846 99,90554714 100,0873333 99,71277831 99,87392307 99,86609874 100,1229887 99,15359313 99,71935387 99,8925617 99,94435967 99,46703761 99,82107077 99,81019033 100,0150952 99,61468066 99,91583983 100,1782348 99,68091308 100,1309303 100,0819445 99,925567 99,42554765 99,93837375 99,64025819 100,6110363 serie original yt/ (media móvil yt * At) 1,000158779 1,001494849 1,001067191 0,998205127 1,000268531 1,001603665 1,001108522 0,998206989 1,00022401 1,00151345 1,000990933 0,99805026 0,999997657 1,00123067 1,000672961 0,997728321 0,999692625 1,00097626 1,000464276 0,997530484 0,999511812 1,000857743 1,000387397 0,997482211 0,999506487 1,000888992 1,00042456 0,997473921 0,999425275 1,000782851 1,000349985 Cuadro 4: Calculo de la componente estacional y accidental 21 Estimación de la componente estacional,Et( %) 100,0158779 100,1494849 100,1067191 99,82051269 100,0268531 100,1603665 100,1108522 99,82069886 100,022401 100,151345 100,0990933 99,80502599 99,99976565 100,123067 100,0672961 99,77283212 99,96926252 100,097626 100,0464276 99,75304839 99,95118121 100,0857743 100,0387397 99,74822113 99,95064866 100,0888992 100,042456 99,74739209 99,94252755 100,0782851 100,0349985 2.5. Representación de las componentes de la serie Después de realizar los cálculos oportunos (descritos anteriormente) para el cálculo de cada una de las componentes de la serie, obtenemos la gráfica 1, Figura 1: serie temporal del precio medio de la vivienda donde están representados: en el eje izquierdo, la serie original y la tendencia, y en el eje derecho la componente cı́clica, la accidental y la estacional. 22 3. Serie del MIBOR En este apartado vamos a estudiar la serie del MIBOR, que está estrechamente ligada con el precio de la vivienda, pues es una ayuda indispensable para poder financiarla. Veamos en primer lugar la definición de este concepto económico. Cuando acudimos a una entidad bancaria para pedir un crédito hipotecario, las condiciones que nos ofrecen determinan la cantidad de dinero que tendremos que reintegrar al banco. Los tipos de hipoteca son: Hipotecas a plazo fijo: se establece una cuota fija para todo el plazo del préstamo. Hasta amortizar la hipoteca pagamos la misma cantidad mes a mes. La desventaja que tiene es que el tiempo de amortización (entre 10 y 15 años) es muy inferior al que ofrecen las hipotecas variables que oscila entre 20 y 30 años. Hipotecas a tipo variable: la cantidad a pagar depende de un ı́ndice de referencia acordado con el banco y revisado regularmente. Si el ı́ndice se encarece, nosotros como titulares del crédito pagamos más, y si su valor disminuye nuestra amortización también lo hará. En caso de pedir un préstamo a interés variable, conviene elegir la variable oficial en función de la cual el tipo de interés cambiará, o sea el ı́ndice de referencia oficial, i.e., aquellos que publica mensualmente el Banco de España en el Boletı́n Oficial del Estado para los préstamos hipotecarios a tipo variable destinados a la adquisición de vivienda. En este trabajo vamos trabajar con el MIBOR, vulgarmente se podrı́a decir que el MIBOR es como el tipo de interés al que los bancos se prestan dinero entre sı́ en el mercado intercambiario de Madrid. Por ello, es natural que se añada un diferencial al MIBOR, dado que en él radica la ganancia del banco. Este tipo ha dejado de tener la consideración de tipo de referencia oficial del mercado hipotecario para las operaciones formalizadas después del 1 de enero de 2000. A partir de esta fecha se empezó a utilizar el EURIBOR (Europe Interbank Offered Rate), se elabora de igual forma que el MIBOR, pero en referencia a las operaciones realizadas entre los principales bancos europeos (con orientación internacional), entre ellos los españoles BBVA, Caja Postal y Banco Hipotecario S.A. Media simple de los tipos de interés diarios, aplicados para las operaciones cruzadas al plazo de 1 año, en el mercado de depósitos interbancarios de la zona de la Unión Monetaria, entre las 64 entidades financieras con mayor nivel de negocio. En primer lugar, como ya vimos en la serie del precio medio de la vivienda, veremos a qué tipo de hipótesis se ajusta nuestro modelo. Para ello, según lo visto en la sección 1.2, calcularemos las series del cociente y de las diferencias entre dos observaciones consecutivas de la misma estación. Veamos la tabla 5 donde aparece la serie original, la de las diferencias y la de los cocientes estacionales, estos datos han sido proporcionados por el Banco de España. 23 Años 1987 1T 2T 3T 4T 1988 1T 2T 3T 4T 1989 1T 2T 3T 4T 1990 1T 2T 3T 4T 1991 1T 2T 3T 4T 1992 1T 2T 3T 4T 1993 1T 2T 3T 4T 1994 1T 2T 3T 4T 1995 1T 2T 3T 4T MIBOR 12,42 15,88 15,56 14,43 11,86 10,94 11,17 13,26 15,10 15,01 15,02 15,28 15,71 15,39 15,41 15,26 14,82 12,63 12,53 12,68 12,62 12,62 13,73 14,27 13,38 11,80 9,78 8,69 8,09 7,97 8,57 9,14 10,29 10,36 9,94 9,40 Diferencia estacional Cociente estacional -0,55 -4,94 -4,39 -1,17 3,24 4,07 3,86 2,02 0,61 0,38 0,39 -0,01 -0,89 -2,76 -2,89 -2,58 -2,20 -0,01 1,21 1,59 0,76 -0,82 -3,95 -5,57 -5,29 -3,83 -1,21 0,45 2,20 2,39 1,37 0,26 0,96 0,69 0,72 0,92 1,27 1,37 1,35 1,15 1,04 1,03 1,03 1,00 0,94 0,82 0,81 0,83 0,85 1,00 1,10 1,13 1,06 0,94 0,71 0,61 0,60 0,68 0,88 1,05 1,27 1,30 1,16 1,03 24 Años 1996 1T 2T 3T 4T 1997 1T 2T 3T 4T 1998 1T 2T 3T 4T 1999 1T 2T 3T 4T 2000 1T 2T 3T 4T 2001 1T 2T 3T 4T 2002 1T 2T 3T 4T 2003 1T 2T 3T MIBOR 8,50 7,43 7,15 6,35 5,62 5,26 5,11 4,81 4,30 4,21 4,01 3,50 3,04 2,72 3,17 3,69 4,09 4,72 5,18 5,10 4,54 4,42 4,06 3,28 3,62 3,89 3,44 3,01 2,55 2,25 2,21 Varianza desv.tipica media desv.tı́pica/media Diferencia estacional -1,79 -2,93 -2,79 -3,05 -2,88 -2,17 -2,04 -1,55 -1,32 -1,05 -1,10 -1,31 -1,26 -1,49 -0,84 0,19 1,05 2,00 2,01 1,41 0,44 -0,30 -1,12 -1,81 -0,92 -0,53 -0,62 -0,27 -1,07 -1,64 -1,23 4,41 2,10 -0,66 -3,169878759 Cociente estacional 0,83 0,72 0,72 0,68 0,66 0,71 0,71 0,76 0,77 0,80 0,79 0,73 0,71 0,65 0,79 1,06 1,35 1,74 1,64 1,38 1,11 0,94 0,78 0,64 0,80 0,88 0,85 0,92 0,70 0,58 0,64 0,07 0,26 0,93 0,274383123 Cuadro 5: Método de las diferencias y cociente estacionales 25 En este caso cuando hallamos el coeficiente de variación=desv.tı́pica/media al tomar valores absolutos tenemos de nuevo que el coeficiente del cociente es menor que el de las diferencias, por lo tanto nos encontramos otra vez con un modelo serie temporal sujeta a la hipótesis multiplicativa, como la mayorı́a de series temporales económicas. Pero utilizaremos esta serie como ejemplo para el cálculo de las componentes de una serie bajo un modelo sujeto a la hipótesis aditiva. 3.1. Cálculo de la tendencia El método utilizado en este caso es el de los mı́nimos cuadrados. Este método, como ya vimos en la sección 2.1, expresa la tendencia a través de una función matemática que relaciona la magnitud que se está estudiando con el tiempo t, que actúa como variable independiente. En primer lugar conviene representar gráficamente la serie temporal observada, con objeto de decidir que tipo de función es la más adecuada: de tipo lineal, parabólico, etc. En nuestro caso trataremos con el ajuste lineal. La recta resultante será la tendencia. 3.2. Cálculo de la componente estacional Una vez calculada la tendencia ajustada a una recta y t = a + bt, el coeficiente angular b de la recta nos mide el incremento medio anual de la tendencia, que influirá de distinta forma al pasar de una estación a otra, como veremos más adelante. Con los datos observados se calculan las medias estacionales (M1 ,M2 ,. . . ,etc) con objeto de eliminar la componente accidental. Estas medias aritméticas son brutas, ya que siguen incluyendo las componentes a largo plazo (tendencia y ciclo) y tienen que someterse a una corrección de las mismas. Empleando el incremento medio anual dado por el coeficiente de la recta de regresión, se 0 0 obtienen las medias estacionales corregidas de las componentes a largo plazo (M1 ,M2 ,. . . ,etc.) bajo el esquema aditivo (se resta): 0 M1 = M 1 , ya que estamos en la primera estación y no está influida por la tendencia 0 M2 = M2 − 2b , n estaciones o ya que hemos pasado de la primera estación a la segunda, hay que restar la parte proporcional del incremento anual de la tendencia. Para la r-ésima estación la media estacional corregida de la tendencia interestacional será: rb 0 Mr = Mr − no estaciones 26 . Los ı́ndices de variación estacional se obtienen con la misma sistemática utilizada bajo la hipótesis multiplicativa en el método de la razón a la media móvil: con las medias estacionales 0 corregidas se obtiene la media aritmética anual M A, que sirve de base para calcular los ı́ndices en tantos por 100: 0 0 M M I1 = 0 1 ∗ 100 I2 = 0 2 ∗ 100 . . . , etc. MA MA Obtenidos los ı́ndices de variación estacional, estamos en condiciones de desestacionalizar la serie como ya hicimos anteriormente. Y por último, para calcular la componente estacional, restaremos esta serie desestacionalizada a la serie original. 3.3. Cálculo de la componente cı́clica Como ya sabemos de todas las componentes mencionadas, la componente cı́clica es la más difı́cil de detectar, puesto que, a diferencia de la tendencia, que es un movimiento a largo plazo muy general, y de las variaciones estacionales, que tienen un periodo fijo, las variaciones cı́clicas tienen un periodo no fácilmente identificable y, en muchos casos, incluso variable. Todo ello aconseja eliminar de la serie la tendencia y las variaciones estacionales, limitando el análisis a la parte de la serie no imputable a ninguna de estas componentes, que llamaremos xik = cik + aik (para simplificar la notación vamos a eliminar el doble subı́ndice, puesto que ya no existe variación estacional, y considerar xt simplemente). Obtenida esta serie intentaremos detectar los ciclos mediante lo que se conoce como análisis armónico. Sabemos que una onda armónica pura puede ser representada por una ecuación de la forma Xj = A cos(ωj ) + B sin(ωj ), o de forma equivalente Xj = R cos(ωj − α). Ambas formulas están ligadas por R= √ A2 + B 2 , α = arctgB/A. En nuestro análisis estamos interesados en conocer los valores de A, B y ω, o lo que es lo mismo, de R, α y de ω. A R se le llama amplitud, que proporciona el valor máximo de Xj . 27 La aplicación de esta idea al análisis de la componente cı́clica se basa en tratar de identificar alguna función de esta forma a los datos. Ası́, para detectar la existencia de un ciclo de periodo p, formemos un cuadro de la forma: 1.a oscilación 2.a oscilación ... esima q. oscilación medias x1 xp+1 ... x2 xp+2 ... x(q−1)p+1 xm1 x(q−1)p+2 xm2 ... xp ... x2p ... ... ... xqp ... xmp donde la fila j-ésima recoge los p valores que forman la j-ésima oscilación y el número de observaciones de la serie xt por el periodo p. En la última fila figura el valor medio de los primeros elementos de cada oscilación, el valor medio de los segundos, etc., y su cálculo constituyen el segundo paso de este método. A continuación ajustamos a los datos medios una expresión de la forma xt = A0 + A cos( 2π 2π j) + B sin( j) j = 1, 2, . . . , p, p p donde incluimos la constante A0 para mejorar el ajuste. Este ajuste se puede hacer mediante el método de los mı́nimos cuadrados, dando como resultado: A0 = p X xj j=1 p , p 2πj 2X xj cos( ), A= p j=1 p p 2X 2πj B= xj sin( ), p j=1 p y una vez conocidos A y B podemos obtener la amplitud R correspondiente a ese periodo. 3.4. Cálculo de la componente accidental Calcularemos la componente accidental simplemente restándole a la serie original todas las componentes ya calculadas, i.e., la componente estacional, la tendencia y la componente cı́clica. 28 3.5. Representación de las componentes de la serie Después de realizar los cálculos oportunos (descritos anteriormente) para el cálculo de cada una de las componentes de la serie, obtenemos la gráfica 2. Figura 2: Serie temporal del ı́ndice de referencia MIBOR. 29 t=tiempo 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 SUMA MEDIAS yt =precio medio anual t0 yt * t0 317,27 -8 -2538,16 396,61 -7 -2776,25 488,98 -6 -2933,85 565,38 -5 -2826,88 646,34 -4 -2585,35 637,67 -3 -1913,02 635,14 -2 -1270,29 639,63 -1 -639,63 661,73 0 0,00 674,10 1 674,10 684,81 2 1369,61 716,63 3 2149,90 792,29 4 3169,16 907,20 5 4535,99 1046,91 6 6281,43 1220,93 7 8546,49 1400,76 8 11206,08 12432,35 0 20449,34 731,31 0 1202,90 t02 64 49 36 25 16 9 4 1 0 1 4 9 16 25 36 49 64 408 24 yt ∗ t02 100660,25 157297,51 239096,55 319648,89 417752,16 406626,22 403406,00 409123,34 437883,28 454410,81 468957,89 513562,14 627723,44 823007,30 1096010,08 1490663,96 1962128,58 10327958,41 607526,97 Regresión 328,50 378,62 428,74 478,86 528,98 579,10 629,22 679,34 729,46 779,58 829,70 879,82 929,94 980,06 1030,18 1080,30 1130,42 Cuadro 6: Regresión simple del precio medio de la vivienda en el tiempo 4. 4.1. Regresión y correlación Regresión y correlación lineal simple En esta sección vamos a aplicar la regresión simple a las dos series, la del precio medio de la vivienda y la del MIBOR, estudiadas anteriormente. En ambos casos como variable exógena o independiente, el tiempo y como variable endógena o dependiente, el precio de la vivienda y el MIBOR respectivamente. Como ya vimos en la sección 2.1, utilizando el método de los mı́nimos cuadrados para determinar la recta de regresión, los coeficientes de la recta vienen dados según las ecuaciones 0 3 y 4. Primero hacemos el cambio de variable t = t − Ot = t − 1995. Veamos los cálculos en la tabla 6. Para poder calcular la recta de regresión tenemos que 30 calcular los coeficientes de esta recta, que como ya vimos en la sección 2.1 son los siguientes; Pn yt 12432,35 = 731,31, a = t=1 = n 17 Pn 0 yt t 20449,34 b = Pt=1 = 50, 12, n 02 = 408 t0 =1 t 0 yt = a+bt = a+b(t−Ot ) = 731,31+50,12(t−1995) = 731,31+50,12t−99991,26 = 50,12t−99259,94. El nivel de fiabilidad nos lo da el coeficiente de correlación; R2 = (1202,90)2 1446974,07 (St0 yt )2 = = = 0,83. 2 2 St0 Syt 24 · 72705,55 28869,66 Siendo los cálculos de la covarianza y las varianzas: St0 yt N 1 X 0 20449,34 = − 0 = 1202,90, ti yti − t0 · yt = N i=1 17 St20 Sy2t N 1 X 0 2 408 = − 0 = 24, (ti ) − (t0 )2 = N i=1 17 2 N 12432,35 10327958,41 1 X 2 2 − = y − (yt ) = = 72705,55. N i=1 ti 17 17 Por lo tanto según los cálculos realizados, obtenemos como recta de regresión yt = 50,1209t − 99259,9432 y el coeficiente de determinación obtenido es R2 = 0,83. Ası́ que obtendrı́amos una predicción para el precio medio de la vivienda en el año 2004 de; y2004 = 50,1209 · 2004 − 99259,9432 = 1182,34. Veamos ahora la tabla 7 correspondiente para la serie del MIBOR; Basándonos de nuevo en las fórmulas de la sección 2.1 obtenemos; Pn yt 147,13 = 8,65, a = t=1 = n 17 Pn 0 yt t −356,08 t=1 b = Pn = −0,87, 02 = 0 408 t =1 t 0 yt = a+bt = a+b(t−Ot ) = 8,65−0,87(t−1995) = 8,65−0,87t−1741,11 = −0,87t−1749,77. 31 t=tiempo 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 SUMA MEDIAS yt =MIBOR (media anual) t0 yt * t0 t02 14,56933333 -8 -116,5546667 64 11,80658333 -7 -82,64608333 49 15,102 -6 -90,612 36 15,44283333 -5 -77,21416667 25 13,1645 -4 -52,658 16 13,309 -3 -39,927 9 10,91333333 -2 -21,82666667 4 8,443166667 -1 -8,443166667 1 9,997333333 0 0 0 7,356 1 7,356 1 5,197916667 2 10,39583333 4 4,004916667 3 12,01475 9 3,154916667 4 12,61966667 16 4,773083333 5 23,86541667 25 4,076666667 6 24,46 36 3,489 7 24,423 49 2,333777778 8 18,67022222 64 147,1343611 0 -356,0768611 408 8,654962418 0 -20,94569771 24 yt ∗ t02 212,2654738 139,39541 228,070404 238,4811014 173,3040603 177,129481 119,1008444 71,28706336 99,94667378 54,110736 27,01833767 16,03935751 9,953499174 22,78232451 16,61921111 12,173121 5,446518716 1623,123618 95,47785986 Cuadro 7: Regresión simple del MIBOR en el tiempo 32 Regresión 15,63686166 14,76412425 13,89138685 13,01864944 12,14591204 11,27317463 10,40043723 9,527699823 8,654962418 7,782225014 6,909487609 6,036750204 5,1640128 4,291275395 3,41853799 2,545800586 1,673063181 El nivel de fiabilidad nos lo da el coeficiente de correlación; R2 = (−20,94)2 438,72 (St0 yt )2 = = = 0,89. 2 2 St0 Syt 24 · 20,57 493,67 Siendo los cálculos de la covarianza y las varianzas: St0 yt N 1 X 0 −356,07 = − 0 = −20,94, ti yti − t0 · yt = N i=1 17 St20 Sy2t N 1 X 0 2 408 = − 0 = 24, (ti ) − (t0 )2 = N i=1 17 2 N 1623,13 12432,35 1 X 2 2 − = y − (yt ) = = 20,57 N i=1 ti 17 17 Por lo tanto según los cálculos realizados, obtenemos como recta de regresión yt0 = −0,8792t + 1749,7661 y el coeficiente de determinación obtenido es R2 = 0,89. De modo que obtenemos una predicción del MIBOR para el año 2004 de; 0 y2004 = −0,8792 · 2004 + 1749,7661 = 0,8792. Nota histórica; ¿Por qué denominamos este proceso análisis de regresión? A principios de siglo, el cientı́fico de genética Francis Galton descubrió un fenómeno llamado regresión a la medida. Buscando leyes de herencia genética, descubrió que la estatura de los hijos solı́a ser una regresión a la estatura media poblacional, en comparación con la estatura de sus padres. Los padres altos solı́an tener hijos algo más bajos, y viceversa. Galton desarrolló el análisis de regresión para estudiar este fenómeno. Al que se refirió de manera optimista como regresión a la mediocridad”. 33 4.2. Regresión y correlación lineal múltiple La regresión múltiple es la generalización de la regresión simple para el caso en que tengamos más de una variable explicativa. Pretendemos explicar el comportamiento de una variable explicativa, a la que denominaremos dependiente. Para ello no será suficiente una única variable como hacı́amos en en la regresión simple, necesitaremos ampliar el número de variables que utilizamos para explicar los cambios que se producen en la variable dependiente. En nuestro caso trabajaremos con dos variables independientes o explicativas. Debemos tener en cuenta que la naturaleza de la mayorı́a de los fenómenos económicos estudiados es compleja y necesitaremos más de una variable independiente para poder analizar dichos fenómenos. En este trabajo trataremos de explicar el comportamiento del precio medio de la vivienda (variable dependiente), ya no sólo mediante la variable tiempo, sino también con variables tales como el IPC (ı́ndice de precios al consumo) y el MIBOR. También podrı́amos haber elegido muchas otras variables de tipo económica, como por ejemplo la tasa de desempleo del paı́s, el PIB (producto interior bruto)...etc Veamos ahora el ajuste de un plano mediante el método mı́nimo-cuadrático; Se parte de la nube de puntos tridimensionales en la que se recogen las observaciones de las tres variables que vamos a utilizar. En nuestro caso tomaremos siempre como variable dependiente, yi , el precio medio de la vivienda, y como variables independientes, x1i y x2i vamos a ir alternando entre el tiempo, IPC y el MIBOR. Ahora ajustaremos la ecuación de un plano a esta nube de puntos, (yi , x1i , x2i ); y = b0 + b1 x 1 + b2 x 2 . El sistema de ecuaciones normales surge al minimizar la expresión; S= N X (yi − b0 − b1 x1i − b2 x2i )2 . i=1 Derivando esta expresión con respecto al término independiente b0 obtenemos la primera ecuación normal; N X i=1 yi = N b0 + b1 N X x1i + b2 N X i=1 x2i . i=1 Dividiendo esta expresión por N y despejando la b0 obtenemos; b0 = Y − b1 X1 − b2 X2 . 34 De igual forma derivando respecto a b1 y b2 obtendremos; b1 = Sy Ryx1 − Ryx2 Rx1 x2 · , S x1 1 − Rx2 1 x2 b2 = Sy Ryx2 − Ryx1 Rx1 x2 · . S x2 1 − Rx2 1 x2 Para el cálculo de b1 y b2 necesitaremos conocer las varianzas marginales; Sy2 N N N 1 X 2 1 X 2 1 X 2 2 2 2 2 = y − y , Sx1 = x − x1 , Sx2 = x − x2 2 , N i=1 i N i=1 1i N i=1 2i Ası́ como las covarianzas; Syx1 N N N 1 X 1 X 1 X = yi x1i − y · x1 , Syx2 = yi x2i − y · x2 , Sx1 x2 = x1i x2i − x1 · x2 , N i=1 N i=1 N i=1 y los coeficientes de correlación lineal simple; Ryx1 = Syx1 Syx2 S x1 x2 , Ryx2 = , Rx1 x2 = . S y · S x1 S y · S x2 S x1 · S x2 Para determinar ahora los coeficientes de determinación y correlación múltiples necesitamos calcular la varianza explicada y la residual. Partimos de la expresión 2 Sy2 = Sy20 ·x1 x2 + Sry·x , 1 x2 (5) donde Sy2 es la varianza de la variable dependiente observada yt . Llamemos yt0 a la serie obtenida una vez estimado el modelo, de modo que Sy20 ·x1 x2 es la varianza de la variable endógena yt explicada por la regresión. El tercer elemento de la expresión 5 es el residuo que también tiene su correspondiente variabilidad, que vamos a medir a través de lo que 2 llamamos varianza residual o varianza de los errores o residuos Sry·x . 1 x2 Según la propia definición de varianza residual y haciendo una serie de cálculos, obtenemos; 2 Sry·x = Sy2 − b1 Syx1 − b2 Syx2 , 1 x2 y despejando obtenemos la varianza explicada; 2 Syt ·x1 x2 = Sy2 − Sry·x . 1 x2 35 Ası́ que el coeficiente de determinación múltiple viene dado por la siguiente expresión; 2 = Ry·x 1 x2 Sy2 Sy2t ·x1 x2 , Ry·x1 x2 = q 2 Ry·x . 1 x2 Como ya sabemos este coeficiente nos da la medida de la relación existente entre la variable dependiente y el conjunto de las variables independientes. De manera estricta, el coeficiente de correlación múltiple nos mide la correlación existente entre la variable y y las predicciones que hacemos de la misma mediante la ecuación de regresión, es decir, nos indica el grado de fiabilidad del modelo. También podrı́amos estudiar como influye cada variable en el modelo por separado, y para ello tenemos que calcular los coeficientes de determinación y correlación parcial. Por ejemplo, el coeficiente de determinación parcial Ryx1 ·2 estudia las causas comunes que tienen las variables yti y x1i , permaneciendo constantes las que tengan yti y x2i , es decir, una vez que se ha efectuado la regresión de yti sobre x2i . Se calculan según la siguiente fórmula; 2 Ryx = 1 ·x2 (Ryx1 − Ryx2 · Rx1 x2 )2 , 2 ) (1 − Rx2 1 x2 )(1 − Ryx 2 2 Ryx = 2 ·x1 (Ryx2 − Ryx1 · Rx1 x2 )2 . 2 ) (1 − Rx2 1 x2 )(1 − Ryx 1 Apliquemos este modelo de regresión múltiple a nuestro ejemplo, tomando como variable dependiente el precio medio de la vivienda y como variables independientes el IPC (tomando esta serie como la de los incrementos producidos con base enero de 1987, desde este año al 2003) y el tiempo (desde el año 1987 hasta el 2003). En la tabla 8 vemos los cálculos necesarios para la obtención del plano de regresión y los coeficientes de correlación y determinación. La penúltima fila de esta tabla recoge la suma de todas las filas y la última la media de cada columna. 36 Yi 317,27 396,61 488,98 565,38 646,34 637,67 635,14 639,63 661,73 674,10 684,81 716,63 792,29 907,20 1046,91 1220,93 1400,76 12432,35 731,31 X1i 2,25 7,45 14,65 22,28 29,38 37,20 43,43 49,93 57,15 62,55 65,53 68,60 72,78 78,78 85,13 91,65 97,03 885,73 52,10 X2i 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 33915 1995 Yi2 100658,7 157297,5 239096,5 319648,9 417752,2 406626,2 403406,0 409123,3 437883,3 454410,8 468957,9 513562,1 627723,4 823007,3 1096010,1 1490663,9 1962128,6 10327956,8 607526,9 2 X1i 5,1 55,5 214,6 496,2 862,9 1383,8 1885,7 2492,5 3266,1 3912,5 4293,5 4705,9 5296,2 6205,5 7246,3 8399,7 9415,5 60137,6 3537,5 2 X2i 3948169 3952144 3956121 3960100 3964081 3968064 3972049 3976036 3980025 3984016 3988009 3992004 3996001 4000000 4004001 4008004 4012009 67660833 3980049 Yi X1i 713,85 2954,73 7163,48 12593,73 18986,16 23721,42 27581,06 31933,40 37817,73 42164,96 44871,85 49160,99 57658,90 71464,48 89117,79 111898,01 135920,41 765722,95 45042,53 Yi X2i 630410,52 788455,71 972571,28 1125096,25 1286857,96 1270243,62 1265839,00 1275417,24 1320146,36 1345503,60 1367555,59 1431831,74 1583787,71 1814395,00 2094856,91 2444296,86 2805722,28 24822987,61 1460175,74 Cuadro 8: Regresión múltiple del precio medio de la vivienda sobre el tiempo y el IPC 37 X1i X2i 4470,75 14810,60 29138,85 44327,25 58485,63 74102,40 86546,03 99550,45 114014,25 124849,80 130853,43 137062,80 145477,23 157550,00 170335,13 183483,30 194357,77 1769415,64 104083,27 Yi=Precio medio X1i =IPC 317,27 2,25 396,61 7,45 488,98 14,65 565,38 22,28 646,34 29,38 637,67 37,20 635,14 43,43 639,63 49,93 661,73 57,15 674,10 62,55 684,81 65,53 716,63 68,60 792,29 72,78 907,20 78,78 1046,91 85,13 1220,93 91,65 1400,76 97,03 X2i =Años 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 Regresión 359,35 415,10 452,91 486,90 525,60 557,79 604,34 648,43 686,01 739,97 815,69 890,51 955,47 1004,04 1049,47 1093,33 1147,44 Cuadro 9: Resultados del hiperplano de regresión En la tabla 9 observamos los valores obtenidos en el plano de regresión; Veamos ahora los coeficientes del plano de regresión ası́ como los coeficientes de determinación y correlación que obtenemos, usando las fórmulas anteriores. Para ello necesitaremos conocer las varianzas marginales; Sy2 N 1 X 2 = y − y 2 = 607526,87 − (731,31)2 = 72705,67, N i=1 i Sx21 = N 1 X 2 x − x1 2 = 3537,51 − (52,10)2 = 822,89, N i=1 1i Sx22 = N 1 X 2 x − x2 2 = 3980049 − (1995)2 = 24, N i=1 2i las desviaciones tı́picas, Sy = p 72705,67 = 269,64, 38 S x1 = Sx2 p 822,89 = 28,69, √ = 24 = 4,90, las covarianzas; N 1 X yi x1i − y · x1 = 45042,53 − (731,31 · 52,10) = 6939,60, = N i=1 Syx1 Syx2 N 1 X = yi x2i − y · x2 = 1460175,74 − (731,31 · 1995) = 1202,90, N i=1 S x1 x2 N 1 X x1i x2i − x1 · x2 = 104083,27 − (52,10 · 1995) = 139,86, = N i=1 y los coeficientes de correlación lineal simple; Ryx1 = Syx1 6939,60 = 0,90, = S y · S x1 269,64 · 28,69 Ryx2 = 1202,90 Syx2 = = 0,91, S y · S x2 269,64 · 4,90 R x1 x2 = S x1 x2 139,86 = 0,99. = Sx1 · Sx2 28,69 · 4,90 Hay que resaltar que estos coeficientes de correlación lineal simple, sólo se calculan para emplearlos en las expresiones que nos determinan el coeficiente de regresión parcial b1 y b2 . Al existir una fuerte correlación o multicolinealidad en sentido amplio entre x1i y x2i , pues Rx1 x2 = 0,99, los Ryx1 y Ryx2 no nos pueden explicar el grado de dependencia entre la variable endógena y cada una de las exógenas por separado. Para ello x1i y x2i tendrı́an que estar incorreladas, cosa que no suele ocurrir en la evolución de caracterı́sticas socioeconómicas. Lo que hay que perseguir es que la correlación entre las variables explicativas sea la menor posible, con objeto de que b1 y b2 representen con la mayor nitidez posible las variaciones de yti ante variaciones unitarias de las variables explicativas. Veamos los coeficientes de regresión parcial y su significado, b1 = 269,64 0,90 − (0,91 · 0,99) Sy Ryx1 − Ryx2 Rx1 x2 · = · = −8,98, 2 S x1 1 − R x1 x2 28,69 1 − (0,99)2 b2 = Sy Ryx2 − Ryx1 Rx1 x2 269,64 0,91 − (0,90 · 0,99) · · = 102,42, S x2 1 − Rx2 1 x2 4,90 1 − (0,99)2 39 b0 = Y − b1 X1 − b2 X2 = 731,31 − (−8,98) · 52,10 − (102,42) · 1995 = −203138,62. El coeficiente b1 es la derivada parcial de yti respecto de x1i y significa que al variar x1i en una unidad, permaneciendo constante x2i , la yti varı́a en -8.98, esto quiere decir que si el IPC subiera un punto porcentual dejando constante el año, entonces el precio medio de la vivienda disminuirı́a en 8,98 euros. Esta falta de pureza en el resultado es debido, como ya mencionamos antes, a la elevada multicolinealidad entre las variables explicativas. b2 nos indica la variación de yti cuando la x2i varı́a en una unidad, permaneciendo constante x1i , i.e., el precio medio de la vivienda aumenta en 102,42 euros cuando se incrementa el tiempo en un año y se mantiene constante el IPC. El plano obtenido es Y = −203138,62 − 8,98X1 + 102,42X2 , y para determinar el coeficiente de correlación múltiple necesitamos calcular, 2 Sry·x = Sy2 − b1 Syx1 − b2 Syx2 = 72705,67 − (−8,98) · 6939,60 − 102,42 · 1202,90 = 11783,22, 1 x2 2 Syt ·x1 x2 = Sy2 − Sry·x = 72705,67 − 11783,22 = 60922,45. 1 x2 Ası́ que el coeficiente de determinación múltiple viene dado por la siguiente expresión; 2 Ry·x = 1 x2 Ry·x1 x2 Sy2 = 60922,45 = 0,84, 72705,67 Sy2t ·x1 x2 q p 2 = Ry·x = 0,84 = 0,92. 1 x2 Significa que el grado de dependencia global entre el precio medio de la vivienda en relación al tiempo y al IPC es de un 92 %. Veamos los coeficientes de determinación y correlación parciales; 2 Ryx = 1 ·x2 (090 − 0,91 · 0,99)2 (Ryx1 − Ryx2 · Rx1 x2 )2 = 0,05, = 2 ) (1 − Rx2 1 x2 )(1 − Ryx (1 − (0,99)2 )(1 − (0,91)2 ) 2 lo que significa que una vez que hemos realizado la regresión del precio medio de la vivienda 2 sobre el tiempo, quedará una varianza residual o no explicada, Sry·2 , que debe reducirse a la introducción en el modelo de la variable IPC, lo que quiere decir que al introducir la variable IPC la varianza residual queda explicada en un 0.05 % (es decir, no tiene mucha influencia). De la misma forma 2 Ryx = 2 ·x1 (Ryx2 − Ryx1 · Rx1 x2 )2 (0,91 − 0,90 · 0,99)2 = 0,17, 2 ) (1 − (0,99)2 )(1 − (0,90)2 ) (1 − Rx2 1 x2 )(1 − Ryx 1 40 es decir, una vez hecha la regresión del precio medio de la vivienda sobre el IPC, la varianza residual quedará explicada en un 17 % al introducir la variable tiempo al modelo. Podemos concluir diciendo que la variable tiempo tiene una mayor influencia en la evolución del precio medio de la vivienda que el IPC. Por último, veamos una pequeña tabla con distintos valores del IPC para ver las predicciones posibles para el año 2004. IPC=X1i 99 100 101 102 103 104 Año=X2i 2004 2004 2004 2004 2004 2004 Regresión 1232,22 1223,24 1214,27 1205,29 1196,31 1187,34 Los resultados obtenidos parecen ser algo contradictorios, ya que si mantenemos fijo el año 2004 y vamos variando el IPC, deberı́a ocurrir que el precio medio de la vivienda, al aumentar el IPC, aumentase, pero no es ası́, ya que el coeficiente del plano de regresión asociado a la variable x1i es negativo. Esto se debe en gran medida al coeficiente de correlación parcial Ryx1 ·x2 =0.05, es decir la influencia que tiene el IPC en el modelo si incluimos esta variable una vez ya hecha la regresión del precio medio de la vivienda sobre el tiempo. Al igual que hemos obtenido este plano de regresión tomando estas variables independientes, podrı́amos haber elegido otras, y proceder de igual forma en su cálculo. 41