Análisis descriptivo de series temporales aplicadas al precio medio

Anuncio
Análisis descriptivo de series
temporales aplicadas al precio medio
de la vivienda en España
Justo Puerto
Marı́a Paz Rivera
*
MaMaEuSch**
Management Mathematics for European Schools
94342 - CP - 1 - 2001 - DE - COMENIUS - C21
*
Universidad de Sevilla
Este proyecto ha sido desarrollado con ayuda parcial de la Unión Europea dentro del marco del programa Sócrates. El contenido no refleja necesariamente la posición de la Unión Europea ni implica ninguna
responsabilidad por parte de la Unión Europea.
**
0
1.
Series temporales
Llamamos serie temporal, cronológica, histórica o de tiempo a una sucesión de observaciones cuantitativas de un fenómeno en el tiempo. Interesa su estudio porque permite analizar
la evolución que en el transcurso del tiempo ha experimentado una variable, tanto para construir un modelo descriptivo de la historia del fenómeno, como para predecir sus valores
futuros mediante métodos de alisado (que no estudiaremos en este trabajo).
Es importante entender que, en una serie temporal es esencial la ordenación que el tiempo
induce en los datos, de forma que cada observación deberá estar asociada a un determinado
periodo. Luego, en esencia, una serie temporal es una distribución de frecuencias bidimensional
(t, yt ) donde la variable endógena o dependiente yt es la magnitud en estudio, y la exógena
o independiente es el tiempo t. Pero, sólo existe una variable yt que constituye lo que se
conoce como modelo univariante de serie temporal que se autoexplica por su propio pasado,
no existiendo ninguna variable explicativa o exógena que nos permita establecer una relación
causa-efecto como sucede en la regresión y correlación. Se estudia el pasado histórico de yt (sus
componentes) de forma descriptiva y, bajo el supuesto de que su estructura va a permanecer
constante, se hacen predicciones para el futuro. Ası́ serán series temporales las ventas de una
empresa en cada uno de los últimos diez años, los costes financieros, la renta disponible de
los clientes potenciales, etc.
Todo análisis de series temporales ha de iniciarse con una representación gráfica de la
misma, utilizando los ejes cartesianos, de forma que en el eje de abcisas representaremos el
tiempo y en el de ordenadas, la serie observada yt , con lo que obtendremos una serie de puntos
(t, yt ) que, al unirlos, nos dan un impacto gráfico de la serie del que se pueden sacar unas
primeras conclusiones de la evolución histórica de la misma.
Antes de proseguir hemos de tener en cuenta el carácter de introducción que pretende
tener este trabajo. Intentar explicar la evolución de una variable económica a partir del simple
paso del tiempo, es algo que no nos permite ir más allá de un mero estudio descriptivo de
unos datos concretos en un intervalo de tiempo concreto. Un análisis más profundo de la
evolución temporal de una variable, tanto a partir de los valores de otra que presumiblemente
influye en ella, como de su propia historia (según sus hábitos adquiridos, tal y como sucede
con el consumo, o según capacidad máxima, caso de la producción), requiere técnicas de
análisis mucho más perfeccionadas que las que vamos a exponer a continuación, que se han de
interpretar simplemente como una primera aproximación descriptiva a las técnicas rigurosas
de análisis de series temporales que actualmente se están utilizando.
1
1.1.
Componentes de una serie temporal
En el estudio clásico de las series temporales se considera que la magnitud estudiada,
en un determinado valor y en un determinado periodo, es consecuencia de la actuación de
cuatro componentes o fuerzas, la tendencia, las variaciones cı́clicas, las variaciones
estacionales y las variaciones accidentales. Vamos a definirlas.
Tendencia (T): es una componente de la serie que refleja su evolución a largo plazo.
Este largo plazo será distinto según sea la naturaleza de la serie, pero cuántos más
periodos se tengan mejor será el análisis. Esta componente, en el conjunto de toda la
serie, puede ser de naturaleza estacionaria o constante (se representa por una paralela
al eje de abcisas), de naturaleza lineal, de naturaleza exponencial, u otras posibilidades.
Las variaciones cı́clicas (C): es una componente de la serie que recoge las oscilaciones periódicas de amplitud superior a un año. Estas oscilaciones no son regulares y
se presentan en los fenómenos económicos cuando se dan de forma alternativa etapas
de prosperidad o de depresión. Normalmente, en una serie económica se superponen
distintos ciclos de esta clase, lo que hace que en la práctica ésta sea la componente más
difı́cil de determinar. Como es natural, cuanto mayor sea el periodo de un ciclo que
afecta a nuestra variable, mayor ha de ser el número de observaciones para que aquel
sea reconocible.
Las variaciones estacionarias (E): es una componente de la serie que recoge oscilaciones que se producen en periodos de repetición iguales o inferiores a un año. Su
nombre proviene precisamente de las estaciones climatológicas. Si se considera el año
como periodo marco, de repetición pueden observarse las fluctuaciones de la magnitud a
lo largo de sus meses, trimestres, cuatrimestres, etc. Ası́ como si tomamos como periodo
de repetición el mes, podrı́amos observar las fluctuaciones de la magnitud en sus distintos dı́as, semanas, etc. El origen de las variaciones estacionales puede estar en factores
fı́sico-naturales, como son las estaciones climatológicas, o en factores culturales y de
tradición, como son las fiestas navideñas, las vacaciones, los horarios comerciales, etc.
El clima afecta a la venta de una serie de productos, los helados y refrescos se venderán
fundamentalmente en verano y la ropa de abrigo en invierno.
Las variaciones accidentales (A): es una componente de la serie temporal que recoge
las fluctuaciones erráticas que se dan por la ocurrencia de fenómenos imprevisibles, que
afectan a la variable en estudio de manera esporádica y no permanente (un pedido
extraordinario a una empresa, una huelga, una catástrofe, etc). También reciben el
nombre de variaciones irregulares, residuales o erráticas.
2
1.2.
Hipótesis de estudio
Ahora cabe hacerse una pregunta básica: ¿Cómo actúan las cuatro componentes para que
den como resultado los distintos valores de la serie observada? En el estudio clásico de las
series temporales se han manejado dos hipótesis de trabajo:
1. Los valores observados de cualquier serie temporal son el resultado de la suma de las
cuatro componentes:
yt = Tt + Ct + Et + At .
Esta expresión se conoce con el nombre de esquema o hipótesis aditiva.
2. Los valores observados de cualquier serie temporal son el resultado de la multiplicación
de las cuatro componentes:
yt = Tt ∗ Ct ∗ Et ∗ At .
Esta expresión admite variantes para recoger el supuesto de que la componente accidental o errática es independiente de las demás y no sigue ninguna regularidad periódica
como ocurre con las otras. Esta independencia implica que la componente A aparece de
forma aditiva:
yt = Tt ∗ Ct ∗ Et + At .
¿Cómo decidiremos que hipótesis seguir?
Para resolver el problema de cual debe ser el esquema o hipótesis a utilizar en cada caso,
habrá que efectuar un análisis previo de la serie. Una forma analı́tica de determinar el esquema
de trabajo más adecuado se consigue mediante el método de las diferencias y cocientes
estacionales. Veamos que entendemos por diferencia y cociente estacional:
La diferencia estacional se obtiene como diferencia entre dos datos de años consecutivos,
pero de la misma estación. La notaremos como dt,i .
dt,i = yt,i − yt−1,i .
El cociente estacional se calcula por división entre dos datos de años consecutivos, pero
de la misma estación. La notaremos como ct,i .
ct,i = yt,i /yt−1,i .
donde yt,i = valor de la serie en el año t, en la estación i.
Una vez aclarados los conceptos de diferencia y cociente estacional vamos a explicar los pasos
que habrı́a que seguir para la aplicación de este método.
3
1. Cálculo de todos los cocientes y diferencias estacionales. Lógicamente, en este cálculo
perderı́amos las observaciones correspondientes a un año.
2. Obtención del coeficiente de variación (CV) para las diferencias y cocientes estacionales
dados por las siguientes expresiones:
Desviación tı́pica(d) ,
CV (d) = media(d)
Desviación tı́pica(c) .
CV (c) = media(c)
3. Aplicar la siguiente regla de decisión:
Si CV (c) > CV (d) elegirı́amos el modelo aditivo.
Si CV (c) ≤ CV (d) elegirı́amos el modelo multiplicativo.
La obtención de las diferencias estacionales equivale a tomar la serie de incrementos interanuales. Los cocientes estacionales, sin embargo, tienen más que ver con la serie de crecimiento.
Por lo tanto lo que implı́citamente se está diciendo es que, si el crecimiento interanual para
cada estación tiene menor variabilidad que en términos de incrementos, esto indicarı́a una
asociación multiplicativa entre tendencia y estacionalidad. Si sucediera lo contrario serı́a más
plausible la hipótesis aditiva.
Nota histórica; Los primeros análisis de series económicas temporales aplicaron los instrumentos que surgieron en el ámbito de la astronomı́a y de la meteorologı́a en el siglo XVII,
cuando los estudiosos de las órbitas planetarias introdujeron la posibilidad de diferenciar entre
los distintos tipos de movimientos que aparecen en las series de datos, que reflejan cualquier
tipo de fenómeno fı́sico. Esta diferenciación se plasmó en una nueva idea para el tratamiento
de series temporales, basada en que toda serie es el resultado de la agregación de cuatro componentes denominados no observados, y que podrı́an estudiarse por separado. Este enfoque,
que comenzó a aplicarse en economı́a aproximadamente a mediados del siglo XIX, en la actualidad se conoce como el enfoque clásico de las series temporales, y supuso el punto de partida
de todo el análisis posterior de este tipo de datos económicos.
4
2.
Serie del precio medio del metro cuadrado de la
vivienda
La vivienda es un componente fundamental de la riqueza de las familias. En España el valor
de las viviendas supone en torno a 2/3 de la riqueza total de las familias y sirve de garantı́a a
casi 1/3 de los activos totales de las entidades de crédito españolas. El primer problema al que
hay que enfrentarse al analizar el precio de la vivienda es su propia definición. La vivienda
no es un bien homogéneo, sino que varı́a en función de su localización, tamaño, estructura
(viviendas unifamiliares, bloques de viviendas...), calidad de la construcción, etc. Además,
las caracterı́sticas de las viviendas existentes varı́an en el tiempo. En este trabajo, la fuente
de información utilizada para estudiar el precio medio de la vivienda ha sido elaborada por
el Ministerio de Fomento, a partir de las tasaciones realizadas por diversas sociedades de
tasaciones de todo el territorio español.
Desde 1976, el precio medio de las viviendas españolas se ha multiplicado por 16 en
términos nominales y duplicado en términos reales.
Esta estadı́stica incluye datos trimestrales desde el primer trimestre de 1987, y se distinguen las viviendas por;
Antigüedad; se refiere a la fecha en la que fueron terminadas o a la correspondiente a
la última gran rehabilitación.
Situación geográfica; factores como la intensidad de la demanda de la vivienda, los
diferentes submercados, la mayor o menor oferta, las distintas tipologı́as de la vivienda,
ası́ como la segregación social del territorio, determinan que las diferencias de precios
sean muy importantes.
Superficie construida; se entiende por superficie útil la del suelo de la vivienda cerrada
por el perı́metro definido por la cara interior de sus cerramientos con el exterior o con
otras viviendas locales de cualquier uso, incluyendo la superficie del suelo de los espacios
exteriores de uso privativo de la vivienda. A mayor superficie de vivienda más barato
costará el metro cuadrado.
Para la obtención de los precios medios se procede en dos fases:
En primer lugar, se calculan los precios medios por m2 de las viviendas de las que se ha
recibido información de una antigüedad determinada y que pertenecen al mismo código
postal. El precio medio se obtiene como media aritmética simple de los precios individuales correspondientes a cada tramo de antigüedad. En el caso de los municipios con
más de un código postal, el precio medio municipal se calcula como la media aritmética
simple de los precios medios por código postal.
5
En segundo lugar, los precios medios por m2 por municipio se ponderan por la población.
Para consultar la metodologı́a llevada a cabo en este estudio, consulten la página web del
Ministerio español de fomento http://www.mfom.es
En primer lugar, tenemos que ver a qué tipo de hipótesis se ajusta nuestro modelo. Para
ello según lo visto en la sección 1.2, calcularemos las series del cociente y de las diferencias
entre dos observaciones consecutivas de la misma estación.
En la tabla 1 se ve la serie de los precios medios del metro cuadrado desde Enero de 1987
hasta Octubre del 2003, estos datos han sido suministrados por el Ministerio de Fomento.
6
Años
1987 1T
2T
3T
4T
1988 1T
2T
3T
4T
1989 1T
2T
3T
4T
1990 1T
2T
3T
4T
1991 1T
2T
3T
4T
1992 1T
2T
3T
4T
1993 1T
2T
3T
4T
1994 1T
2T
3T
4T
1995 1T
2T
3T
4T
Precio metro cuadrado Diferencia estacional
289,89
308,64
324,99
345,55
369,13
79,24
389,79
81,15
404,39
79,40
423,12
77,57
456,58
87,45
480,17
90,38
502,72
98,33
516,43
93,31
550,40
93,82
559,73
79,56
570,77
68,05
580,60
64,17
613,42
63,02
637,90
78,17
652,80
82,03
681,23
100,63
650,49
37,07
635,70
-2,20
633,78
-19,02
630,72
-50,51
625,44
-25,05
634,83
-0,87
639,69
5,91
640,61
9,89
634,72
9,28
636,80
1,97
644,36
4,67
642,63
2,02
652,92
18,20
661,06
24,26
665,46
21,10
667,47
24,84
7
Cociente estacional
1,27
1,26
1,24
1,22
1,24
1,23
1,24
1,22
1,21
1,17
1,14
1,12
1,11
1,14
1,14
1,17
1,06
1,00
0,97
0,93
0,96
1,00
1,01
1,02
1,01
1,00
1,01
1,00
1,03
1,04
1,03
1,04
Años
1996 1T
2T
3T
4T
1997 1T
2T
3T
4T
1998 1T
2T
3T
4T
1999 1T
2T
3T
4T
2000 1T
2T
3T
4T
2001 1T
2T
3T
4T
2002 1T
2T
3T
4T
2003 1T
2T
3T
Precio metro cuadrado
669,98
674,79
675,18
676,45
677,74
683,06
686,64
691,78
694,34
709,66
723,95
738,58
755,21
780,25
803,89
829,81
857,25
891,76
926,36
953,42
994,50
1.030,77
1.065,78
1.096,57
1.148,23
1.193,66
1.254,09
1.287,73
1.349,11
1.402,57
1.450,60
varianza
desv.tı́pica
media
desv.tı́pica/media
Diferencia estacional
17,06
13,73
9,72
8,98
7,76
8,27
11,46
15,33
16,60
26,60
37,31
46,80
60,87
70,59
79,94
91,23
102,04
111,51
122,47
123,61
137,25
139,01
139,42
143,15
153,73
162,89
188,31
191,16
200,88
208,91
196,51
3.865,50
62.17
128,36
0.4843
Cociente estacional
1,03
1,02
1,01
1,01
1,01
1,01
1,02
1,02
1,02
1,04
1,05
1,07
1,09
1,10
1,11
1,12
1,14
1,14
1,15
1,15
1,16
1,16
1,15
1,15
1,15
1,16
1,18
1,17
1,17
1,18
1,16
0,01
0,09
1,10
0,0788
Cuadro 1: Método de las diferencias y cocientes estacionales
8
Como podemos observar, el coeficiente de variación (coef.variación=varianza/media) del
cociente es menor que el coeficiente de variación de las diferencias, por lo tanto nos encontramos con un modelo de serie temporal sujeta a la hipótesis multiplicativa.
Para el cálculo de estas diferencias y cocientes estacionales, como ya mencionamos anteriormente, tomaremos la observación en una estación determinada y las restaremos o dividiremos
respectivamente con su observación anterior, por lo tanto para el año 1987 no podremos calcular dichos coeficientes (pues necesitarı́amos los datos del año 1986). Y en los restantes casos
su cálculo será el siguiente,
Año
1988-1T
1988-2T
1988-3T
1988-4T
Diferencia estacional
369,13-289,89=79,24
389,79-308,79=81,15
404,39-324,99=79,40
423,12-345,55=77,57
Cociente estacional
369,13/289,89=1,27
389,79/308,79=1,26
404,39/324,99=1,24
423,12/345,55=1,22
Pasemos ahora al cálculo de cada una de las componentes de la serie. Para ello hay que
tener en cuenta que existen diversos métodos para su cálculo. En este trabajo nos limitaremos
a métodos clásicos y sencillos de descomposición de series temporales.
2.1.
Cálculo de la tendencia
Necesitamos:
1. Hallar la serie desestacionalizada:
Tomemos una media móvil centrada de la serie, de periodicidad anual, que denominaremos M Mt . La media móvil es una serie amortiguada o suavizada obtenida
por el cálculo reiterado de valores medios. Su cálculo es el siguiente:
• Partimos de la serie temporal observada yt .
• Se obtienen sucesivas medias aritméticas para cada yt con un número de observaciones anteriores y posteriores que se ha fijado de antemano (en nuestro
caso tomaremos cuatro, pues los datos son dados por trimestres). Si el número
de observaciones utilizado es impar, la media y t (está centrada) coincide con
el periodo t. Si el número utilizado es par la y t no coincide con el periodo t
(esta descentrada) y hay que volver calcular una nueva media aritmética y t
utilizando los y t , con lo que se obtiene una serie de medias móviles centradas
con los periodos de tiempo.
9
Ya hemos dicho que en nuestro caso tomaremos 4 observaciones, i.e., su cálculo
es el siguiente;
y 2,5 =
y1 + y2 + y3 + y4
289,89 + 308,64 + 324,99 + 345,55
=
= 317,27,
4
4
y2 + y3 + y4 + y5
308,64 + 324,99 + 345,55 + 369,13
=
= 337,08,
4
4
324,99 + 345,55 + 369,13 + 389,79
y3 + y4 + y5 + y6
=
= 357,37,
y 4,5 =
4
4
y4 + y5 + y6 + y7
345,55 + 369,13 + 389,79 + 404,39
y 5,5 =
=
= 377,22.
4
4
Puede verse que dichas medias se corresponden con periodos ficticios, que
0
no existen en la serie observada que son t = 2,5; 3,5; 4,5; 5,5. O sea que la
media aritmética 317.27 corresponde a un periodo irreal que está justo entre
0
el periodo dos y el tres, la segunda 337.08 está en t = 3,5, que está entre el
tres y el cuarto, etc. Para centrar estas medias con los periodos reales de las
observaciones se vuelven a promediar los valores y t0 dos a dos, obteniéndose la
serie y t que está centrada en los periodos observados t:
y 3,5 =
y3 =
y 2,5 + y 3,5
317,27 + 337,08
=
= 327,17,
2
2
y 3,5 + y 4,5
337,08 + 357,37
=
= 347,22,
2
2
y 2,5 + y 3,5
357,37 + 377,22
y5 =
=
= 367,29.
2
2
De esa forma calcularemos la media móvil (MMA) de la serie original. Hemos
de tener en cuenta que, según este método, perderemos las dos primeras y las
dos últimas observaciones. (Véase en la tercera columna de la 2)
y4 =
Al ser anual, habremos eliminado en gran parte la componente estacional, y también la accidental, ya que al agregar las observaciones de un año, se compensarán
valores positivos y negativos de esta última componente, por lo que M Mt puede
interpretarse como el producto de las componentes tendencial y cı́clica: Tt ∗ Ct . Por
tanto el cociente de la serie original entre su media móvil, i.e., yt /M Mt (véase en
la cuarta columna de la tabla 2), es un porcentaje tomando valores alrededor de
1, que contiene información acerca de las componentes estacional y accidental.
10
Con objeto de eliminar la componente accidental, se calculan las medias aritméticas
a nivel de cada estación de yt /M Mt (en nuestro caso de todos los trimestres, ası́ que
serán 4, M1 , M2 , M3 , M4 ). Estas medias representan de forma aislada la importancia de la componente estacional. En nuestro caso tenemos;
M1 =
1,005 + 1,0071 + 1,0177 + · · · + 1,0009
= 0,99955,
16
1,074 + 1,006 + 1,0043 + · · · + 0,9972
= 1,00080,
15
0,9933 + 0,9923 + 1,004 + · · · + 1,0065
M3 =
= 1,00030,
16
0,9952 + 0,9845 + 0,9886 + · · · + 0,9927
M4 =
= 0,9974.
16
M2 =
Obtención de los ı́ndices de variación estacional: se calcula la media aritmética
anual M A de las medias estacionales, i.e.
MA =
M1 + M2 + M3 + M4
0,99955 + 1,00080 + 1,00030 + 0,9974
=
= 0,99951,
4
4
que será la base de los ı́ndices de variación estacional expresados en porcentaje:
I1 =
0,99955
M1
∗ 100 =
· 100 = 100,004,
MA
0,99951
I2 =
M2
1,0008
∗ 100 =
· 100 = 100,128,
MA
0,99951
I3 =
1,00030
M3
∗ 100 =
· 100 = 100,079,
MA
0,99951
I4 =
M4
0,9974
∗ 100 =
· 100 = 99,789.
MA
0,99951
Si obtenemos un ı́ndice del 80 % quiere decir que por el mero hecho de ser una
estación, la magnitud en estudio es un 20 % más baja que su tendencia media. En
nuestro caso, observamos que estos ı́ndices estacionales son prácticamente insignificantes, esto quiere decir que el precio medio de la vivienda tiene un comportamiento
similar en todas sus estaciones, es decir, no se contemplan fuertes subidas o bajadas
de precio según la estación en la que nos encontremos.
11
Por último una vez obtenidos los ı́ndices de variación estacional puede desestacionalizarse la serie observada dividiendo cada valor de la correspondiente estación
por su ı́ndice correspondiente, expresados en tantos por uno (véase en la quinta
columna de la tabla 2).
2. Estimar un modelo de regresión lineal de esta versión desestacionalizada de la serie, ytd
y obtendremos ası́ la tendencia de la serie.
En nuestro caso trataremos con el ajuste lineal mediante el método de los mı́nimos
cuadrados. Consiste en minimizar la suma de los cuadrados de las diferencias entre
valores observados en los distintos periodos y los estimados por la ecuación de la recta:
yt = a + bt,
siendo las ecuaciones normales:
n
X
yt = na + b
t,
(1)
t=1
t=1
n
X
n
X
n
X
tyt = a
t+b
t2 ,
(2)
t=1
t=1
t=1
n
X
donde n es el número total de observaciones, que coincide con el número de periodos de
tiempo.
El sistema de ecuaciones normales 2 se simplifica efectuando un cambio de variable
0
t = t − Ot si el número de periodos es impar (como es nuestro caso, ya que tenemos el
estudio en 17 años, tomaremos Ot = 1995), siendo Ot el valor que ocupa el lugar central
de la
Pserie 0de instantes o periodos t. Haciendo este cambio de variables el sistema 2, al
ser nt0 =1 t = 0, queda reducido a:
n
X
yt = na,
t=1
n
X
0
yt t = b
t=1
n
X
t2 .
t=1
Despejando los parámetros de la recta que son las incógnitas del sistema queda:
Pn
yt
a = t=1 ,
n
12
(3)
Pn
0
t=1 yt t
P
b=
n
02 ,
t0 =1 t
(4)
que nos permite establecer la recta estimada como:
0
yt = a + bt ,
y deshaciendo el cambio de variables tendremos la ecuación que nos da la recta de
regresión:
yt = a + b(t − Ot ).
Cuando las observaciones estén dadas en periodos inferiores al año (como es nuestro caso,
periodos trimestrales), antes de hacer el ajuste conviene calcular las medias anuales para
eliminar la componente estacional que nos puede distorsionar el resultado.
Una vez ajustada la recta de regresión a la nube de observaciones, es importante disponer
de una medida de la bondad del ajuste realizado y que permita decidir si el ajuste lineal
es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste
se utiliza el coeficiente de determinación, definido como sigue
(St0 yt )2
R = 2 2 .
St0 Syt
2
0
Donde St20 yt es la covarianza entre la variable t y yt , es decir,
St0 yt
N
1 X 0
=
t yti − t0 · yt .
N i=1 i
0
Y tanto St20 como Sy2t representan las varianzas marginales de t y de yt respectivamente.
Que se calculan según las siguientes fórmulas;
Sy2t
St20
N
1 X 2
yti − (yt )2 ,
=
N i=1
N
1 X 0 2
=
(ti ) − (t0 )2 .
N i=1
Este coeficiente es un número entre -1 y 1, la fiabilidad del modelo será mejor cuanto
más se acerque a 1 en caso de existencia de correlación positiva, y a -1 en caso de
correlación negativa.
13
Siguiendo los pasos explicados obtendrı́amos con nuestra serie los siguientes resultados;
a = 731,27
b = 50,10.
La recta de regresión de la serie desestacionalizada es la siguiente:
yt = 731,27 + 50,10(t − 1995) = 50,10t − 99222,45,
con un coeficiente de determinación
R2 =
1445887,84
= 0,83.
24 · 72629,06
(En la sección 4.1 se verá un cálculo más detallado sobre la recta de regresión, mediante el
método de los mı́nimos cuadrados.)
Con lo cual la tendencia tomará los valores expresados en la tabla 2;
14
Años
1987 1T
2T
3T
4T
1988 1T
2T
3T
4T
1989 1T
2T
3T
4T
1990 1T
2T
3T
4T
1991 1T
2T
3T
4T
1992 1T
2T
3T
4T
1993 1T
2T
3T
4T
1994 1T
2T
3T
4T
1995 1T
2T
3T
4T
Precio medio
289,89
308,64
324,99
345,55
369,13
389,79
404,39
423,12
456,58
480,17
502,72
516,43
550,40
559,73
570,77
580,60
613,42
637,90
652,80
681,23
650,49
635,70
633,78
630,72
625,44
634,83
639,69
640,61
634,72
636,80
644,36
642,63
652,92
661,06
665,46
667,47
MMA
yt /MMA
327,17
347,22
367,29
386,91
407,54
429,77
453,36
477,31
500,70
522,38
540,83
557,35
573,25
590,90
610,93
633,76
650,97
655,33
652,68
643,99
634,54
631,30
631,93
633,91
636,30
637,71
638,54
639,38
641,90
647,21
652,88
658,62
663,86
667,71
0,99333
0,99519
1,00501
1,00744
0,99227
0,98453
1,00711
1,00599
1,00403
0,98862
1,01770
1,00426
0,99567
0,98257
1,00408
1,00653
1,00281
1,03952
0,99665
0,98713
0,99880
0,99908
0,98973
1,00146
1,00532
1,00455
0,99402
0,99597
1,00383
0,99292
1,00006
1,00370
1,00241
0,99964
15
Serie.desest
289,880
308,244
324,735
346,279
369,117
389,290
404,073
424,013
456,564
479,554
502,326
517,520
550,380
559,012
570,322
581,825
613,398
637,082
652,288
682,668
650,467
634,885
633,283
632,051
625,417
634,016
639,188
641,962
634,697
635,983
643,854
643,986
652,896
660,212
664,938
668,878
Tendencia
325,96
338,485
351,01
363,535
376,06
388,585
401,11
413,635
426,16
438,685
451,21
463,735
476,26
488,785
501,31
513,835
526,36
538,885
551,41
563,935
576,46
588,985
601,51
614,035
626,56
639,085
651,61
664,135
676,66
689,185
701,71
714,235
726,76
739,285
751,81
764,335
Años
1996 1T
2T
3T
4T
1997 1T
2T
3T
4T
1998 1T
2T
3T
4T
1999 1T
2T
3T
4T
2000 1T
2T
3T
4T
2001 1T
2T
3T
4T
2002 1T
2T
3T
4T
2003 1T
2T
3T
Precio medio
669,98
674,79
675,18
676,45
677,74
683,06
686,64
691,78
694,34
709,66
723,95
738,58
755,21
780,25
803,89
829,81
857,25
891,76
926,36
953,42
994,50
1.030,77
1.065,78
1.096,57
1.148,23
1.193,66
1.254,09
1.287,73
1.349,11
1.402,57
1.450,60
MMA
670,64
672,98
675,07
677,07
679,54
682,89
686,88
692,28
700,27
710,78
724,24
740,67
759,49
780,89
805,05
831,74
860,99
891,75
924,35
958,89
993,69
1.029,01
1.066,12
1.105,70
1.149,60
1.197,03
1.246,04
1.297,26
1.347,94
yt /MMA
0,99902
1,00269
1,00016
0,99908
0,99735
1,00025
0,99965
0,99928
0,99153
0,99842
0,99960
0,99717
0,99436
0,99919
0,99857
0,99768
0,99566
1,00002
1,00217
0,99430
1,00082
1,00171
0,99968
0,99174
0,99881
0,99718
1,00646
0,99265
1,00087
Serie.desest
669,956
673,924
674,650
677,877
677,716
682,184
686,101
693,240
694,315
708,750
723,382
740,139
755,183
779,249
803,259
831,561
857,219
890,616
925,633
955,432
994,464
1029,448
1064,944
1098,884
1148,189
1192,129
1253,106
1290,447
1349,061
1400,771
1449,462
Cuadro 2: Cálculo de la tendencia
16
Tendencia
776,86
789,385
801,91
814,435
826,96
839,485
852,01
864,535
877,06
889,585
902,11
914,635
927,16
939,685
952,21
964,735
977,26
989,785
1002,31
1014,835
1027,36
1039,885
1052,41
1064,935
1077,46
1089,985
1102,51
1115,035
1127,56
1140,085
1152,61
2.2.
Cálculo de la componente cı́clica
Se calcula el cociente de la serie desestacionalizada, ytd , entre la tendencia, Tt , y se
obtiene ası́ el producto de las componentes cı́clica y accidental, Ct ∗ At . Al ser ytd y Tt
series compatibles en magnitud, el producto Wt = Ct ∗ At tiene forma de porcentaje,
tomando valores alrededor de la unidad.
Finalmente para separar la componente cı́clica, se calcula la media móvil de la serie Wt
y obtendremos como resultado una estimación de la componente cı́clica.
La tabla 3 recoge los resultados del cálculo de la componente cı́clica en porcentajes, estos
cálculos son los mismos que los realizados para el cálculo de la media móvil de la serie original.
Años
1987
2T
3T
4T
1988
2T
3T
4T
1989
2T
3T
4T
1990
2T
3T
4T
1991
2T
3T
4T
1T
1T
1T
1T
1T
serie desest./tendencia= Media móvil
Ct*At
primera
de Ct*At
0,889368928
0,910638004
0,919410849
0,925124174
0,942469
0,952512289
0,965257551
0,981601533
0,985817515
1,001792208
1,003956158
1,007364029
1,026409219
1,025066862
1,049245815
1,071413778
1,075720041
1,093138591
1,098442605
1,113260931
1,119515645
1,11595712
1,132143872
1,155705938
1,138238271
1,143651498
1,142322531
1,137638527
1,144754813
1,132294162
1,154390945
1,165435064
1,165711078
1,182196027
1,185266608
1,182919058
1,176021741
1,210516283
1,149949281
17
Media móvil segunda
de Ct*At*100 =
comp.cı́clica, Ct ( %)
93,09399243
95,38632755
97,55375329
99,48868364
101,5182689
103,7827517
106,2482928
108,7081323
110,8979125
112,5829758
113,5191071
114,0280401
114,3538672
114,9572879
116,0051011
117,5488843
118,0644174
116,2985511
Años
1992
2T
3T
4T
1993
2T
3T
4T
1994
1994
3T
4T
1995
2T
3T
4T
1996
2T
3T
4T
1997
2T
3T
4T
1998
2T
3T
4T
1999
2T
3T
4T
1T
1T
1T
2T
1T
1T
1T
1T
1T
serie desest./tendencia= Media móvil
Ct*At
primera
de Ct*At
1,128455595
1,117419106
1,077906188
1,072119434
1,052798359
1,039566136
1,029317593
1,018101087
0,998242404
1,000130228
0,99204599
0,984448868
0,980914924
0,969400075
0,966592153
0,952084668
0,938047231
0,936238519
0,922784363
0,919996648
0,917530328
0,910091171
0,901624672
0,902650485
0,898425319
0,894375359
0,89302162
0,887742296
0,884429823
0,878747562
0,875092423
0,868920831
0,862446383
0,858134778
0,853714694
0,84743921
0,841285611
0,836722751
0,832310152
0,826445052
0,819580548
0,817437631
0,812603899
0,809821766
0,805255924
0,80284947
0,801846692
0,798873975
0,791691364
0,798025016
0,79670192
0,799863237
0,801860086
0,805581799
0,809199576
0,813718337
0,814565613
0,824142068
0,829248074
0,837326933
0,84355501
0,852991475
0,861939035
0,870626411
18
Media móvil segunda
de Ct*At*100 =
comp.cı́clica, Ct ( %)
113,3684194
109,476927
105,5842785
102,8833611
100,9115657
99,22895478
97,69244712
96,07423711
94,41615932
92,81175836
91,50439095
90,63708277
89,85129217
89,10588275
88,32449292
87,38341965
86,35278043
85,27869939
84,20809806
83,15839018
82,19413414
81,3629698
80,63356175
80,08617223
79,84494953
79,89441261
80,27225178
80,9650068
81,89302027
83,07345005
84,51592042
86,18089434
Años
2000
2T
3T
4T
2001
2T
3T
4T
2002
2T
3T
4T
2003
1T
1T
1T
1T
serie desest./tendencia= Media móvil
Ct*At
primera
de Ct*At
0,877223783
0,89060753
0,899787817
0,910483906
0,923479484
0,933188996
0,941444539
0,955727368
0,968044144
0,977829308
0,989941304
1,000432224
1,011887244
1,024849742
1,031856203
1,050786203
1,065714219
1,081956565
1,093687146
1,113315036
1,136568692
1,146017008
1,157290088
1,196522108
Media móvil segunda
de Ct*At*100 =
comp.cı́clica, Ct ( %)
88,06169706
90,05457179
92,1836451
94,44581819
96,67783377
98,91307656
101,2640983
103,7817973
106,6371384
109,76358
112,9666022
Cuadro 3: Cálculo de la componente cı́clica
2.3.
Cálculo de la componente accidental
Obtendremos una estimación de la componente accidental dividiendo el cociente Wt entre
la estimación de la componente cı́clica, i.e, At = Wt /Ct . Estos cálculos se recogen en la tabla
4 y su cálculo para las cuatro primeras iteraciones es;
Año
1987-3T
1987-4T
1988-1T
1988-2T
2.4.
Componente accidental
0,9251/0,9309 · 100=99.3752
0,95251/0,9533 · 100=99.8583
0,9815/0,9755 · 100=100.621
0,9816/0,9948 · 100=10.694
Cálculo de la componente estacional
Como ya vimos en el cálculo de los coeficientes estacionales, al dividir la serie inicial entre
la serie móvil obtenı́amos el producto Et ∗ At . Ası́ pues, ahora dividiremos este producto entre
la estimación obtenida de la componente accidental At y conseguiremos ası́ una estimación
de la componente estacional, Et . Veamos ahora en la tabla 4 los resultados obtenidos en el
cálculo de las componentes estacional y accidental en porcentajes.
19
Años
1987
2T
3T
4T
1988
2T
3T
4T
1989
2T
3T
4T
1990
2T
3T
4T
1991
2T
3T
4T
1992
2T
3T
4T
1993
2T
3T
4T
1994
2T
3T
4T
1T
1T
1T
1T
1T
1T
1T
1T
serie desest./
tendencia=
Ct*At
0,889368928
0,910638004
0,925124174
0,952512289
0,981601533
1,001792208
1,007364029
1,025066862
1,071413778
1,093138591
1,113260931
1,11595712
1,155705938
1,143651498
1,137638527
1,132294162
1,165435064
1,182196027
1,182919058
1,210516283
1,128455595
1,077906188
1,052798359
1,029317593
0,998242404
0,99204599
0,980914924
0,966592153
0,938047231
0,922784363
0,917530328
0,901624672
Estimación de
la componente
cı́clica,Ct ( %)
Estimación de
la componente
accidental,At ( %)
serie original yt/ Estimación de
(media móvil yt la componente
* At)
estacional,Et( %)
93,09399243
95,38632755
97,55375329
99,48868364
101,5182689
103,7827517
106,2482928
108,7081323
110,8979125
112,5829758
113,5191071
114,0280401
114,3538672
114,9572879
116,0051011
117,5488843
118,0644174
116,2985511
113,3684194
109,476927
105,5842785
102,8833611
100,9115657
99,22895478
97,69244712
96,07423711
94,41615932
92,81175836
91,50439095
90,63708277
99,37528191
99,85836682
100,621606
100,6940861
99,22982736
98,77044546
100,8405641
100,5572047
100,3861034
99,12307895
101,807173
100,2956376
99,484045
98,49694464
100,4641221
100,5705868
100,1926816
104,0869616
99,53879584
98,45966798
99,71165917
100,0470418
98,92249687
99,97545497
100,4084709
100,6088815
99,35240297
99,42537231
100,2717267
99,47635611
0,999573725
0,9965983
0,998801058
1,000496033
0,999975277
0,996788391
0,998716005
1,00041492
1,000167657
0,997365394
0,999636913
1,001303222
1,000833297
0,997560775
0,99944328
1,000823858
1,000880751
0,998705368
1,001266303
1,002575875
1,001688592
0,998609519
1,000508427
1,001703103
1,001233976
0,998469992
1,000498749
1,001728841
1,001108185
0,998150224
20
99,9573725
99,65983004
99,88010577
100,0496033
99,99752768
99,67883912
99,87160053
100,041492
100,0167657
99,73653939
99,96369126
100,1303222
100,0833297
99,75607748
99,94432799
100,0823858
100,0880751
99,87053676
100,1266303
100,2575875
100,1688592
99,86095192
100,0508427
100,1703103
100,1233976
99,8469992
100,0498749
100,1728841
100,1108185
99,81502242
Años
1995
2T
3T
4T
1996
2T
3T
4T
1997
2T
3T
4T
1998
2T
3T
4T
1999
2T
3T
4T
2000
2T
3T
4T
2001
2T
3T
4T
2002
2T
3T
4T
2003
1T
1T
1T
1T
1T
1T
1T
1T
1T
serie desest./
tendencia=
Ct*At
0,898425319
0,89302162
0,884429823
0,875092423
0,862446383
0,853714694
0,841285611
0,832310152
0,819580548
0,812603899
0,805255924
0,801846692
0,791691364
0,79670192
0,801860086
0,809199576
0,814565613
0,829248074
0,84355501
0,861939035
0,877223783
0,899787817
0,923479484
0,941444539
0,968044144
0,989941304
1,011887244
1,031856203
1,065714219
1,093687146
1,136568692
1,157290088
1,196522108
Estimación de
la componente
cı́clica, Ct ( %)
89,85129217
89,10588275
88,32449292
87,38341965
86,35278043
85,27869939
84,20809806
83,15839018
82,19413414
81,3629698
80,63356175
80,08617223
79,84494953
79,89441261
80,27225178
80,9650068
81,89302027
83,07345005
84,51592042
86,18089434
88,06169706
90,05457179
92,1836451
94,44581819
96,67783377
98,91307656
101,2640983
103,7817973
106,6371384
109,76358
112,9666022
Estimación de
la componente
accidental, At ( %)
99,9902503
100,2202764
100,1341524
100,1439891
99,87476702
100,1087846
99,90554714
100,0873333
99,71277831
99,87392307
99,86609874
100,1229887
99,15359313
99,71935387
99,8925617
99,94435967
99,46703761
99,82107077
99,81019033
100,0150952
99,61468066
99,91583983
100,1782348
99,68091308
100,1309303
100,0819445
99,925567
99,42554765
99,93837375
99,64025819
100,6110363
serie original yt/
(media móvil yt
* At)
1,000158779
1,001494849
1,001067191
0,998205127
1,000268531
1,001603665
1,001108522
0,998206989
1,00022401
1,00151345
1,000990933
0,99805026
0,999997657
1,00123067
1,000672961
0,997728321
0,999692625
1,00097626
1,000464276
0,997530484
0,999511812
1,000857743
1,000387397
0,997482211
0,999506487
1,000888992
1,00042456
0,997473921
0,999425275
1,000782851
1,000349985
Cuadro 4: Calculo de la componente estacional y accidental
21
Estimación de
la componente
estacional,Et( %)
100,0158779
100,1494849
100,1067191
99,82051269
100,0268531
100,1603665
100,1108522
99,82069886
100,022401
100,151345
100,0990933
99,80502599
99,99976565
100,123067
100,0672961
99,77283212
99,96926252
100,097626
100,0464276
99,75304839
99,95118121
100,0857743
100,0387397
99,74822113
99,95064866
100,0888992
100,042456
99,74739209
99,94252755
100,0782851
100,0349985
2.5.
Representación de las componentes de la serie
Después de realizar los cálculos oportunos (descritos anteriormente) para el cálculo de
cada una de las componentes de la serie, obtenemos la gráfica 1,
Figura 1: serie temporal del precio medio de la vivienda
donde están representados: en el eje izquierdo, la serie original y la tendencia, y en el eje
derecho la componente cı́clica, la accidental y la estacional.
22
3.
Serie del MIBOR
En este apartado vamos a estudiar la serie del MIBOR, que está estrechamente ligada con
el precio de la vivienda, pues es una ayuda indispensable para poder financiarla. Veamos en
primer lugar la definición de este concepto económico.
Cuando acudimos a una entidad bancaria para pedir un crédito hipotecario, las condiciones
que nos ofrecen determinan la cantidad de dinero que tendremos que reintegrar al banco. Los
tipos de hipoteca son:
Hipotecas a plazo fijo: se establece una cuota fija para todo el plazo del préstamo. Hasta
amortizar la hipoteca pagamos la misma cantidad mes a mes. La desventaja que tiene
es que el tiempo de amortización (entre 10 y 15 años) es muy inferior al que ofrecen las
hipotecas variables que oscila entre 20 y 30 años.
Hipotecas a tipo variable: la cantidad a pagar depende de un ı́ndice de referencia acordado con el banco y revisado regularmente. Si el ı́ndice se encarece, nosotros como titulares
del crédito pagamos más, y si su valor disminuye nuestra amortización también lo hará.
En caso de pedir un préstamo a interés variable, conviene elegir la variable oficial en función
de la cual el tipo de interés cambiará, o sea el ı́ndice de referencia oficial, i.e., aquellos que
publica mensualmente el Banco de España en el Boletı́n Oficial del Estado para los préstamos
hipotecarios a tipo variable destinados a la adquisición de vivienda. En este trabajo vamos
trabajar con el MIBOR, vulgarmente se podrı́a decir que el MIBOR es como el tipo de
interés al que los bancos se prestan dinero entre sı́ en el mercado intercambiario de Madrid.
Por ello, es natural que se añada un diferencial al MIBOR, dado que en él radica la ganancia
del banco. Este tipo ha dejado de tener la consideración de tipo de referencia oficial del
mercado hipotecario para las operaciones formalizadas después del 1 de enero de 2000. A
partir de esta fecha se empezó a utilizar el EURIBOR (Europe Interbank Offered Rate), se
elabora de igual forma que el MIBOR, pero en referencia a las operaciones realizadas entre los
principales bancos europeos (con orientación internacional), entre ellos los españoles BBVA,
Caja Postal y Banco Hipotecario S.A. Media simple de los tipos de interés diarios, aplicados
para las operaciones cruzadas al plazo de 1 año, en el mercado de depósitos interbancarios de
la zona de la Unión Monetaria, entre las 64 entidades financieras con mayor nivel de negocio.
En primer lugar, como ya vimos en la serie del precio medio de la vivienda, veremos a
qué tipo de hipótesis se ajusta nuestro modelo. Para ello, según lo visto en la sección 1.2,
calcularemos las series del cociente y de las diferencias entre dos observaciones consecutivas
de la misma estación. Veamos la tabla 5 donde aparece la serie original, la de las diferencias y
la de los cocientes estacionales, estos datos han sido proporcionados por el Banco de España.
23
Años
1987 1T
2T
3T
4T
1988 1T
2T
3T
4T
1989 1T
2T
3T
4T
1990 1T
2T
3T
4T
1991 1T
2T
3T
4T
1992 1T
2T
3T
4T
1993 1T
2T
3T
4T
1994 1T
2T
3T
4T
1995 1T
2T
3T
4T
MIBOR
12,42
15,88
15,56
14,43
11,86
10,94
11,17
13,26
15,10
15,01
15,02
15,28
15,71
15,39
15,41
15,26
14,82
12,63
12,53
12,68
12,62
12,62
13,73
14,27
13,38
11,80
9,78
8,69
8,09
7,97
8,57
9,14
10,29
10,36
9,94
9,40
Diferencia estacional
Cociente estacional
-0,55
-4,94
-4,39
-1,17
3,24
4,07
3,86
2,02
0,61
0,38
0,39
-0,01
-0,89
-2,76
-2,89
-2,58
-2,20
-0,01
1,21
1,59
0,76
-0,82
-3,95
-5,57
-5,29
-3,83
-1,21
0,45
2,20
2,39
1,37
0,26
0,96
0,69
0,72
0,92
1,27
1,37
1,35
1,15
1,04
1,03
1,03
1,00
0,94
0,82
0,81
0,83
0,85
1,00
1,10
1,13
1,06
0,94
0,71
0,61
0,60
0,68
0,88
1,05
1,27
1,30
1,16
1,03
24
Años
1996 1T
2T
3T
4T
1997 1T
2T
3T
4T
1998 1T
2T
3T
4T
1999 1T
2T
3T
4T
2000 1T
2T
3T
4T
2001 1T
2T
3T
4T
2002 1T
2T
3T
4T
2003 1T
2T
3T
MIBOR
8,50
7,43
7,15
6,35
5,62
5,26
5,11
4,81
4,30
4,21
4,01
3,50
3,04
2,72
3,17
3,69
4,09
4,72
5,18
5,10
4,54
4,42
4,06
3,28
3,62
3,89
3,44
3,01
2,55
2,25
2,21
Varianza
desv.tipica
media
desv.tı́pica/media
Diferencia estacional
-1,79
-2,93
-2,79
-3,05
-2,88
-2,17
-2,04
-1,55
-1,32
-1,05
-1,10
-1,31
-1,26
-1,49
-0,84
0,19
1,05
2,00
2,01
1,41
0,44
-0,30
-1,12
-1,81
-0,92
-0,53
-0,62
-0,27
-1,07
-1,64
-1,23
4,41
2,10
-0,66
-3,169878759
Cociente estacional
0,83
0,72
0,72
0,68
0,66
0,71
0,71
0,76
0,77
0,80
0,79
0,73
0,71
0,65
0,79
1,06
1,35
1,74
1,64
1,38
1,11
0,94
0,78
0,64
0,80
0,88
0,85
0,92
0,70
0,58
0,64
0,07
0,26
0,93
0,274383123
Cuadro 5: Método de las diferencias y cociente estacionales
25
En este caso cuando hallamos el coeficiente de variación=desv.tı́pica/media al tomar
valores absolutos tenemos de nuevo que el coeficiente del cociente es menor que el de las
diferencias, por lo tanto nos encontramos otra vez con un modelo serie temporal sujeta a la
hipótesis multiplicativa, como la mayorı́a de series temporales económicas. Pero utilizaremos
esta serie como ejemplo para el cálculo de las componentes de una serie bajo un modelo sujeto
a la hipótesis aditiva.
3.1.
Cálculo de la tendencia
El método utilizado en este caso es el de los mı́nimos cuadrados. Este método, como ya
vimos en la sección 2.1, expresa la tendencia a través de una función matemática que relaciona
la magnitud que se está estudiando con el tiempo t, que actúa como variable independiente.
En primer lugar conviene representar gráficamente la serie temporal observada, con objeto
de decidir que tipo de función es la más adecuada: de tipo lineal, parabólico, etc. En nuestro
caso trataremos con el ajuste lineal. La recta resultante será la tendencia.
3.2.
Cálculo de la componente estacional
Una vez calculada la tendencia ajustada a una recta y t = a + bt, el coeficiente angular
b de la recta nos mide el incremento medio anual de la tendencia, que influirá de distinta
forma al pasar de una estación a otra, como veremos más adelante. Con los datos observados
se calculan las medias estacionales (M1 ,M2 ,. . . ,etc) con objeto de eliminar la componente
accidental. Estas medias aritméticas son brutas, ya que siguen incluyendo las componentes a
largo plazo (tendencia y ciclo) y tienen que someterse a una corrección de las mismas.
Empleando el incremento medio anual dado por el coeficiente de la recta de regresión, se
0
0
obtienen las medias estacionales corregidas de las componentes a largo plazo (M1 ,M2 ,. . . ,etc.)
bajo el esquema aditivo (se resta):
0
M1 = M 1 ,
ya que estamos en la primera estación y no está influida por la tendencia
0
M2 = M2 −
2b
,
n estaciones
o
ya que hemos pasado de la primera estación a la segunda, hay que restar la parte proporcional
del incremento anual de la tendencia.
Para la r-ésima estación la media estacional corregida de la tendencia interestacional será:
rb
0
Mr = Mr −
no estaciones
26
.
Los ı́ndices de variación estacional se obtienen con la misma sistemática utilizada bajo la
hipótesis multiplicativa en el método de la razón a la media móvil: con las medias estacionales
0
corregidas se obtiene la media aritmética anual M A, que sirve de base para calcular los ı́ndices
en tantos por 100:
0
0
M
M
I1 = 0 1 ∗ 100 I2 = 0 2 ∗ 100 . . . , etc.
MA
MA
Obtenidos los ı́ndices de variación estacional, estamos en condiciones de desestacionalizar
la serie como ya hicimos anteriormente.
Y por último, para calcular la componente estacional, restaremos esta serie desestacionalizada
a la serie original.
3.3.
Cálculo de la componente cı́clica
Como ya sabemos de todas las componentes mencionadas, la componente cı́clica es la más
difı́cil de detectar, puesto que, a diferencia de la tendencia, que es un movimiento a largo
plazo muy general, y de las variaciones estacionales, que tienen un periodo fijo, las variaciones
cı́clicas tienen un periodo no fácilmente identificable y, en muchos casos, incluso variable.
Todo ello aconseja eliminar de la serie la tendencia y las variaciones estacionales, limitando
el análisis a la parte de la serie no imputable a ninguna de estas componentes, que llamaremos
xik = cik + aik (para simplificar la notación vamos a eliminar el doble subı́ndice, puesto que ya
no existe variación estacional, y considerar xt simplemente). Obtenida esta serie intentaremos
detectar los ciclos mediante lo que se conoce como análisis armónico.
Sabemos que una onda armónica pura puede ser representada por una ecuación de la forma
Xj = A cos(ωj ) + B sin(ωj ),
o de forma equivalente
Xj = R cos(ωj − α).
Ambas formulas están ligadas por
R=
√
A2 + B 2 ,
α = arctgB/A.
En nuestro análisis estamos interesados en conocer los valores de A, B y ω, o lo que es lo
mismo, de R, α y de ω. A R se le llama amplitud, que proporciona el valor máximo de Xj .
27
La aplicación de esta idea al análisis de la componente cı́clica se basa en tratar de identificar
alguna función de esta forma a los datos. Ası́, para detectar la existencia de un ciclo de periodo
p, formemos un cuadro de la forma:
1.a oscilación
2.a oscilación
...
esima
q.
oscilación
medias
x1
xp+1
...
x2
xp+2
...
x(q−1)p+1
xm1
x(q−1)p+2
xm2
... xp
... x2p
... ...
... xqp
... xmp
donde la fila j-ésima recoge los p valores que forman la j-ésima oscilación y el número
de observaciones de la serie xt por el periodo p. En la última fila figura el valor medio de
los primeros elementos de cada oscilación, el valor medio de los segundos, etc., y su cálculo
constituyen el segundo paso de este método.
A continuación ajustamos a los datos medios una expresión de la forma
xt = A0 + A cos(
2π
2π
j) + B sin( j) j = 1, 2, . . . , p,
p
p
donde incluimos la constante A0 para mejorar el ajuste. Este ajuste se puede hacer mediante
el método de los mı́nimos cuadrados, dando como resultado:
A0 =
p
X
xj
j=1
p
,
p
2πj
2X
xj cos(
),
A=
p j=1
p
p
2X
2πj
B=
xj sin(
),
p j=1
p
y una vez conocidos A y B podemos obtener la amplitud R correspondiente a ese periodo.
3.4.
Cálculo de la componente accidental
Calcularemos la componente accidental simplemente restándole a la serie original todas
las componentes ya calculadas, i.e., la componente estacional, la tendencia y la componente
cı́clica.
28
3.5.
Representación de las componentes de la serie
Después de realizar los cálculos oportunos (descritos anteriormente) para el cálculo de
cada una de las componentes de la serie, obtenemos la gráfica 2.
Figura 2: Serie temporal del ı́ndice de referencia MIBOR.
29
t=tiempo
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
SUMA
MEDIAS
yt =precio medio anual t0 yt * t0
317,27
-8 -2538,16
396,61
-7 -2776,25
488,98
-6 -2933,85
565,38
-5 -2826,88
646,34
-4 -2585,35
637,67
-3 -1913,02
635,14
-2 -1270,29
639,63
-1 -639,63
661,73
0 0,00
674,10
1 674,10
684,81
2 1369,61
716,63
3 2149,90
792,29
4 3169,16
907,20
5 4535,99
1046,91
6 6281,43
1220,93
7 8546,49
1400,76
8 11206,08
12432,35
0 20449,34
731,31
0 1202,90
t02
64
49
36
25
16
9
4
1
0
1
4
9
16
25
36
49
64
408
24
yt ∗ t02
100660,25
157297,51
239096,55
319648,89
417752,16
406626,22
403406,00
409123,34
437883,28
454410,81
468957,89
513562,14
627723,44
823007,30
1096010,08
1490663,96
1962128,58
10327958,41
607526,97
Regresión
328,50
378,62
428,74
478,86
528,98
579,10
629,22
679,34
729,46
779,58
829,70
879,82
929,94
980,06
1030,18
1080,30
1130,42
Cuadro 6: Regresión simple del precio medio de la vivienda en el tiempo
4.
4.1.
Regresión y correlación
Regresión y correlación lineal simple
En esta sección vamos a aplicar la regresión simple a las dos series, la del precio medio
de la vivienda y la del MIBOR, estudiadas anteriormente. En ambos casos como variable
exógena o independiente, el tiempo y como variable endógena o dependiente, el precio de la
vivienda y el MIBOR respectivamente.
Como ya vimos en la sección 2.1, utilizando el método de los mı́nimos cuadrados para
determinar la recta de regresión, los coeficientes de la recta vienen dados según las ecuaciones
0
3 y 4. Primero hacemos el cambio de variable t = t − Ot = t − 1995.
Veamos los cálculos en la tabla 6. Para poder calcular la recta de regresión tenemos que
30
calcular los coeficientes de esta recta, que como ya vimos en la sección 2.1 son los siguientes;
Pn
yt
12432,35
= 731,31,
a = t=1 =
n
17
Pn
0
yt t
20449,34
b = Pt=1
= 50, 12,
n
02 =
408
t0 =1 t
0
yt = a+bt = a+b(t−Ot ) = 731,31+50,12(t−1995) = 731,31+50,12t−99991,26 = 50,12t−99259,94.
El nivel de fiabilidad nos lo da el coeficiente de correlación;
R2 =
(1202,90)2
1446974,07
(St0 yt )2
=
=
= 0,83.
2 2
St0 Syt
24 · 72705,55
28869,66
Siendo los cálculos de la covarianza y las varianzas:
St0 yt
N
1 X 0
20449,34
=
− 0 = 1202,90,
ti yti − t0 · yt =
N i=1
17
St20
Sy2t
N
1 X 0 2
408
=
− 0 = 24,
(ti ) − (t0 )2 =
N i=1
17
2
N
12432,35
10327958,41
1 X 2
2
−
=
y − (yt ) =
= 72705,55.
N i=1 ti
17
17
Por lo tanto según los cálculos realizados, obtenemos como recta de regresión
yt = 50,1209t − 99259,9432 y el coeficiente de determinación obtenido es R2 = 0,83.
Ası́ que obtendrı́amos una predicción para el precio medio de la vivienda en el año 2004
de;
y2004 = 50,1209 · 2004 − 99259,9432 = 1182,34.
Veamos ahora la tabla 7 correspondiente para la serie del MIBOR; Basándonos de nuevo
en las fórmulas de la sección 2.1 obtenemos;
Pn
yt
147,13
= 8,65,
a = t=1 =
n
17
Pn
0
yt t
−356,08
t=1
b = Pn
= −0,87,
02 =
0
408
t =1 t
0
yt = a+bt = a+b(t−Ot ) = 8,65−0,87(t−1995) = 8,65−0,87t−1741,11 = −0,87t−1749,77.
31
t=tiempo
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
SUMA
MEDIAS
yt =MIBOR (media anual) t0 yt * t0
t02
14,56933333
-8 -116,5546667 64
11,80658333
-7 -82,64608333 49
15,102
-6 -90,612
36
15,44283333
-5 -77,21416667 25
13,1645
-4 -52,658
16
13,309
-3 -39,927
9
10,91333333
-2 -21,82666667 4
8,443166667
-1 -8,443166667 1
9,997333333
0 0
0
7,356
1 7,356
1
5,197916667
2 10,39583333 4
4,004916667
3 12,01475
9
3,154916667
4 12,61966667 16
4,773083333
5 23,86541667 25
4,076666667
6 24,46
36
3,489
7 24,423
49
2,333777778
8 18,67022222 64
147,1343611
0 -356,0768611 408
8,654962418
0 -20,94569771 24
yt ∗ t02
212,2654738
139,39541
228,070404
238,4811014
173,3040603
177,129481
119,1008444
71,28706336
99,94667378
54,110736
27,01833767
16,03935751
9,953499174
22,78232451
16,61921111
12,173121
5,446518716
1623,123618
95,47785986
Cuadro 7: Regresión simple del MIBOR en el tiempo
32
Regresión
15,63686166
14,76412425
13,89138685
13,01864944
12,14591204
11,27317463
10,40043723
9,527699823
8,654962418
7,782225014
6,909487609
6,036750204
5,1640128
4,291275395
3,41853799
2,545800586
1,673063181
El nivel de fiabilidad nos lo da el coeficiente de correlación;
R2 =
(−20,94)2
438,72
(St0 yt )2
=
=
= 0,89.
2 2
St0 Syt
24 · 20,57
493,67
Siendo los cálculos de la covarianza y las varianzas:
St0 yt
N
1 X 0
−356,07
=
− 0 = −20,94,
ti yti − t0 · yt =
N i=1
17
St20
Sy2t
N
1 X 0 2
408
=
− 0 = 24,
(ti ) − (t0 )2 =
N i=1
17
2
N
1623,13
12432,35
1 X 2
2
−
=
y − (yt ) =
= 20,57
N i=1 ti
17
17
Por lo tanto según los cálculos realizados, obtenemos como recta de regresión
yt0 = −0,8792t + 1749,7661 y el coeficiente de determinación obtenido es R2 = 0,89.
De modo que obtenemos una predicción del MIBOR para el año 2004 de;
0
y2004
= −0,8792 · 2004 + 1749,7661 = 0,8792.
Nota histórica; ¿Por qué denominamos este proceso análisis de regresión? A principios de
siglo, el cientı́fico de genética Francis Galton descubrió un fenómeno llamado regresión a la
medida. Buscando leyes de herencia genética, descubrió que la estatura de los hijos solı́a ser
una regresión a la estatura media poblacional, en comparación con la estatura de sus padres.
Los padres altos solı́an tener hijos algo más bajos, y viceversa. Galton desarrolló el análisis de
regresión para estudiar este fenómeno. Al que se refirió de manera optimista como regresión
a la mediocridad”.
33
4.2.
Regresión y correlación lineal múltiple
La regresión múltiple es la generalización de la regresión simple para el caso en que tengamos más de una variable explicativa. Pretendemos explicar el comportamiento de una variable explicativa, a la que denominaremos dependiente. Para ello no será suficiente una única
variable como hacı́amos en en la regresión simple, necesitaremos ampliar el número de variables que utilizamos para explicar los cambios que se producen en la variable dependiente. En
nuestro caso trabajaremos con dos variables independientes o explicativas. Debemos tener en
cuenta que la naturaleza de la mayorı́a de los fenómenos económicos estudiados es compleja
y necesitaremos más de una variable independiente para poder analizar dichos fenómenos.
En este trabajo trataremos de explicar el comportamiento del precio medio de la vivienda
(variable dependiente), ya no sólo mediante la variable tiempo, sino también con variables
tales como el IPC (ı́ndice de precios al consumo) y el MIBOR. También podrı́amos haber
elegido muchas otras variables de tipo económica, como por ejemplo la tasa de desempleo del
paı́s, el PIB (producto interior bruto)...etc
Veamos ahora el ajuste de un plano mediante el método mı́nimo-cuadrático;
Se parte de la nube de puntos tridimensionales en la que se recogen las observaciones de
las tres variables que vamos a utilizar. En nuestro caso tomaremos siempre como variable
dependiente, yi , el precio medio de la vivienda, y como variables independientes, x1i y x2i
vamos a ir alternando entre el tiempo, IPC y el MIBOR. Ahora ajustaremos la ecuación
de un plano a esta nube de puntos, (yi , x1i , x2i );
y = b0 + b1 x 1 + b2 x 2 .
El sistema de ecuaciones normales surge al minimizar la expresión;
S=
N
X
(yi − b0 − b1 x1i − b2 x2i )2 .
i=1
Derivando esta expresión con respecto al término independiente b0 obtenemos la primera
ecuación normal;
N
X
i=1
yi = N b0 + b1
N
X
x1i + b2
N
X
i=1
x2i .
i=1
Dividiendo esta expresión por N y despejando la b0 obtenemos;
b0 = Y − b1 X1 − b2 X2 .
34
De igual forma derivando respecto a b1 y b2 obtendremos;
b1 =
Sy Ryx1 − Ryx2 Rx1 x2
·
,
S x1
1 − Rx2 1 x2
b2 =
Sy Ryx2 − Ryx1 Rx1 x2
·
.
S x2
1 − Rx2 1 x2
Para el cálculo de b1 y b2 necesitaremos conocer las varianzas marginales;
Sy2
N
N
N
1 X 2
1 X 2
1 X 2
2
2
2
2
=
y − y , Sx1 =
x − x1 , Sx2 =
x − x2 2 ,
N i=1 i
N i=1 1i
N i=1 2i
Ası́ como las covarianzas;
Syx1
N
N
N
1 X
1 X
1 X
=
yi x1i − y · x1 , Syx2 =
yi x2i − y · x2 , Sx1 x2 =
x1i x2i − x1 · x2 ,
N i=1
N i=1
N i=1
y los coeficientes de correlación lineal simple;
Ryx1 =
Syx1
Syx2
S x1 x2
, Ryx2 =
, Rx1 x2 =
.
S y · S x1
S y · S x2
S x1 · S x2
Para determinar ahora los coeficientes de determinación y correlación múltiples necesitamos calcular la varianza explicada y la residual. Partimos de la expresión
2
Sy2 = Sy20 ·x1 x2 + Sry·x
,
1 x2
(5)
donde Sy2 es la varianza de la variable dependiente observada yt . Llamemos yt0 a la serie
obtenida una vez estimado el modelo, de modo que Sy20 ·x1 x2 es la varianza de la variable
endógena yt explicada por la regresión. El tercer elemento de la expresión 5 es el residuo
que también tiene su correspondiente variabilidad, que vamos a medir a través de lo que
2
llamamos varianza residual o varianza de los errores o residuos Sry·x
.
1 x2
Según la propia definición de varianza residual y haciendo una serie de cálculos, obtenemos;
2
Sry·x
= Sy2 − b1 Syx1 − b2 Syx2 ,
1 x2
y despejando obtenemos la varianza explicada;
2
Syt ·x1 x2 = Sy2 − Sry·x
.
1 x2
35
Ası́ que el coeficiente de determinación múltiple viene dado por la siguiente expresión;
2
=
Ry·x
1 x2
Sy2
Sy2t ·x1 x2
,
Ry·x1 x2 =
q
2
Ry·x
.
1 x2
Como ya sabemos este coeficiente nos da la medida de la relación existente entre la variable
dependiente y el conjunto de las variables independientes. De manera estricta, el coeficiente
de correlación múltiple nos mide la correlación existente entre la variable y y las predicciones
que hacemos de la misma mediante la ecuación de regresión, es decir, nos indica el grado de
fiabilidad del modelo.
También podrı́amos estudiar como influye cada variable en el modelo por separado, y
para ello tenemos que calcular los coeficientes de determinación y correlación parcial. Por
ejemplo, el coeficiente de determinación parcial Ryx1 ·2 estudia las causas comunes que tienen
las variables yti y x1i , permaneciendo constantes las que tengan yti y x2i , es decir, una vez
que se ha efectuado la regresión de yti sobre x2i . Se calculan según la siguiente fórmula;
2
Ryx
=
1 ·x2
(Ryx1 − Ryx2 · Rx1 x2 )2
,
2 )
(1 − Rx2 1 x2 )(1 − Ryx
2
2
Ryx
=
2 ·x1
(Ryx2 − Ryx1 · Rx1 x2 )2
.
2 )
(1 − Rx2 1 x2 )(1 − Ryx
1
Apliquemos este modelo de regresión múltiple a nuestro ejemplo, tomando como variable
dependiente el precio medio de la vivienda y como variables independientes el IPC (tomando
esta serie como la de los incrementos producidos con base enero de 1987, desde este año al
2003) y el tiempo (desde el año 1987 hasta el 2003). En la tabla 8 vemos los cálculos necesarios
para la obtención del plano de regresión y los coeficientes de correlación y determinación. La
penúltima fila de esta tabla recoge la suma de todas las filas y la última la media de cada
columna.
36
Yi
317,27
396,61
488,98
565,38
646,34
637,67
635,14
639,63
661,73
674,10
684,81
716,63
792,29
907,20
1046,91
1220,93
1400,76
12432,35
731,31
X1i
2,25
7,45
14,65
22,28
29,38
37,20
43,43
49,93
57,15
62,55
65,53
68,60
72,78
78,78
85,13
91,65
97,03
885,73
52,10
X2i
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
33915
1995
Yi2
100658,7
157297,5
239096,5
319648,9
417752,2
406626,2
403406,0
409123,3
437883,3
454410,8
468957,9
513562,1
627723,4
823007,3
1096010,1
1490663,9
1962128,6
10327956,8
607526,9
2
X1i
5,1
55,5
214,6
496,2
862,9
1383,8
1885,7
2492,5
3266,1
3912,5
4293,5
4705,9
5296,2
6205,5
7246,3
8399,7
9415,5
60137,6
3537,5
2
X2i
3948169
3952144
3956121
3960100
3964081
3968064
3972049
3976036
3980025
3984016
3988009
3992004
3996001
4000000
4004001
4008004
4012009
67660833
3980049
Yi X1i
713,85
2954,73
7163,48
12593,73
18986,16
23721,42
27581,06
31933,40
37817,73
42164,96
44871,85
49160,99
57658,90
71464,48
89117,79
111898,01
135920,41
765722,95
45042,53
Yi X2i
630410,52
788455,71
972571,28
1125096,25
1286857,96
1270243,62
1265839,00
1275417,24
1320146,36
1345503,60
1367555,59
1431831,74
1583787,71
1814395,00
2094856,91
2444296,86
2805722,28
24822987,61
1460175,74
Cuadro 8: Regresión múltiple del precio medio de la vivienda sobre el tiempo y el IPC
37
X1i X2i
4470,75
14810,60
29138,85
44327,25
58485,63
74102,40
86546,03
99550,45
114014,25
124849,80
130853,43
137062,80
145477,23
157550,00
170335,13
183483,30
194357,77
1769415,64
104083,27
Yi=Precio medio X1i =IPC
317,27
2,25
396,61
7,45
488,98
14,65
565,38
22,28
646,34
29,38
637,67
37,20
635,14
43,43
639,63
49,93
661,73
57,15
674,10
62,55
684,81
65,53
716,63
68,60
792,29
72,78
907,20
78,78
1046,91
85,13
1220,93
91,65
1400,76
97,03
X2i =Años
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
Regresión
359,35
415,10
452,91
486,90
525,60
557,79
604,34
648,43
686,01
739,97
815,69
890,51
955,47
1004,04
1049,47
1093,33
1147,44
Cuadro 9: Resultados del hiperplano de regresión
En la tabla 9 observamos los valores obtenidos en el plano de regresión;
Veamos ahora los coeficientes del plano de regresión ası́ como los coeficientes de determinación y correlación que obtenemos, usando las fórmulas anteriores.
Para ello necesitaremos conocer las varianzas marginales;
Sy2
N
1 X 2
=
y − y 2 = 607526,87 − (731,31)2 = 72705,67,
N i=1 i
Sx21 =
N
1 X 2
x − x1 2 = 3537,51 − (52,10)2 = 822,89,
N i=1 1i
Sx22 =
N
1 X 2
x − x2 2 = 3980049 − (1995)2 = 24,
N i=1 2i
las desviaciones tı́picas,
Sy =
p
72705,67 = 269,64,
38
S x1 =
Sx2
p
822,89 = 28,69,
√
= 24 = 4,90,
las covarianzas;
N
1 X
yi x1i − y · x1 = 45042,53 − (731,31 · 52,10) = 6939,60,
=
N i=1
Syx1
Syx2
N
1 X
=
yi x2i − y · x2 = 1460175,74 − (731,31 · 1995) = 1202,90,
N i=1
S x1 x2
N
1 X
x1i x2i − x1 · x2 = 104083,27 − (52,10 · 1995) = 139,86,
=
N i=1
y los coeficientes de correlación lineal simple;
Ryx1 =
Syx1
6939,60
= 0,90,
=
S y · S x1
269,64 · 28,69
Ryx2 =
1202,90
Syx2
=
= 0,91,
S y · S x2
269,64 · 4,90
R x1 x2 =
S x1 x2
139,86
= 0,99.
=
Sx1 · Sx2
28,69 · 4,90
Hay que resaltar que estos coeficientes de correlación lineal simple, sólo se calculan para
emplearlos en las expresiones que nos determinan el coeficiente de regresión parcial b1 y b2 .
Al existir una fuerte correlación o multicolinealidad en sentido amplio entre x1i y x2i , pues
Rx1 x2 = 0,99, los Ryx1 y Ryx2 no nos pueden explicar el grado de dependencia entre la
variable endógena y cada una de las exógenas por separado. Para ello x1i y x2i tendrı́an que
estar incorreladas, cosa que no suele ocurrir en la evolución de caracterı́sticas socioeconómicas.
Lo que hay que perseguir es que la correlación entre las variables explicativas sea la menor
posible, con objeto de que b1 y b2 representen con la mayor nitidez posible las variaciones de
yti ante variaciones unitarias de las variables explicativas.
Veamos los coeficientes de regresión parcial y su significado,
b1 =
269,64 0,90 − (0,91 · 0,99)
Sy Ryx1 − Ryx2 Rx1 x2
·
=
·
= −8,98,
2
S x1
1 − R x1 x2
28,69
1 − (0,99)2
b2 =
Sy Ryx2 − Ryx1 Rx1 x2 269,64 0,91 − (0,90 · 0,99)
·
·
= 102,42,
S x2
1 − Rx2 1 x2
4,90
1 − (0,99)2
39
b0 = Y − b1 X1 − b2 X2 = 731,31 − (−8,98) · 52,10 − (102,42) · 1995 = −203138,62.
El coeficiente b1 es la derivada parcial de yti respecto de x1i y significa que al variar x1i en
una unidad, permaneciendo constante x2i , la yti varı́a en -8.98, esto quiere decir que si el
IPC subiera un punto porcentual dejando constante el año, entonces el precio medio de la
vivienda disminuirı́a en 8,98 euros. Esta falta de pureza en el resultado es debido, como
ya mencionamos antes, a la elevada multicolinealidad entre las variables explicativas. b2 nos
indica la variación de yti cuando la x2i varı́a en una unidad, permaneciendo constante x1i , i.e.,
el precio medio de la vivienda aumenta en 102,42 euros cuando se incrementa el tiempo en
un año y se mantiene constante el IPC.
El plano obtenido es
Y = −203138,62 − 8,98X1 + 102,42X2 ,
y para determinar el coeficiente de correlación múltiple necesitamos calcular,
2
Sry·x
= Sy2 − b1 Syx1 − b2 Syx2 = 72705,67 − (−8,98) · 6939,60 − 102,42 · 1202,90 = 11783,22,
1 x2
2
Syt ·x1 x2 = Sy2 − Sry·x
= 72705,67 − 11783,22 = 60922,45.
1 x2
Ası́ que el coeficiente de determinación múltiple viene dado por la siguiente expresión;
2
Ry·x
=
1 x2
Ry·x1 x2
Sy2
=
60922,45
= 0,84,
72705,67
Sy2t ·x1 x2
q
p
2
= Ry·x
=
0,84 = 0,92.
1 x2
Significa que el grado de dependencia global entre el precio medio de la vivienda en relación
al tiempo y al IPC es de un 92 %.
Veamos los coeficientes de determinación y correlación parciales;
2
Ryx
=
1 ·x2
(090 − 0,91 · 0,99)2
(Ryx1 − Ryx2 · Rx1 x2 )2
= 0,05,
=
2 )
(1 − Rx2 1 x2 )(1 − Ryx
(1 − (0,99)2 )(1 − (0,91)2 )
2
lo que significa que una vez que hemos realizado la regresión del precio medio de la vivienda
2
sobre el tiempo, quedará una varianza residual o no explicada, Sry·2
, que debe reducirse a la
introducción en el modelo de la variable IPC, lo que quiere decir que al introducir la variable
IPC la varianza residual queda explicada en un 0.05 % (es decir, no tiene mucha influencia).
De la misma forma
2
Ryx
=
2 ·x1
(Ryx2 − Ryx1 · Rx1 x2 )2 (0,91 − 0,90 · 0,99)2
= 0,17,
2 ) (1 − (0,99)2 )(1 − (0,90)2 )
(1 − Rx2 1 x2 )(1 − Ryx
1
40
es decir, una vez hecha la regresión del precio medio de la vivienda sobre el IPC, la varianza
residual quedará explicada en un 17 % al introducir la variable tiempo al modelo. Podemos
concluir diciendo que la variable tiempo tiene una mayor influencia en la evolución del precio
medio de la vivienda que el IPC.
Por último, veamos una pequeña tabla con distintos valores del IPC para ver las predicciones posibles para el año 2004.
IPC=X1i
99
100
101
102
103
104
Año=X2i
2004
2004
2004
2004
2004
2004
Regresión
1232,22
1223,24
1214,27
1205,29
1196,31
1187,34
Los resultados obtenidos parecen ser algo contradictorios, ya que si mantenemos fijo el año
2004 y vamos variando el IPC, deberı́a ocurrir que el precio medio de la vivienda, al aumentar
el IPC, aumentase, pero no es ası́, ya que el coeficiente del plano de regresión asociado a la
variable x1i es negativo. Esto se debe en gran medida al coeficiente de correlación parcial
Ryx1 ·x2 =0.05, es decir la influencia que tiene el IPC en el modelo si incluimos esta variable
una vez ya hecha la regresión del precio medio de la vivienda sobre el tiempo.
Al igual que hemos obtenido este plano de regresión tomando estas variables independientes, podrı́amos haber elegido otras, y proceder de igual forma en su cálculo.
41
Descargar