Vectores Autorregresivos (VAR)

Anuncio
Vectores Autorregresivos (VAR)
1
Procesos estocasticos multivariados
0
Yt = [Y1t , Y2t , · · · , YN t ] ,
t = 1, 2, . . . , T
Estamos interesados en el comportamiento temporal de N
variables simultaneamente.
• E(Yt ) = µ
• E(Yt − µ)(Yt−τ − µ)0 = Γ(τ )
(vector de esperanzas)
(matriz de autocovarianzas)
El elemento i, j es: γi,j = E(Yit − µit )(Yj,t−τ − µj,t−τ )
Los elementos de la diagonal son las autocovarianzas y los de
fuera de la diagonal las autocovarianzas cruzadas.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 2-
Yt es estacionario si:
1. E(Yt ) = µ < ∞.
2. E(Yt − µ)(Yt−τ − µ)0 = Γ(τ ) < ∞,
τ = 0, 1, 2, . . .
Estacionariedad de Yt implica estacionariedad de
Yit , i = 1, . . . , N . El converso NO es cierto (porque?)
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 3-
Ruido Blanco Multivariado
εt es N × 1. Es RBM si:
1. E(εt ) = 0

 Ω
N ×N
2. E(εt ε0s ) =
 0
si t = s
si t 6= s
Cuidado: los elementos de εt pueden estar correlacionados
contemporaneamente pero no en distintos periodos!!
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 4-
Vectores Autorregresivos (VAR)
VAR(1) con media cero
Yt = ΦYt−1 + εt ,
εt ∼ RBM
Yt es N × 1, Φ es N × N .
Ejemplo:

 X
t
 Zt
=
φ11 Xt−1 + φ12 Zt−1 + ε1t
=
φ12 Xt−1 + φ12 Zt−1 + ε2t
Relacion entre el presente de una variable y el pasado de
todas las variables del sistema.
• ε1t y ε2t pueden estar correlacionados.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 5-
Motivacion historica y metodologica del uso de VAR’s
• Motivacion: Sims (1980).
• Discusion metodologica: Pagan (1987)
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 6-
Algunos resultados utiles de algebra
• Si A es cuadrada y diagonal con elemento carateristico
aii , AK es una matriz diagonal con elemento i, i igual a
aK
ii .
• Am×m . Cualquier escalar λ que satisfaga Ax = λx para
un vector m × 1, x 6= 0 es un autovalor de A. x es un
autovector de A correspondiente al autovalor λ.
• Si λ es un autovalor de A, entonces |A − λI| = 0.
• La ecuacion caracteristica |A − λI| = 0 es una ecuacion
de grado m. Entonces, Amm tiene m autovalores.
• Am×m con autovalores λ1 , λ2 , . . . , λm , entonces:
Pm
(a) tr(A) = i=1 λi
Qm
(b) |A| = i=1 λi
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 7-
• Si Am×m tiene m autovalores diferentes, entonces los
autovectores asociados son todos linealmente
independientes.
• Si Am×m tiene m autovalores diferentes y
Λ ≡ diag(λ1 , . . . , λm ) y X ≡ (x1 , x2 , · · · , xm ), entonces:
A = XΛX −1
• Bajo las condiciones del resultado anterior:
AK = AA · · · A = (XΛX −1 )(XΛX −1 ) · · · (XΛK X −1 ) = XΛK X −1
K
con ΛK = diag(λK
1 , . . . , λm )
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 8-
Estacionariedad de VAR(1)
Recordar caso AR(1): Yt = φYt−1 + εt . Estacionario si |φ| < 1.
Notar que Yt = ΦYt−1 + εt y Yt−1 = ΦYt−2 + εt−1 .
Reemplazando:
Yt = Φ2 Yt−2 + ε + Φεt−1
Reemplazando ahora Yt−2 y luego Yt−3 , etc.:
Yt =
k−1
X
Φj εt−j + Φk Yt−k
j=0
En forma similar a AR(1) requeriremos que Φk → 0, o,
equivalentemente, |Φ| < 1 (en un sentido matricial).
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 9-
De acuerdo al resultado anterior Φ = XΛX −1 en donde X es
la matriz de autovectores y Λ la matriz diagonal con los
autovalores λ1 , . . . , λN . Entonces,
Φk = XΛk X −1
de modo que ΦK → 0 si y solo si |λi | < 1, i = 1, . . . , N .
Resumiendo: Yt = ΦYt−1 + εt es estacionario si y solo si
todos los autovalores de Φ son < 1 en valor absoluto, o,
equivalentemente, si todas las raices de la ecuacion
caracteristica |Φ − λIN | son menores a uno en valor absoluto.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 10 -
Si VAR(1) es estacionario:
Yt =
∞
X
Φj εt−j
j=0
es la representacion V M A(∞) estacionaria del VAR(1).
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 11 -
VAR(p)
Yt = Φ1 Yt−1 + Φ2 Yt−2 + · · · + Φp Yt−p + εt ,
εt ∼ RBM
Estacionariedad de VAR(p): todas las raices de
|λp I − λp−1 Φ1 − · · · − Φp | = 0
son mayores que uno en valor absoluto.
Resultado importante: Si VAR(p) es estacionario, tiene una
representacion VMA(∞) estacionaria. Esto es una
consecuencia del Teorema de Descomposicion de Wold.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 12 -
Estimacion de VAR
Consideremos VAR(1):

 X
t
 Zt
=
φ11 Xt−1 + φ12 Zt−1 + ε1t
=
φ12 Xt−1 + φ12 Zt−1 + ε2t
• Notar que MCO es consistente, ecuacion por ecuacion.
• Es un caso particular de SUR con las mismas variables
explicativas en cada ecuacion: MCG coincide con MCO, no
hay ganancia de eficiencia. Explica gran parte de la
popularidad de VAR.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 13 -
Interpretacion de VAR
• No es una forma estructural. Los coeficientes no tienen
una interpretacion clara ya que solo se busca una
representacion de los datos.
• En la practica es comun basar la interpretacion en tests
agregados y ejercicios de simulacion.
• Simulacion: a) Funciones impulso-respuesta, b)
Descomposicion de la varianza.
• Tests: a) Relevancia de variables, b) Significatividad de
rezagos, c) Relaciones entre ecuaciones, d) Causalidad de
Granger.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 14 -
Funciones impulso-respuesta
Objetivo: investigar que sucede con el sistema VAR ante
variaciones exogenas.
Consideremos la representacion VMA(∞) de VAR(p):
Yt =
∞
X
Ψs εt−s ,
Ψ0 = Im , εt ∼ RBM
s=0
∂Yt
∂Yt+s
=
= Ψs
∂εt−j
∂εt
Ψij (s) : Efecto sobre Yi,t+s de cambiar εjt en una unidad.
p
Ψij (s)/ V (εjt ): Efecto sobre Yi,t+s de cambiar εjt en un
desvio estandar: funcion de impulso-respuesta simple.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 15 -
Ejemplo: VAR(1) con N = 2, hay 4 funciones de impulso
respuesta simple.
Problema: εit no son independientes. N = 2


V (εt ) = Ω = 
σ11
σ12
σ21
σ22

No es intuitivo hablar de cambios en ε1t dejando ε2t .
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 16 -
Mas resultados de algebra
1. Si Ω es simetrica y positiva definida, existe H no
singular, tal que Ω = HH 0 . H es una ‘raiz cuadrada’ de
Ω. H no es unica.
2. Si εt es un vector aleatorio con E(εt ) = 0 y
V (εt ) = E(εt ε0t ) = Ω, existe H tal que εt = Hvt , en donde
vt es un vector aleatorio con E(vt ) = 0 y V (vt ) = I .
vt son las innovaciones ortogonales de εt . La idea es:
vt −→ Hvt −→ εt −→ Yt
Entonces, lo que realmente nos interesa es ∂Yt+s /∂vt .
• Problema: H no es unica. Si Ω es simetrica y positiva
definida, existe una unica matrix P no-singular y triangular
inferior tal que P P 0 = Ω. P es la matriz de Choleski de Ω.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 17 -
La idea, entonces, es utilizar: εt = P vt . Reemplazando:
Yt =
∞
X
i=1
Ψs P vt−s =
∞
X
Φs vt−s ,
Φ ≡ Ψs P
i=1
∂Yt+s
∂Yt
=
= Φs
∂vt−s
∂vt
(s)
Elemento caracteristico: φij = cambio en Yi,t+s resultante
de cambios en vj,t en una unidad.
¨
¥
(s)
φij = funcion de impulso-respuesta
§
¦
con respecto a las innovaciones ortogonales.
Notar que como V (vj,t = 1) tambien mide el efecto de cambios en 1
desvio estandar.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 18 -
Cuestion importante: el uso de P (la descomposicion de
Choleski) implica cierta arbitrariedad.
Ejemplo: N = 2
!
Ã
ε1t
ε2t
Ã
=
!
!Ã
P11
0
v1t
P21
P22
v2t
ε1t depende solo de v1t
ε2t depende de v1t y v2t
La dependencia entre ε1t y ε2t es generada por esta estructura recursiva.
Que implicaciones tiene, por ejemplo, si Y1 es la tasa de crecimiento de
la cantidad nominal de dinero y Y2 es la tasa de inflacion?
Entonces, el orden de las variables en la matriz de Choleski
es muy importante.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 19 -
Notar que si

Ω=
σ11
0
0
σ22



P =
=⇒
√

σ11
0
0
√

σ22
• Si Ω es diagonal el orden de la descomposicion de
Choleski no importa.
• Trivialmente, las innovaciones originales son tambien las
innovaciones ortogonales.
• En la practica, entonces, es importante evaluar
empiricamente la diagonalidad de Ω.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 20 -
Seguimos con el algebra...
• Si Ω es simetrica y pd, existe una unica matriz H
triangular inferior con 1’s en la diagonal principal, y una
unica matriz diagonal D con todos sus elementos positivos,
tal que Ω = HDH 0 .
• Si εt es un vector aleatorio con E(εt ) = 0 y V (εt ) = Ω,
entonces εt puede escribirse com εt = Hut , con E(ut ) = 0 y
V (ut ) = D, en donde H y D satisfacen Ω = HDH 0 .
Notar que V (ujt ) = dj , el j−esimo elemento de la diagonal
principal de D. La idea, en este caso, es permitir que cada
una de las innovaciones ortogonales tenga su propia
varianza.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 21 -
Disgresion notacional

X=
Chequear que:

XX 0 = 

A1
A2


A1
B1
A2
B2
h
≡
i
A1
A2
h
i
A B

+

B1
B2

h
i
B1
B2
0
En general, si xi es la i-esima columna de X , XX =
P
xi x0i .
Es facil verificar que si D es diagonal con elemento
P
caracteristico di , XDX 0 =
di xi x0i
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 22 -
Descomposicion de la varianza
• Supongamos un VAR con N variables. Cuanto de la
variabilidad total de una variable es atribuible a
movimientos en cada una de las otras variables?
• R2 en el modelo lineal: proporcion de la varianza de Y
que es explicada por movimientos en X . La idea es
proporcionar una idea similar para descomponer la
variabilidad total de una variable del VAR en terminos
de las variabilidades exogenas de cada una de las
variables del sistema.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 23 -
Partimos de la representacion MA(∞) de VAR:
Yt =
∞
X
Ψs εt−s ,
Ψ0 = Im , εt ∼ RBM
s=0
que implica que:
V (Yt ) =
=
∞
X
s=0
∞
X
Ψs ΩΨ0s
Ψs HDH 0 Ψ0s
s=0
=
∞
X
Ψs
s=0
=
N
X
i=1
(N
X
(
di
)
di hi h0i
Ψ0s
i=1
∞
X
)
Ψs hi h0i Ψ0s
s=0
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 24 -
V (Yt )
=
N
X
V (ui )
(∞
X
=
Ψs hi h0i Ψ0s
s=0
i=1
N
X
)
V (ui ) B (i)
i=1
En particular, la j-esima varianza:
V (Ytj ) =
N
X
(i)
V (ui )Bjj
i=1
1=
(i)
N
X
V (ui )Bjj
i=1
V (Ytj )
=
N
X
zji
i=1
zji = proporcion de la varianza de la j−esima variable que es
explicada por el componente exogeno de cada una de las
i = 1, 2, . . . , N variables del sistema.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 25 -
En la practica: no podemos computar ∞ rezagos!
Partimos de la representacion V M A(∞) de VAR en t + 1:
Yt+1 = εt+1 + Ψ1 εt + Ψ2 εt−1 + · · ·
La prediccion de Yt+1 con la informacion disponible en t es
la esperanza de Yt+1 condicional en toda la informacion
disponible en t:
Et (Yt+1 ) = Ψ1 εt + Ψ2 εt−1 + · · ·
El error de pronostico de predecir Yt+1 en t sera:
Yt+1 − Et (Yt+1 ) = εt+1
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 26 -
Analogamente, el error de pronostico de predecir Yt+s en t
sera:
et+2 ≡ Yt+s −Et (Yt+s ) = εt+s +Ψ1 εt+s−1 +Ψ2 εt+s−2 +· · ·+Ψs−1 εt+1
El valor esperado de et+s es cero y su varianza es:
V (et+s ) = Ω + Ψ01 ΩΨ1 + Ψ02 ΩΨ2 + · · · + Ψ0s−1 ΩΨs−1
• Da una idea de la magnitud del error de prediccion (es el
error cuadratico medio ya que la esperanza es cero!).
• Notar que cuando s → ∞, V (et+s ) → V (Yt ).
¨
¥
En la practica: computar la descomposicion para s = 1, 2, 3, . . .
§
¦
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 27 -
Tests de hipotesis basicas en VAR
Supongamos que nos interesa evaluar si cierta restriccion
sobre los parametros del VAR es correcta, H0 : h(θ) = 0
versus h(θ) = 0 en donde θ son todos los parametros del
VAR y h es cualquier funcion continua.
Si εt ∼ RBN (0, Ω)
³
´
(T − c) ln |Ω̂r | − ln |Ω̂u | ∼ χ2 (m)
asintoticamente bajo H0 , en donde Ω̂r y Ωu son las matrices
de varianzas estimadas bajo el modelo restringido y sin
restringir, respectivamente, m es el numero de restricciones,
c es el numero de parametros estimados en cada ecuacion
en el modelo sin restringir, y T es el numero de
observaciones utilizables.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 28 -
Ejemplos
1. Relevancia de rezagos: Ejemplo, si en con series
trimestrales los rezagos del 9 al 12 son relevantes.
Modelo sin restringir: incluye los 12 rezagos, sin
restringir: solo los primeros 8.
2. Relevancia de variables: todos los rezagos de una
variable son irrelevantes en todas las ecuaciones.
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 29 -
Causalidad de Granger
Consideremos la primera ecuacion de la representacion
VAR(p) para xt y yt :
xt = c +
p
X
i=1
αi xt−i +
p
X
βi yt−i
i=1
yt no causa a xt en el sentido de Granger si
β1 = β2 = · · · = βp = 0
La hipotesis puede ser facilmente evaluada con un test F de
significatividad conjunta (existen varias alternativas). En
forma similar se puede definir ausencia de causalidad de
Granger de xt .
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 30 -
• Es uno de los resultados mas abusados en econometria.
• En realidad evalua si el pasado de yt contribuye a
predecir xt . Es mas un test que tiene que ver con
precedencia temporal y no con causalidad.
Ejemplo 1: Forward-looking behavior y precios
de acciones.
Ejemplo 2: Shocks en los precios de petroleo y
recesiones.
Ejemplo 3: Efectos reales del dinero (Stock y
Watson (1989), Christiano y Ljungqvist (1988)).
Walter Sosa Escudero. Banco Central de Chile. 2006.
- 31 -
Descargar