Vectores Autorregresivos (VAR) 1 Procesos estocasticos multivariados 0 Yt = [Y1t , Y2t , · · · , YN t ] , t = 1, 2, . . . , T Estamos interesados en el comportamiento temporal de N variables simultaneamente. • E(Yt ) = µ • E(Yt − µ)(Yt−τ − µ)0 = Γ(τ ) (vector de esperanzas) (matriz de autocovarianzas) El elemento i, j es: γi,j = E(Yit − µit )(Yj,t−τ − µj,t−τ ) Los elementos de la diagonal son las autocovarianzas y los de fuera de la diagonal las autocovarianzas cruzadas. Walter Sosa Escudero. Banco Central de Chile. 2006. - 2- Yt es estacionario si: 1. E(Yt ) = µ < ∞. 2. E(Yt − µ)(Yt−τ − µ)0 = Γ(τ ) < ∞, τ = 0, 1, 2, . . . Estacionariedad de Yt implica estacionariedad de Yit , i = 1, . . . , N . El converso NO es cierto (porque?) Walter Sosa Escudero. Banco Central de Chile. 2006. - 3- Ruido Blanco Multivariado εt es N × 1. Es RBM si: 1. E(εt ) = 0 Ω N ×N 2. E(εt ε0s ) = 0 si t = s si t 6= s Cuidado: los elementos de εt pueden estar correlacionados contemporaneamente pero no en distintos periodos!! Walter Sosa Escudero. Banco Central de Chile. 2006. - 4- Vectores Autorregresivos (VAR) VAR(1) con media cero Yt = ΦYt−1 + εt , εt ∼ RBM Yt es N × 1, Φ es N × N . Ejemplo: X t Zt = φ11 Xt−1 + φ12 Zt−1 + ε1t = φ12 Xt−1 + φ12 Zt−1 + ε2t Relacion entre el presente de una variable y el pasado de todas las variables del sistema. • ε1t y ε2t pueden estar correlacionados. Walter Sosa Escudero. Banco Central de Chile. 2006. - 5- Motivacion historica y metodologica del uso de VAR’s • Motivacion: Sims (1980). • Discusion metodologica: Pagan (1987) Walter Sosa Escudero. Banco Central de Chile. 2006. - 6- Algunos resultados utiles de algebra • Si A es cuadrada y diagonal con elemento carateristico aii , AK es una matriz diagonal con elemento i, i igual a aK ii . • Am×m . Cualquier escalar λ que satisfaga Ax = λx para un vector m × 1, x 6= 0 es un autovalor de A. x es un autovector de A correspondiente al autovalor λ. • Si λ es un autovalor de A, entonces |A − λI| = 0. • La ecuacion caracteristica |A − λI| = 0 es una ecuacion de grado m. Entonces, Amm tiene m autovalores. • Am×m con autovalores λ1 , λ2 , . . . , λm , entonces: Pm (a) tr(A) = i=1 λi Qm (b) |A| = i=1 λi Walter Sosa Escudero. Banco Central de Chile. 2006. - 7- • Si Am×m tiene m autovalores diferentes, entonces los autovectores asociados son todos linealmente independientes. • Si Am×m tiene m autovalores diferentes y Λ ≡ diag(λ1 , . . . , λm ) y X ≡ (x1 , x2 , · · · , xm ), entonces: A = XΛX −1 • Bajo las condiciones del resultado anterior: AK = AA · · · A = (XΛX −1 )(XΛX −1 ) · · · (XΛK X −1 ) = XΛK X −1 K con ΛK = diag(λK 1 , . . . , λm ) Walter Sosa Escudero. Banco Central de Chile. 2006. - 8- Estacionariedad de VAR(1) Recordar caso AR(1): Yt = φYt−1 + εt . Estacionario si |φ| < 1. Notar que Yt = ΦYt−1 + εt y Yt−1 = ΦYt−2 + εt−1 . Reemplazando: Yt = Φ2 Yt−2 + ε + Φεt−1 Reemplazando ahora Yt−2 y luego Yt−3 , etc.: Yt = k−1 X Φj εt−j + Φk Yt−k j=0 En forma similar a AR(1) requeriremos que Φk → 0, o, equivalentemente, |Φ| < 1 (en un sentido matricial). Walter Sosa Escudero. Banco Central de Chile. 2006. - 9- De acuerdo al resultado anterior Φ = XΛX −1 en donde X es la matriz de autovectores y Λ la matriz diagonal con los autovalores λ1 , . . . , λN . Entonces, Φk = XΛk X −1 de modo que ΦK → 0 si y solo si |λi | < 1, i = 1, . . . , N . Resumiendo: Yt = ΦYt−1 + εt es estacionario si y solo si todos los autovalores de Φ son < 1 en valor absoluto, o, equivalentemente, si todas las raices de la ecuacion caracteristica |Φ − λIN | son menores a uno en valor absoluto. Walter Sosa Escudero. Banco Central de Chile. 2006. - 10 - Si VAR(1) es estacionario: Yt = ∞ X Φj εt−j j=0 es la representacion V M A(∞) estacionaria del VAR(1). Walter Sosa Escudero. Banco Central de Chile. 2006. - 11 - VAR(p) Yt = Φ1 Yt−1 + Φ2 Yt−2 + · · · + Φp Yt−p + εt , εt ∼ RBM Estacionariedad de VAR(p): todas las raices de |λp I − λp−1 Φ1 − · · · − Φp | = 0 son mayores que uno en valor absoluto. Resultado importante: Si VAR(p) es estacionario, tiene una representacion VMA(∞) estacionaria. Esto es una consecuencia del Teorema de Descomposicion de Wold. Walter Sosa Escudero. Banco Central de Chile. 2006. - 12 - Estimacion de VAR Consideremos VAR(1): X t Zt = φ11 Xt−1 + φ12 Zt−1 + ε1t = φ12 Xt−1 + φ12 Zt−1 + ε2t • Notar que MCO es consistente, ecuacion por ecuacion. • Es un caso particular de SUR con las mismas variables explicativas en cada ecuacion: MCG coincide con MCO, no hay ganancia de eficiencia. Explica gran parte de la popularidad de VAR. Walter Sosa Escudero. Banco Central de Chile. 2006. - 13 - Interpretacion de VAR • No es una forma estructural. Los coeficientes no tienen una interpretacion clara ya que solo se busca una representacion de los datos. • En la practica es comun basar la interpretacion en tests agregados y ejercicios de simulacion. • Simulacion: a) Funciones impulso-respuesta, b) Descomposicion de la varianza. • Tests: a) Relevancia de variables, b) Significatividad de rezagos, c) Relaciones entre ecuaciones, d) Causalidad de Granger. Walter Sosa Escudero. Banco Central de Chile. 2006. - 14 - Funciones impulso-respuesta Objetivo: investigar que sucede con el sistema VAR ante variaciones exogenas. Consideremos la representacion VMA(∞) de VAR(p): Yt = ∞ X Ψs εt−s , Ψ0 = Im , εt ∼ RBM s=0 ∂Yt ∂Yt+s = = Ψs ∂εt−j ∂εt Ψij (s) : Efecto sobre Yi,t+s de cambiar εjt en una unidad. p Ψij (s)/ V (εjt ): Efecto sobre Yi,t+s de cambiar εjt en un desvio estandar: funcion de impulso-respuesta simple. Walter Sosa Escudero. Banco Central de Chile. 2006. - 15 - Ejemplo: VAR(1) con N = 2, hay 4 funciones de impulso respuesta simple. Problema: εit no son independientes. N = 2 V (εt ) = Ω = σ11 σ12 σ21 σ22 No es intuitivo hablar de cambios en ε1t dejando ε2t . Walter Sosa Escudero. Banco Central de Chile. 2006. - 16 - Mas resultados de algebra 1. Si Ω es simetrica y positiva definida, existe H no singular, tal que Ω = HH 0 . H es una ‘raiz cuadrada’ de Ω. H no es unica. 2. Si εt es un vector aleatorio con E(εt ) = 0 y V (εt ) = E(εt ε0t ) = Ω, existe H tal que εt = Hvt , en donde vt es un vector aleatorio con E(vt ) = 0 y V (vt ) = I . vt son las innovaciones ortogonales de εt . La idea es: vt −→ Hvt −→ εt −→ Yt Entonces, lo que realmente nos interesa es ∂Yt+s /∂vt . • Problema: H no es unica. Si Ω es simetrica y positiva definida, existe una unica matrix P no-singular y triangular inferior tal que P P 0 = Ω. P es la matriz de Choleski de Ω. Walter Sosa Escudero. Banco Central de Chile. 2006. - 17 - La idea, entonces, es utilizar: εt = P vt . Reemplazando: Yt = ∞ X i=1 Ψs P vt−s = ∞ X Φs vt−s , Φ ≡ Ψs P i=1 ∂Yt+s ∂Yt = = Φs ∂vt−s ∂vt (s) Elemento caracteristico: φij = cambio en Yi,t+s resultante de cambios en vj,t en una unidad. ¨ ¥ (s) φij = funcion de impulso-respuesta § ¦ con respecto a las innovaciones ortogonales. Notar que como V (vj,t = 1) tambien mide el efecto de cambios en 1 desvio estandar. Walter Sosa Escudero. Banco Central de Chile. 2006. - 18 - Cuestion importante: el uso de P (la descomposicion de Choleski) implica cierta arbitrariedad. Ejemplo: N = 2 ! à ε1t ε2t à = ! !à P11 0 v1t P21 P22 v2t ε1t depende solo de v1t ε2t depende de v1t y v2t La dependencia entre ε1t y ε2t es generada por esta estructura recursiva. Que implicaciones tiene, por ejemplo, si Y1 es la tasa de crecimiento de la cantidad nominal de dinero y Y2 es la tasa de inflacion? Entonces, el orden de las variables en la matriz de Choleski es muy importante. Walter Sosa Escudero. Banco Central de Chile. 2006. - 19 - Notar que si Ω= σ11 0 0 σ22 P = =⇒ √ σ11 0 0 √ σ22 • Si Ω es diagonal el orden de la descomposicion de Choleski no importa. • Trivialmente, las innovaciones originales son tambien las innovaciones ortogonales. • En la practica, entonces, es importante evaluar empiricamente la diagonalidad de Ω. Walter Sosa Escudero. Banco Central de Chile. 2006. - 20 - Seguimos con el algebra... • Si Ω es simetrica y pd, existe una unica matriz H triangular inferior con 1’s en la diagonal principal, y una unica matriz diagonal D con todos sus elementos positivos, tal que Ω = HDH 0 . • Si εt es un vector aleatorio con E(εt ) = 0 y V (εt ) = Ω, entonces εt puede escribirse com εt = Hut , con E(ut ) = 0 y V (ut ) = D, en donde H y D satisfacen Ω = HDH 0 . Notar que V (ujt ) = dj , el j−esimo elemento de la diagonal principal de D. La idea, en este caso, es permitir que cada una de las innovaciones ortogonales tenga su propia varianza. Walter Sosa Escudero. Banco Central de Chile. 2006. - 21 - Disgresion notacional X= Chequear que: XX 0 = A1 A2 A1 B1 A2 B2 h ≡ i A1 A2 h i A B + B1 B2 h i B1 B2 0 En general, si xi es la i-esima columna de X , XX = P xi x0i . Es facil verificar que si D es diagonal con elemento P caracteristico di , XDX 0 = di xi x0i Walter Sosa Escudero. Banco Central de Chile. 2006. - 22 - Descomposicion de la varianza • Supongamos un VAR con N variables. Cuanto de la variabilidad total de una variable es atribuible a movimientos en cada una de las otras variables? • R2 en el modelo lineal: proporcion de la varianza de Y que es explicada por movimientos en X . La idea es proporcionar una idea similar para descomponer la variabilidad total de una variable del VAR en terminos de las variabilidades exogenas de cada una de las variables del sistema. Walter Sosa Escudero. Banco Central de Chile. 2006. - 23 - Partimos de la representacion MA(∞) de VAR: Yt = ∞ X Ψs εt−s , Ψ0 = Im , εt ∼ RBM s=0 que implica que: V (Yt ) = = ∞ X s=0 ∞ X Ψs ΩΨ0s Ψs HDH 0 Ψ0s s=0 = ∞ X Ψs s=0 = N X i=1 (N X ( di ) di hi h0i Ψ0s i=1 ∞ X ) Ψs hi h0i Ψ0s s=0 Walter Sosa Escudero. Banco Central de Chile. 2006. - 24 - V (Yt ) = N X V (ui ) (∞ X = Ψs hi h0i Ψ0s s=0 i=1 N X ) V (ui ) B (i) i=1 En particular, la j-esima varianza: V (Ytj ) = N X (i) V (ui )Bjj i=1 1= (i) N X V (ui )Bjj i=1 V (Ytj ) = N X zji i=1 zji = proporcion de la varianza de la j−esima variable que es explicada por el componente exogeno de cada una de las i = 1, 2, . . . , N variables del sistema. Walter Sosa Escudero. Banco Central de Chile. 2006. - 25 - En la practica: no podemos computar ∞ rezagos! Partimos de la representacion V M A(∞) de VAR en t + 1: Yt+1 = εt+1 + Ψ1 εt + Ψ2 εt−1 + · · · La prediccion de Yt+1 con la informacion disponible en t es la esperanza de Yt+1 condicional en toda la informacion disponible en t: Et (Yt+1 ) = Ψ1 εt + Ψ2 εt−1 + · · · El error de pronostico de predecir Yt+1 en t sera: Yt+1 − Et (Yt+1 ) = εt+1 Walter Sosa Escudero. Banco Central de Chile. 2006. - 26 - Analogamente, el error de pronostico de predecir Yt+s en t sera: et+2 ≡ Yt+s −Et (Yt+s ) = εt+s +Ψ1 εt+s−1 +Ψ2 εt+s−2 +· · ·+Ψs−1 εt+1 El valor esperado de et+s es cero y su varianza es: V (et+s ) = Ω + Ψ01 ΩΨ1 + Ψ02 ΩΨ2 + · · · + Ψ0s−1 ΩΨs−1 • Da una idea de la magnitud del error de prediccion (es el error cuadratico medio ya que la esperanza es cero!). • Notar que cuando s → ∞, V (et+s ) → V (Yt ). ¨ ¥ En la practica: computar la descomposicion para s = 1, 2, 3, . . . § ¦ Walter Sosa Escudero. Banco Central de Chile. 2006. - 27 - Tests de hipotesis basicas en VAR Supongamos que nos interesa evaluar si cierta restriccion sobre los parametros del VAR es correcta, H0 : h(θ) = 0 versus h(θ) = 0 en donde θ son todos los parametros del VAR y h es cualquier funcion continua. Si εt ∼ RBN (0, Ω) ³ ´ (T − c) ln |Ω̂r | − ln |Ω̂u | ∼ χ2 (m) asintoticamente bajo H0 , en donde Ω̂r y Ωu son las matrices de varianzas estimadas bajo el modelo restringido y sin restringir, respectivamente, m es el numero de restricciones, c es el numero de parametros estimados en cada ecuacion en el modelo sin restringir, y T es el numero de observaciones utilizables. Walter Sosa Escudero. Banco Central de Chile. 2006. - 28 - Ejemplos 1. Relevancia de rezagos: Ejemplo, si en con series trimestrales los rezagos del 9 al 12 son relevantes. Modelo sin restringir: incluye los 12 rezagos, sin restringir: solo los primeros 8. 2. Relevancia de variables: todos los rezagos de una variable son irrelevantes en todas las ecuaciones. Walter Sosa Escudero. Banco Central de Chile. 2006. - 29 - Causalidad de Granger Consideremos la primera ecuacion de la representacion VAR(p) para xt y yt : xt = c + p X i=1 αi xt−i + p X βi yt−i i=1 yt no causa a xt en el sentido de Granger si β1 = β2 = · · · = βp = 0 La hipotesis puede ser facilmente evaluada con un test F de significatividad conjunta (existen varias alternativas). En forma similar se puede definir ausencia de causalidad de Granger de xt . Walter Sosa Escudero. Banco Central de Chile. 2006. - 30 - • Es uno de los resultados mas abusados en econometria. • En realidad evalua si el pasado de yt contribuye a predecir xt . Es mas un test que tiene que ver con precedencia temporal y no con causalidad. Ejemplo 1: Forward-looking behavior y precios de acciones. Ejemplo 2: Shocks en los precios de petroleo y recesiones. Ejemplo 3: Efectos reales del dinero (Stock y Watson (1989), Christiano y Ljungqvist (1988)). Walter Sosa Escudero. Banco Central de Chile. 2006. - 31 -