Modelos Estadísticos de los Factores de Riesgo

Anuncio
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Modelos Estadı́sticos de los Factores de Riesgo:
Series de Tiempo
Universidad de los Andes y Quantil
Noviembre 3 de 2010
Series de Tiempo
Universidad de los Andes y Quantil
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
1
Estructura básica análisis de riesgo
2
Ejemplos
3
Distribuciones codicionales y no condicionales
4
¿Hacia donde vamos?: medidas de riesgo
5
Métodos para deducir la distribución del proceso de pérdidas
6
Series de tiempo: ARMA - GARCH
7
Modelos básicos para riesgos de mercado
Series de Tiempo
Universidad de los Andes y Quantil
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Introducción
Vamos a concentrarnos en el caso de riesgos financieros de
mercado.
Vt es la variabe aleatoria que representa el valor del portafolio
en el periodo. En general podemos escribir ésta como:
Vt = f (t, Zt )
donde,
f : R × R d → R.
Zt representa los d-factores de riesgo del portafolio,
Zt = (Zt,1 , ..., Zt,d ).
Definimos Xt = Zt − Zt−1 el cambio en los factores de riesgo
durante el periodo t − 1 a t.
Series de Tiempo
Universidad de los Andes y Quantil
Introducción
El valor del portafolio va depender explı́citamente del tiempo
por ejemplo en el caso de portafolios que tienen derivados
(i.e., una opción de compra).
Los factores de riesgo Zt deben ser tal que Xt = Zt − Zt−1 sea
un proceso estacionario (los invariantes, véase Meucci [2007]).
Informalmente Xt sigue un proceso estacionario si la
distribución de cada variable aleatoria Xt es la misma para
todo t y la denotamos por FX .
Introducción
Definimos el proceso estocástico de pérdidas en el periodo
t, t + 1 como L[t,t+1] = − (Vt+1 − Vt ) .
En adelante vamos a denotar estas perdidas por
Lt+1 = L[t,t+1] . Luego
Lt+1 = −(f (t + 1, Zt + Xt+1 ) − f (t, Zt ))
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Ejemplos
Example (Portafolio de acciones)
Supongamos que tenemos un portafolio fijo de d acciones,
λ = (λ1 , ...λd ) donde λi es la cantidad de acciones de la i-ésima
acción.
Sea (St,i )t∈N, i=1,...d el precio de las acciones.
Definamos Zt,i = log(St,i ) como los factores de riesgo y
St,i
).
Xt,i = log( St−1,i
Luego Vt =
d
P
λi exp(Zt,i )
i=1
Series de Tiempo
Universidad de los Andes y Quantil
Ejemplos
Example
Linealizando obtenemos:
d
X
L∆
=
−
λi St,i Xt+1,i
t+1
i=1
Los retornos logarı́tmicos son el candidato a invariantes en un
portafolio de acciones. La linealización tiene muchas ventajas
computacionales.
Ejemplos
Example (Portafolio de bonos cero cupón - sin riesgo de
incumplimiento)
Supongamos que tenemos un portafolio de d bonos cero
cupón con fecha de maduración Ti y precios en t, p (t, Ti ) .
Sea λi la posición en cada bono y supongamos que
normalizamos el precio tal que p (Ti , Ti ) = 1. Definimos las
curva de rendimientos (compuesta continuamente) en t como
y (t, ·) : R → R,
y (t, T ) = −
1
ln(p(t, T ))
T −t
y los factores de riesgo como:
Zt,i = y (t, Ti )
Ejemplos
Example
Entonces:
Vt =
d
X
λi exp(−(Ti − t)Zt,i ).
i=1
En este caso el invariante es Xt,i = Zt,i − Zt−1,i .
Ejemplos
Example (Opción de compra europea)
Supongamos que tenemos un portafolio consistente de una
única opción europea sobre una acción con precio de ejercicio
K , maduración T y precio de la acción St .
El valor de la opción C es, según el modelo de Black - Scholes,
C (s, S, r , σ, K , T ) = SΦ (d1 ) − Ke −r (T −s) Φ(d2 )
d1 = d1 (s, S, r , σ, K , T )
d2 = d2 (s, S, r , σ, K , T )
donde Φ es la función de distribución normal estándar, r la
tasa de interés compuesta libre de riesgo, σ es la volatilidad
anualizada del precio de la acción.
Ejemplos
Los últimos ejemplos ponen de manifiesto la generalidad del
marco teórico.
Existe una infinidad de ejemplos relacionados con riesgos en el
sector real de una economı́a.
Un poco de reflexión sobre el tema muestra que lo
verdaderamente importante de la metodologı́a no es la pérdida
como concepto (éste sólo es un ejemplo de la variable objetivo
del administrador de riesgo).
Lo importante desde el punto de vista conceptual es
identificar la variable objetivo y sus fuentes de incertidumbre
(factores de riesgo).
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Distribuciones codicionales y no condicionales
Sea (Xt )t∈N un proceso estacionario. Denotamos por FX la
distribución de Xt .
Definimos Ft como la información disponible hasta t.
Tı́picamente Ft = σ(X1 , ...Xt )
En la mayorı́a de los modelos de riesgo FXt+1 pFt , la distribución
condicional de Xt+1 dado Ft no es igual a FX .
Un caso particular es cuando (Xt )t∈N son independientes. En
ese caso FXt+1 pFt = FX .
Series de Tiempo
Universidad de los Andes y Quantil
Distribuciones codicionales y no condicionales
¿Por qué es relevante la distribución condicional?
Por ejemplo en un libro estándar de administración de riesgos
de mercado Risk and Asset Allocation, Meucci 2007, se
concentran en invariantes i.i.d.
La importancia radica en la siguiente descomposición. Sean X
y Y variables aleatoria y supongamos que queremos
pronósticar Y .
La siguiente relación es conocida (teorema de descomposición
de varianza):
V (Y )
=
V (E (Y p X )) + E (V (Y p X ))
⇒
V (Y )
≥
E (V (Y p X ))
Distribuciones codicionales y no condicionales
Es decir, en promedio, los pronósticos de la variable
condicionada son más precisos que los de la variable sin
condicionar.
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
¿Hacia donde vamos?: medidas de riesgo
Existen por lo menos tres formas estándar de cuantificar el
riesgo de un portafolio.
1
2
3
Medidas de riesgo basadas en la distribución de la pérdida o el
retorno que implican el análisis estadı́stico de los factores
(análisis de factores).
Medidas de riesgo basadas en la distribución de la pérdida para
diferentes escenarios del proceso de los factores de riesgo
(análisis de escenarios).
Lı́mites superiores e inferiores al riesgo consistente con el
modelo de incertidumbre de los factores (Stress testing de
factores).
Series de Tiempo
Universidad de los Andes y Quantil
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Métodos para deducir la distribución del proceso de
pérdidas
Modelos básicos basados en modelar los factores de riesgo:
1
2
3
Método de varianza - covarianza no condicional.
Método de varianza - covarianza condicional EWMA o
RiskMetrics.
Modelo correlación condicional (paramétrico).
ARMA (modelo de la media condicional)
GARCH (modelo de la volatilidad)
EWMA correlación.
4
5
Modelo correlación condicional (semiparamétrico): simulación
histórica filtrada.
Componentes principales.
Series de Tiempo
Universidad de los Andes y Quantil
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Hechos estilizados
Los retornos diarios tienen muy poca correlación.
Sugiere que la media condicional de los retornos diarios es
constante.
La distribución no condicional de los retornos diarios tiene
colas más anchas que la normal.
Aún después de normalizar los retornos por la desviación
estándar (condicional), estos tiene colas anchas.
Se intepreta como evidiencia de no normalidad condicional.
A mayor horizonte más cercana es la distribución de los
retornos a una normal.
Existe una asimetrı́a de entre las subidas y bajadas. Las
bajadas son usualmente más fuertes que las subidas.
Series de Tiempo
Universidad de los Andes y Quantil
Hechos estilizados
En horizontes de un dı́a no es posible rechazar la hipótesis de
retornos esperados iguales a cero.
La varianza no condicional (retornos al cuadrado o los valores
absolutos de los retornos) están fuertemente correlacionada
(gráfica autocorrelación retornos al cuadrado).
En horizontes cortos la desviación estándar domina el retorno
esperado.
La correlación entre activos no es estable y aumenta en
perı́odos de alta volatilidad del mercado (en particular en
crisis).
Modelo básico (univariado) de series de tiempo Xt :
Xt+1 = µt+1 + σt+1 zt+1
donde zt se distribuye i.i.d, D(0, 1).
ARMA
Los modelos ARMA (Autorregresive moving average) son
aquellos que suponen que la X (t) sigue un proceso de la
forma:
ν + A1 Xt−1 + ... + ApXt−p t
donde,
t = ut + M1 ut−1 + ... + Mqut−q
y ut es ruido blanco.
Este es un porceso ARMA(p,q)
Para identificar este modelo se utiliza la metodologı́a de
Box-Jenkins (no es un procedimiento formal pero es muy
práctico)
1
2
3
Analizar las autocorrelaciones para determinar el orden MA
Analizar las autocorrelaciones parciales para determinar el
orden AR
Estimar el modelo.
GARCH
GARCH(1,1)
2
σt+1
= ω + αXt2 + βσt2
donde α + β < 1.
RiskMetrics es un caso particular cuando ν = 0, ω = 0, α = λ
y β = 1 − λ. En este caso α + β = 1. Como veremos esto
tiene implicaciones importantes: en el caso de RiskMetrics no
existe la varianza no condicional del proceso (varianza de largo
plazo) algo claramente en contradicción con los datos
observables.
La varianza no condicional es:
2 = ω + ασ 2 + βσ 2
σ 2 = E σt+1
⇒
σ
2
=
ω
1−α−β
GARCH
Esto explica por qué el modelo de RiskMetrics no tiene
varianza de largo plazo bien definida.
Nótese que el modelo GARCH se puede escribir como:
2
σt+1
= σ 2 + α Xt2 − σ 2 + β σt2 − σ 2
GARCH(p,q):
2
σt+1
=ω+
p
X
i=1
2
+
αi Xt+1−i
q
X
2
βj σt+1−j
.
j=1
GARCH
Este modelo supone que la varianza de larga plazo es
constante.
GARCH(2,2) con varianza de largo plazo que varia en el
tiempo (component GARCH):
2
σt+1
= υt+1 + α Xt2 − υ 2 + β σt2 − υt
υt+1 = ω + αυ Xt2 − σt2 + βυ υt
GARCH
Este modelo permite que la varianza de largo plazo varie en el
tiempo.
GARCH(1,1) asimétrico (NGARCH o GARCH no lineal)
2
σt+1
= ω + α (Xt − θσt )2 + βσt2
= ω + ασt2 (zt − θ)2 + βσt2
Donde z es el retorno estandarizado. Las noticias malas
(zt < 0) se relfejan en mayor varianza cuando θ > 0.
GARCH
GJR-GARCH
Sea It = I[Rt <0] la función indicadora de cuando un retorno es
negativo.
El modelo se define como:
2
= ω + αXt2 + αθIt Xt2 + βσt2
σt+1
donde θ > 0.
GARCH
EGARCH (GARCH exponencial):
2
= ω + α(φXt + γ(|Xt | − E (|Xt |)) + β ln σt2
ln σt+1
donde αφ < 0.
GARCH con variables explicativas:
2
σt+1
= ω + αXt2 + βσt2 + γYt+1
donde Yt+1 es una variable conocida en t.
Por ejemplo lunes o dı́a después de un festivo podrı́a mejorar
la estimación. En estos dı́as tı́picamente la volatilidad es
mayor.
GARCH - estimación
Obsérvese que en el mundo real no observamos la varianza
condicional.
Esta debe ser implı́citamente estimada junto con los
parámetros α y β.
El modelo básico supone que la estandarización de X se
distribuye i.i.d con distribución D(0, 1).
GARCH - estimación
Esto es suficiente para escribir la función de verosimilitud.
Supongamos que D es normal:
T
1
e
L(α, β) = Π p
t=1
2πσt2
−
(Xt −µt )2
2σt2
Cuando el supuesto de normalidad no se cumple apelamos a la
estimación por cuasi-máxima verosimilitud.
GARCH - estimación
Para generar el pronóstico suponemos que la varianza
condicional inicial es la varianza no condicional.
También se puede hacer targetting de la varianza de largo
plazo y sólo estimamos α y β. Este método se basa en:
2
σt+1
= (1 − α − β)σ 2 + αXt2 + βσt2
Contenido
Estructura básica análisis de riesgo
Ejemplos
Distribuciones codicionales y no condicionales
¿Hacia donde vamos?: medidas de riesgo
Métodos para deducir la distribución del proceso de pérdidas
Series de tiempo: ARMA - GARCH
Modelos básicos para riesgos de mercado
Método de varianza - covarianza no condicional
El método consiste en suponer que los dos primeros
momentos de la distribución de los factores o perdidas
caracterizan la distribución de éstas.
El estimador clásico tiene algunos problemas.
1
2
Numéricos (matriz no es definida positiva)
No es muy estable.
Esto es muy problemático cuando se quiere optimizar.
Existen muchos estimadores. R y Matlab tienen
implementados estimadores robustos.
Series de Tiempo
Universidad de los Andes y Quantil
EWMA - Riskmetrics
Example (Exponential Weighted Moving Average)
Supongamos que el valor esperado no condicional de los factores
Xt es cero (esto es una hipótesis razonable por ejemplo en el caso
del retorno de acciones en un perı́odo corto, por ejemplo un dı́a).
La forma de pronósticar Σt+1 es:
∞
X
T
Σt+1 = λ
(1 − λ)k Xt−k
Xt−k
k=0
que implica la siguiente recursión:
Σt+1 = λXt XtT + (1 − λ) Σt
Para comenzar la recursión utilizamos: Σ1 = X1 X1T .
Modelos de correlación condicional: EWMA correlación
Este es un caso particular de lo modelos de correlación
condicional. También lo denominamos EWMA correlación.
Este es un modelo paramétrico condicional.
p
Supongamos que el retorno del portafolio Rt+1
satisface:
P
P
P
Rt+1
= µPt+1 + σt+1
zt+1
donde µPt y σtP son procesos estocásticos predecibles en t, ztP
es i.i.d distribuida D (0, 1), donde D es una distribución con
media cero y varianza uno.
2
µt+1 y σt+1
son variables aleatorias conocidas en t.
Modelos de correlación condicional: EWMA correlación
El objetivo en la siguientes secciones será modelas la media
2 .
condicional µt+1 y la varianza condicional σt+1
Supongamos que los factores de riesgo (Xt )t∈Z son procesos
estocásticos multivariados con µt+1 = Et [Xt+1 ] y
Σt+1 = covt [Xt+1 ].
P = wT X
Supongamos que Rt+1
t+1 .
t
Entonces
h
i
P
= µPt+1 = wtT µt+1 .
Et Rt+1
2
2 p
P
P
=
σt+1
= wtT Σt+1 wt
Et Rt+1 − µt+1
Modelos de correlación condicional: EWMA correlación
Obsérvese que Σt+1 puede descomponerse como
Σt+1 = Dt+1 Γt+1 Dt+1 donde


σ1,t+1

·
Dt+1 = 
σm,t+1
es una matriz diagonal de desviaciones estándar condicionales
de Xt+1 y Γt+1 = corrt [Xt+1 ] es la matriz de correlaciones
condicionales de Xt+1 , Γt+1 = (Γij,t+1 )i,j=1,...,m .
Luego, podemos reescribir XP,t+1 como:
p
Rt+1
= wtT µt+1 + wtT (Dt+1 Γt+1 Dt+1 )wt zt+1
Modelos de correlación condicional: EWMA correlación
La especificación del modelo sigue ahora con los siguientes
pasos:
Estimar un modelo GARCH(1,1) estándar de cada una de las
componentes de Xi,t de Xt :
Xi,t
= µi + εi,t
2
σi,t
2
= κi + g1,i σi,t−1
+ a1,i ε2i,t−1
2
donde εi,t+1 p Ft ∼ N 0, σi,t
.
Obsérvese que εi,t no es predecible en t − 1. En la notación de
Ch [2003] εi,t+1 = σi,t+1 zi,t+1 donde σi,t+1 es predecible en t
y zi,t+1 es i.i.d con distribución N (0, 1) .
Modelos de correlación condicional: EWMA correlación
Sea zi,t =
Xi,t −µi
σi,t
y obsérvese que covt [zt+1 ] = Γt+1 .
Introducimos las variables auxiliares qij,t para las cuales se
postula la siguiente dinámica:
qij,t+1 = (1 − λ) (zi,t zj,t ) + λqij,t .
Esta dinámica corresponde a suponer que:
qij,t+1 = (1 − λ)
∞
X
λτ −1 zi,t+1−τ zj,t+1−τ
τ =1
Este modelo de correlación es análogo al método de
Riskmetrics.1
1
Obsérvece que en esta formula estamos utilizando la nomencalatura de [Ch]
que es similar a la de RiskMetrics. Es decir, en este caso λ es un parámetor de
decaimiento exponencial.
Modelos de correlación condicional: EWMA correlación
Sin embargo, nada garantiza que qij,t+1 sea en efecto una
matriz de correlación, luego utilizamos la siguiente
normalización:
Γij,t+1 = √
qij,t+1
.
qii,t+1 qjj,t+1
Este modelo es una ligera modificación del modelo de la
sección anterior.
La metodologı́a sigue exactamente los mismos pasos
anteriores excepto que zt+1 no se simula sino que se escoge
aleatoriamente (con reemplazo) de los retornos centrados
estandarizados. Esto es, en vez de hacer simulaciones de
Montecarlo se se hace bootstrapping.
Modelos de reducción de dimensión
Sea Σ la matriz de varianza - covarianza de Xt . Decimos que
Xt tiene un modelo de p− factores (lineal) si se puede escribir
como:
X = a + BF + ε
donde
F = (F1 , ..., Fp )0 , p < d y la matriz de varianza covarianza Ω
de F es positiva definida
ε = (ε1 , ...εd )0 es un vector de choques idiosyncráticos, no
correlacionados, con media cero y matriz de varianza
covarianza (diagonal) Υ; B ∈ R d×p
a ∈ R d×p son matrices y cov (F , ε) = 0.
El vector F se llama factores comúnes y B se denomna la
matriz de transformación.
Modelos de reducción de dimensión
En general es posible transformar los factores comúnes para
que tengan media cero y sean ortogonales. Esta técnica se
denomina componentes principales.
Como Σ es una matriz simétrica, por el teorema de
descomposición espectral:
Σ = ΓΛΓ0
donde Λ es diagonal con valores propios ordenados de mayor a
menor (reales) y Γ es ortogonal: ΓΓ0 = Γ0 Γ = I .
Modelos de reducción de dimensión
La tranformación de componentes principales de X se define
como:
F = Γ0 (X − µ),
luego E [F ] = 0 y cov (F ) = Λ y X se puede expresar como un
modelo de factores con d = p:
X = µ + ΓF
Modelos de reducción de dimensión
Por supuesto a esta alturas no se ha logrado ninguna
reducción de la dimensionalidad del problema.
Para esto escogemos un número p de factores que
(comenzando con el primero y ası́ sucesivamente, de mayores
valores propios a menores2 ) tal que estos expliquen por lo
menos un 90 o 95 % de la suma de las varianzas de las
componentes del vector X .
2
Se puede demostrar que la varianza de cada componente es igual al valor
propio asociado a esa componente.
Modelos de reducción de dimensión
Tı́picamente esto conlleva a escoger un número bastante
reducido de factores p.
Una vez hecho esto se descompone F de la siguiente forma
F = (F10 , F20 ) donde F1 son los primeros p factores y F20 los
siguientes d − p factores. De forma similar particionamos
Γ = (Γ01 , Γ02 ) y reescribimos X como:
X
= µ + Γ 1 F1 + Γ 2 F2
= µ + Γ1 F1 + ε
donde ε = Γ2 F2 lo intepretamos como un error.
Descargar