Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Modelos Estadı́sticos de los Factores de Riesgo: Series de Tiempo Universidad de los Andes y Quantil Noviembre 3 de 2010 Series de Tiempo Universidad de los Andes y Quantil Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado 1 Estructura básica análisis de riesgo 2 Ejemplos 3 Distribuciones codicionales y no condicionales 4 ¿Hacia donde vamos?: medidas de riesgo 5 Métodos para deducir la distribución del proceso de pérdidas 6 Series de tiempo: ARMA - GARCH 7 Modelos básicos para riesgos de mercado Series de Tiempo Universidad de los Andes y Quantil Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Introducción Vamos a concentrarnos en el caso de riesgos financieros de mercado. Vt es la variabe aleatoria que representa el valor del portafolio en el periodo. En general podemos escribir ésta como: Vt = f (t, Zt ) donde, f : R × R d → R. Zt representa los d-factores de riesgo del portafolio, Zt = (Zt,1 , ..., Zt,d ). Definimos Xt = Zt − Zt−1 el cambio en los factores de riesgo durante el periodo t − 1 a t. Series de Tiempo Universidad de los Andes y Quantil Introducción El valor del portafolio va depender explı́citamente del tiempo por ejemplo en el caso de portafolios que tienen derivados (i.e., una opción de compra). Los factores de riesgo Zt deben ser tal que Xt = Zt − Zt−1 sea un proceso estacionario (los invariantes, véase Meucci [2007]). Informalmente Xt sigue un proceso estacionario si la distribución de cada variable aleatoria Xt es la misma para todo t y la denotamos por FX . Introducción Definimos el proceso estocástico de pérdidas en el periodo t, t + 1 como L[t,t+1] = − (Vt+1 − Vt ) . En adelante vamos a denotar estas perdidas por Lt+1 = L[t,t+1] . Luego Lt+1 = −(f (t + 1, Zt + Xt+1 ) − f (t, Zt )) Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Ejemplos Example (Portafolio de acciones) Supongamos que tenemos un portafolio fijo de d acciones, λ = (λ1 , ...λd ) donde λi es la cantidad de acciones de la i-ésima acción. Sea (St,i )t∈N, i=1,...d el precio de las acciones. Definamos Zt,i = log(St,i ) como los factores de riesgo y St,i ). Xt,i = log( St−1,i Luego Vt = d P λi exp(Zt,i ) i=1 Series de Tiempo Universidad de los Andes y Quantil Ejemplos Example Linealizando obtenemos: d X L∆ = − λi St,i Xt+1,i t+1 i=1 Los retornos logarı́tmicos son el candidato a invariantes en un portafolio de acciones. La linealización tiene muchas ventajas computacionales. Ejemplos Example (Portafolio de bonos cero cupón - sin riesgo de incumplimiento) Supongamos que tenemos un portafolio de d bonos cero cupón con fecha de maduración Ti y precios en t, p (t, Ti ) . Sea λi la posición en cada bono y supongamos que normalizamos el precio tal que p (Ti , Ti ) = 1. Definimos las curva de rendimientos (compuesta continuamente) en t como y (t, ·) : R → R, y (t, T ) = − 1 ln(p(t, T )) T −t y los factores de riesgo como: Zt,i = y (t, Ti ) Ejemplos Example Entonces: Vt = d X λi exp(−(Ti − t)Zt,i ). i=1 En este caso el invariante es Xt,i = Zt,i − Zt−1,i . Ejemplos Example (Opción de compra europea) Supongamos que tenemos un portafolio consistente de una única opción europea sobre una acción con precio de ejercicio K , maduración T y precio de la acción St . El valor de la opción C es, según el modelo de Black - Scholes, C (s, S, r , σ, K , T ) = SΦ (d1 ) − Ke −r (T −s) Φ(d2 ) d1 = d1 (s, S, r , σ, K , T ) d2 = d2 (s, S, r , σ, K , T ) donde Φ es la función de distribución normal estándar, r la tasa de interés compuesta libre de riesgo, σ es la volatilidad anualizada del precio de la acción. Ejemplos Los últimos ejemplos ponen de manifiesto la generalidad del marco teórico. Existe una infinidad de ejemplos relacionados con riesgos en el sector real de una economı́a. Un poco de reflexión sobre el tema muestra que lo verdaderamente importante de la metodologı́a no es la pérdida como concepto (éste sólo es un ejemplo de la variable objetivo del administrador de riesgo). Lo importante desde el punto de vista conceptual es identificar la variable objetivo y sus fuentes de incertidumbre (factores de riesgo). Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Distribuciones codicionales y no condicionales Sea (Xt )t∈N un proceso estacionario. Denotamos por FX la distribución de Xt . Definimos Ft como la información disponible hasta t. Tı́picamente Ft = σ(X1 , ...Xt ) En la mayorı́a de los modelos de riesgo FXt+1 pFt , la distribución condicional de Xt+1 dado Ft no es igual a FX . Un caso particular es cuando (Xt )t∈N son independientes. En ese caso FXt+1 pFt = FX . Series de Tiempo Universidad de los Andes y Quantil Distribuciones codicionales y no condicionales ¿Por qué es relevante la distribución condicional? Por ejemplo en un libro estándar de administración de riesgos de mercado Risk and Asset Allocation, Meucci 2007, se concentran en invariantes i.i.d. La importancia radica en la siguiente descomposición. Sean X y Y variables aleatoria y supongamos que queremos pronósticar Y . La siguiente relación es conocida (teorema de descomposición de varianza): V (Y ) = V (E (Y p X )) + E (V (Y p X )) ⇒ V (Y ) ≥ E (V (Y p X )) Distribuciones codicionales y no condicionales Es decir, en promedio, los pronósticos de la variable condicionada son más precisos que los de la variable sin condicionar. Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado ¿Hacia donde vamos?: medidas de riesgo Existen por lo menos tres formas estándar de cuantificar el riesgo de un portafolio. 1 2 3 Medidas de riesgo basadas en la distribución de la pérdida o el retorno que implican el análisis estadı́stico de los factores (análisis de factores). Medidas de riesgo basadas en la distribución de la pérdida para diferentes escenarios del proceso de los factores de riesgo (análisis de escenarios). Lı́mites superiores e inferiores al riesgo consistente con el modelo de incertidumbre de los factores (Stress testing de factores). Series de Tiempo Universidad de los Andes y Quantil Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Métodos para deducir la distribución del proceso de pérdidas Modelos básicos basados en modelar los factores de riesgo: 1 2 3 Método de varianza - covarianza no condicional. Método de varianza - covarianza condicional EWMA o RiskMetrics. Modelo correlación condicional (paramétrico). ARMA (modelo de la media condicional) GARCH (modelo de la volatilidad) EWMA correlación. 4 5 Modelo correlación condicional (semiparamétrico): simulación histórica filtrada. Componentes principales. Series de Tiempo Universidad de los Andes y Quantil Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Hechos estilizados Los retornos diarios tienen muy poca correlación. Sugiere que la media condicional de los retornos diarios es constante. La distribución no condicional de los retornos diarios tiene colas más anchas que la normal. Aún después de normalizar los retornos por la desviación estándar (condicional), estos tiene colas anchas. Se intepreta como evidiencia de no normalidad condicional. A mayor horizonte más cercana es la distribución de los retornos a una normal. Existe una asimetrı́a de entre las subidas y bajadas. Las bajadas son usualmente más fuertes que las subidas. Series de Tiempo Universidad de los Andes y Quantil Hechos estilizados En horizontes de un dı́a no es posible rechazar la hipótesis de retornos esperados iguales a cero. La varianza no condicional (retornos al cuadrado o los valores absolutos de los retornos) están fuertemente correlacionada (gráfica autocorrelación retornos al cuadrado). En horizontes cortos la desviación estándar domina el retorno esperado. La correlación entre activos no es estable y aumenta en perı́odos de alta volatilidad del mercado (en particular en crisis). Modelo básico (univariado) de series de tiempo Xt : Xt+1 = µt+1 + σt+1 zt+1 donde zt se distribuye i.i.d, D(0, 1). ARMA Los modelos ARMA (Autorregresive moving average) son aquellos que suponen que la X (t) sigue un proceso de la forma: ν + A1 Xt−1 + ... + ApXt−p t donde, t = ut + M1 ut−1 + ... + Mqut−q y ut es ruido blanco. Este es un porceso ARMA(p,q) Para identificar este modelo se utiliza la metodologı́a de Box-Jenkins (no es un procedimiento formal pero es muy práctico) 1 2 3 Analizar las autocorrelaciones para determinar el orden MA Analizar las autocorrelaciones parciales para determinar el orden AR Estimar el modelo. GARCH GARCH(1,1) 2 σt+1 = ω + αXt2 + βσt2 donde α + β < 1. RiskMetrics es un caso particular cuando ν = 0, ω = 0, α = λ y β = 1 − λ. En este caso α + β = 1. Como veremos esto tiene implicaciones importantes: en el caso de RiskMetrics no existe la varianza no condicional del proceso (varianza de largo plazo) algo claramente en contradicción con los datos observables. La varianza no condicional es: 2 = ω + ασ 2 + βσ 2 σ 2 = E σt+1 ⇒ σ 2 = ω 1−α−β GARCH Esto explica por qué el modelo de RiskMetrics no tiene varianza de largo plazo bien definida. Nótese que el modelo GARCH se puede escribir como: 2 σt+1 = σ 2 + α Xt2 − σ 2 + β σt2 − σ 2 GARCH(p,q): 2 σt+1 =ω+ p X i=1 2 + αi Xt+1−i q X 2 βj σt+1−j . j=1 GARCH Este modelo supone que la varianza de larga plazo es constante. GARCH(2,2) con varianza de largo plazo que varia en el tiempo (component GARCH): 2 σt+1 = υt+1 + α Xt2 − υ 2 + β σt2 − υt υt+1 = ω + αυ Xt2 − σt2 + βυ υt GARCH Este modelo permite que la varianza de largo plazo varie en el tiempo. GARCH(1,1) asimétrico (NGARCH o GARCH no lineal) 2 σt+1 = ω + α (Xt − θσt )2 + βσt2 = ω + ασt2 (zt − θ)2 + βσt2 Donde z es el retorno estandarizado. Las noticias malas (zt < 0) se relfejan en mayor varianza cuando θ > 0. GARCH GJR-GARCH Sea It = I[Rt <0] la función indicadora de cuando un retorno es negativo. El modelo se define como: 2 = ω + αXt2 + αθIt Xt2 + βσt2 σt+1 donde θ > 0. GARCH EGARCH (GARCH exponencial): 2 = ω + α(φXt + γ(|Xt | − E (|Xt |)) + β ln σt2 ln σt+1 donde αφ < 0. GARCH con variables explicativas: 2 σt+1 = ω + αXt2 + βσt2 + γYt+1 donde Yt+1 es una variable conocida en t. Por ejemplo lunes o dı́a después de un festivo podrı́a mejorar la estimación. En estos dı́as tı́picamente la volatilidad es mayor. GARCH - estimación Obsérvese que en el mundo real no observamos la varianza condicional. Esta debe ser implı́citamente estimada junto con los parámetros α y β. El modelo básico supone que la estandarización de X se distribuye i.i.d con distribución D(0, 1). GARCH - estimación Esto es suficiente para escribir la función de verosimilitud. Supongamos que D es normal: T 1 e L(α, β) = Π p t=1 2πσt2 − (Xt −µt )2 2σt2 Cuando el supuesto de normalidad no se cumple apelamos a la estimación por cuasi-máxima verosimilitud. GARCH - estimación Para generar el pronóstico suponemos que la varianza condicional inicial es la varianza no condicional. También se puede hacer targetting de la varianza de largo plazo y sólo estimamos α y β. Este método se basa en: 2 σt+1 = (1 − α − β)σ 2 + αXt2 + βσt2 Contenido Estructura básica análisis de riesgo Ejemplos Distribuciones codicionales y no condicionales ¿Hacia donde vamos?: medidas de riesgo Métodos para deducir la distribución del proceso de pérdidas Series de tiempo: ARMA - GARCH Modelos básicos para riesgos de mercado Método de varianza - covarianza no condicional El método consiste en suponer que los dos primeros momentos de la distribución de los factores o perdidas caracterizan la distribución de éstas. El estimador clásico tiene algunos problemas. 1 2 Numéricos (matriz no es definida positiva) No es muy estable. Esto es muy problemático cuando se quiere optimizar. Existen muchos estimadores. R y Matlab tienen implementados estimadores robustos. Series de Tiempo Universidad de los Andes y Quantil EWMA - Riskmetrics Example (Exponential Weighted Moving Average) Supongamos que el valor esperado no condicional de los factores Xt es cero (esto es una hipótesis razonable por ejemplo en el caso del retorno de acciones en un perı́odo corto, por ejemplo un dı́a). La forma de pronósticar Σt+1 es: ∞ X T Σt+1 = λ (1 − λ)k Xt−k Xt−k k=0 que implica la siguiente recursión: Σt+1 = λXt XtT + (1 − λ) Σt Para comenzar la recursión utilizamos: Σ1 = X1 X1T . Modelos de correlación condicional: EWMA correlación Este es un caso particular de lo modelos de correlación condicional. También lo denominamos EWMA correlación. Este es un modelo paramétrico condicional. p Supongamos que el retorno del portafolio Rt+1 satisface: P P P Rt+1 = µPt+1 + σt+1 zt+1 donde µPt y σtP son procesos estocásticos predecibles en t, ztP es i.i.d distribuida D (0, 1), donde D es una distribución con media cero y varianza uno. 2 µt+1 y σt+1 son variables aleatorias conocidas en t. Modelos de correlación condicional: EWMA correlación El objetivo en la siguientes secciones será modelas la media 2 . condicional µt+1 y la varianza condicional σt+1 Supongamos que los factores de riesgo (Xt )t∈Z son procesos estocásticos multivariados con µt+1 = Et [Xt+1 ] y Σt+1 = covt [Xt+1 ]. P = wT X Supongamos que Rt+1 t+1 . t Entonces h i P = µPt+1 = wtT µt+1 . Et Rt+1 2 2 p P P = σt+1 = wtT Σt+1 wt Et Rt+1 − µt+1 Modelos de correlación condicional: EWMA correlación Obsérvese que Σt+1 puede descomponerse como Σt+1 = Dt+1 Γt+1 Dt+1 donde σ1,t+1 · Dt+1 = σm,t+1 es una matriz diagonal de desviaciones estándar condicionales de Xt+1 y Γt+1 = corrt [Xt+1 ] es la matriz de correlaciones condicionales de Xt+1 , Γt+1 = (Γij,t+1 )i,j=1,...,m . Luego, podemos reescribir XP,t+1 como: p Rt+1 = wtT µt+1 + wtT (Dt+1 Γt+1 Dt+1 )wt zt+1 Modelos de correlación condicional: EWMA correlación La especificación del modelo sigue ahora con los siguientes pasos: Estimar un modelo GARCH(1,1) estándar de cada una de las componentes de Xi,t de Xt : Xi,t = µi + εi,t 2 σi,t 2 = κi + g1,i σi,t−1 + a1,i ε2i,t−1 2 donde εi,t+1 p Ft ∼ N 0, σi,t . Obsérvese que εi,t no es predecible en t − 1. En la notación de Ch [2003] εi,t+1 = σi,t+1 zi,t+1 donde σi,t+1 es predecible en t y zi,t+1 es i.i.d con distribución N (0, 1) . Modelos de correlación condicional: EWMA correlación Sea zi,t = Xi,t −µi σi,t y obsérvese que covt [zt+1 ] = Γt+1 . Introducimos las variables auxiliares qij,t para las cuales se postula la siguiente dinámica: qij,t+1 = (1 − λ) (zi,t zj,t ) + λqij,t . Esta dinámica corresponde a suponer que: qij,t+1 = (1 − λ) ∞ X λτ −1 zi,t+1−τ zj,t+1−τ τ =1 Este modelo de correlación es análogo al método de Riskmetrics.1 1 Obsérvece que en esta formula estamos utilizando la nomencalatura de [Ch] que es similar a la de RiskMetrics. Es decir, en este caso λ es un parámetor de decaimiento exponencial. Modelos de correlación condicional: EWMA correlación Sin embargo, nada garantiza que qij,t+1 sea en efecto una matriz de correlación, luego utilizamos la siguiente normalización: Γij,t+1 = √ qij,t+1 . qii,t+1 qjj,t+1 Este modelo es una ligera modificación del modelo de la sección anterior. La metodologı́a sigue exactamente los mismos pasos anteriores excepto que zt+1 no se simula sino que se escoge aleatoriamente (con reemplazo) de los retornos centrados estandarizados. Esto es, en vez de hacer simulaciones de Montecarlo se se hace bootstrapping. Modelos de reducción de dimensión Sea Σ la matriz de varianza - covarianza de Xt . Decimos que Xt tiene un modelo de p− factores (lineal) si se puede escribir como: X = a + BF + ε donde F = (F1 , ..., Fp )0 , p < d y la matriz de varianza covarianza Ω de F es positiva definida ε = (ε1 , ...εd )0 es un vector de choques idiosyncráticos, no correlacionados, con media cero y matriz de varianza covarianza (diagonal) Υ; B ∈ R d×p a ∈ R d×p son matrices y cov (F , ε) = 0. El vector F se llama factores comúnes y B se denomna la matriz de transformación. Modelos de reducción de dimensión En general es posible transformar los factores comúnes para que tengan media cero y sean ortogonales. Esta técnica se denomina componentes principales. Como Σ es una matriz simétrica, por el teorema de descomposición espectral: Σ = ΓΛΓ0 donde Λ es diagonal con valores propios ordenados de mayor a menor (reales) y Γ es ortogonal: ΓΓ0 = Γ0 Γ = I . Modelos de reducción de dimensión La tranformación de componentes principales de X se define como: F = Γ0 (X − µ), luego E [F ] = 0 y cov (F ) = Λ y X se puede expresar como un modelo de factores con d = p: X = µ + ΓF Modelos de reducción de dimensión Por supuesto a esta alturas no se ha logrado ninguna reducción de la dimensionalidad del problema. Para esto escogemos un número p de factores que (comenzando con el primero y ası́ sucesivamente, de mayores valores propios a menores2 ) tal que estos expliquen por lo menos un 90 o 95 % de la suma de las varianzas de las componentes del vector X . 2 Se puede demostrar que la varianza de cada componente es igual al valor propio asociado a esa componente. Modelos de reducción de dimensión Tı́picamente esto conlleva a escoger un número bastante reducido de factores p. Una vez hecho esto se descompone F de la siguiente forma F = (F10 , F20 ) donde F1 son los primeros p factores y F20 los siguientes d − p factores. De forma similar particionamos Γ = (Γ01 , Γ02 ) y reescribimos X como: X = µ + Γ 1 F1 + Γ 2 F2 = µ + Γ1 F1 + ε donde ε = Γ2 F2 lo intepretamos como un error.