MEDICIÓN DEL RIESGO DE MERCADO BAJO CONDICIONES PROPICIAS PARA LA DISTORSIÓN DE LOS PRECIOS 20 de Febrero 2009 Contenido Introducción General 1 2 1 Preliminares 1.1 Conceptos Básicos de Probabilidad . . . . . . . . 1.2 Medidas de Riesgo . . . . . . . . . . . . . . . . . 1.3 Los Conceptos de VaR y CVaR . . . . . . . . . . 1.4 Derivada del VaR y CVaR . . . . . . . . . . . . . 1.5 El VaR y CVaR de una distribución normal . . . 1.6 El VaR y CVaR de una distribución t no central 1.7 Teoría de Valores Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 7 9 14 15 19 21 Factores de Ajuste de la Volatilidad 2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Formulación Matemática . . . . . . . . . . . . . . . . . . . 2.3 Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Caso Normal . . . . . . . . . . . . . . . . . . . . . 2.3.2 No Negatividad . . . . . . . . . . . . . . . . . . . . 2.3.3 F ∗ y El Nivel de Aversión al Riesgo δ . . . . . . . 2.3.4 F ∗ y el Nivel de Confianza α . . . . . . . . . . . . 2.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Bono M Diciembre 2007 . . . . . . . . . . . . . . . 2.4.2 Bono M Junio 2011 . . . . . . . . . . . . . . . . . . 2.5 Descomposición del Efecto de Distorsión . . . . . . . . . 2.5.1 Bono M Diciembre 2024 . . . . . . . . . . . . . . . 2.5.2 Factor de Distorsión del bono M Diciembre 2007 2.6 Otras variables de referencia . . . . . . . . . . . . . . . . 2.7 Aplicación de la Teoría de Valores Extremos . . . . . . . 2.7.1 Dificultades en la estimación del VaR y CVaR . . 2.7.2 Estimadores del VaR y CVaR usando TVE . . . . 2.7.3 Aplicación en la determinación de F ∗ . . . . . . . 2.8 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 23 25 25 26 28 31 32 33 34 35 36 36 36 38 38 40 41 43 i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Aplicación de Distribuciones Híbridas 3.1 Introducción y Motivación . . . . . . . . . 3.2 Distribuciones Híbridas . . . . . . . . . . 3.3 Formulación Matemática . . . . . . . . . . H ( β) H ( β) 3.4 Propiedades del VaRα , CVaRα y β∗ 3.4.1 Propiedades Básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H ( β) 3.5 3.6 3.7 3.8 3.9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H ( β) 3.4.2 Monotonicidad y Continuidad del VaRα y CVaRα 3.4.3 Existencia y algunas propiedades de β∗ . . . . . . . . . Determinación de la probabilidad óptima β∗ . . . . . . . . . . . 3.5.1 Determinación de la Distribución Híbrida . . . . . . . . Caso Gaussiano-Gaussiano . . . . . . . . . . . . . . . . . . . . . 3.6.1 Solución utilizando simulación . . . . . . . . . . . . . . . 3.6.2 Solución mediante integración numérica . . . . . . . . . Caso Gaussiano-t . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.1 Solución utilizando simulación . . . . . . . . . . . . . . . 3.7.2 Solución mediante integración numérica . . . . . . . . . 3.7.3 Comparación entre el modelo Gaussiano-Gaussiano y el Gaussiano-t . . . . . . . . . . . . . . . . . . . . . . . . . . Comparación de β∗ con el factor de ajuste F ∗ . . . . . . . . . . Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conclusiones Generales 46 46 47 51 52 53 54 59 60 63 64 65 66 71 71 72 77 78 81 83 A Convexidad y Condiciones de Optimalidad 85 B Simulación B.1 Método Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . B.2 Simulación de Distribuciones Híbridas . . . . . . . . . . . . . . 87 87 89 C El caso del sesgo en la estimación de β∗ 90 Bibliografía 93 ii Introducción General En las últimas tres décadas la mayor parte de las instituciones financieras han invertido mucho tiempo y recursos en la evaluación y medición de los riesgos a los que están expuestos sus activos. De igual manera, los reguladores de los sistemas financieros mundiales y locales han puesto un gran empeño en la medición de los riesgos sistémicos a los que están expuestos los participantes de los distintos mercados financieros, así como en la determinación de lineamientos generales que estos participantes deben seguir a fin de mitigar dichos riesgos. De esta manera, se han desarrollado clasificaciones muy precisas de estos riesgos y metodologías especiales para determinar y monitorear cada uno de éstos. No obstante dicho esfuerzo, la crisis financiera actual ha demostrado, entre otras cosas, que este esfuerzo debe redoblarse, poniendo especial énfasis en el seguimiento y la evolución de los riesgos, así como en una constante revisión de la adecuación de las metodologías utilizadas para tal efecto. En particular, respecto a esto último, deben revisarse o evaluarse los supuestos que los correspondientes modelos hacen ya que, como cualquier otro modelo, estos supuestos buscan, por un lado, que el modelo capture de manera aproximada la realidad del contexto de aplicación y, por el otro, que se simplifique lo suficiente la complejidad de dicha realidad a fin de que la instrumentación del modelo sea factible. Este trabajo de tesis se avoca en la adecuación de las metodologías estándar de medición de riesgos. En particular, se enfoca en las adecuaciones en los casos en que no se cumplan supuestos menos evidentes que aquellos relacionados, por ejemplo, con las medidas de riesgo usadas o las distribuciones de pérdidas utilizadas. A saber, se considera el supuesto de que los precios de los activos considerados reflejen toda la información disponible hasta el momento. Es decir, el presente trabajo considera la medición de riesgos cuando este supuesto no se cumple. Esto es, cuando los precios de los activos considerados se encuentran "distorsionados". Por ejemplo, cuando la variabilidad de los precios no refleja la verdadera incertidumbre del valor del activo. En específico, se estudia el caso en que esta distorsión ha sido propiciada por una alta concentración de dichos activos en el mercado financiero en que éstos se operan. 1 Desde el punto de vista de la medición de riesgos, la distorsión de los precios de los activos puede conllevar varios problemas. Entre otros, se tiene los siguientes: • Desde el punto de vista de una institución reguladora, se puede subestimar el riesgo sistémico del mercado correspondiente. • Desde la perspectiva de un participante, puede significar una pérdida inesperada, por ejemplo, en el caso de que dicho participante haya aceptado dichos activos como colateral de una operación crediticia. • Desde la óptica del mismo tenedor del activo concentrado, éste esta sujeto al riesgo de que el precio de dicho activo sea impugnado por una institución reguladora. Para tal efecto, se considera el riesgo de mercado, dado que es el tipo de riesgo más sencillo de distinguir y para el cual existe un consenso universal respecto a su definición; y se toma en cuenta como motivación, una situación específica observada recientemente en el mercado nacional de instrumentos de renta fija. A saber, el comportamiento, un tanto peculiar, del Bono M Diciembre 2007, el cual cerca de su fecha de vencimiento mostró una distorsión notable de su precio debido a la alta concentración de la tenencia del mismo por un solo participante del mercado. En particular, como se puede apreciar en la Figura 1, la variación diaria porcentual de los precios de dicho bono, medida en términos de la desviación estándar, experimentó una reducción drástica una vez que la tenencia de toda la emisión del título estuvo en manos de un solo participante1 . Dicha reducción de la variabilidad conlleva, como se demuestra más adelante en este trabajo de tesis, una subestimación importante del riesgo de mercado. En este trabajo de tesis se desarrollan dos metodologías para medir el riesgo de mercado, las cuales tienen dos características comunes: • Parten del supuesto estándar de una distribución de pérdidas Gaussiana. • Utilizan el Valor en Riesgo (VaR) y el Valor en Riesgo Condicional (CVaR) como medidas de riesgo. La primera de estas características busca que la metodología estándar se adecúe solo si es necesario, en cuyo caso se desviará de ésta, dependiendo de cada metodología, lo suficiente para medir el riesgo de mercado de manera adecuada. Por su parte, la segunda característica garantiza que ambas metodologías no solamente utilicen la misma forma de medir de riesgo, sino que además usen dos medidas de riesgo relevantes en el ámbito financiero. El 1 La concentración de un instrumento de deuda puede llegar a ser superior al 100% debido a que algunos participantes del mercado pueden vender en corto dicho instrumento. 2 Fig. 1: Bono M Diciembre 2007. VaR, que es la medida de riesgo más ampliamente utilizada, y el CVaR, el cual está íntimamente relacionado con el VaR, que es una medida más conservadora con propiedades deseables de una medida de riesgo que el VaR no posee en general. La primera metodología determina el "ajuste adecuado" que debe aplicarse a la desviación estándar para estimar el riesgo de mercado utilizando la metodología estándar bajo el supuesto de una distribución Gaussiana. Para tal efecto, se adopta un criterio para definir lo que se entiende por "ajuste adecuado". A saber, en términos de la determinación de un Factor de Ajuste que al multiplicarse por la desviación estándar observada, dé como resultado una desviación estándar ajustada con base en la cual se estiman simultáneamente el VaR y CVaR de la manera "más precisa posible". Es decir, de manera tal que el VaR y CVaR estimados, utilizando la desviación estándar ajustada, se parezcan lo "más posible" al VaR y CVaR observados, en términos de la desviación cuadrática de los valores observados y estimados correspondientes. La segunda metodología, en lugar de ajustar el parámetro de desviación estándar, incorpora la posibilidad de realización de un evento de estrés en el cual la distribución de pérdidas es distinta a la distribución Gaussiana que es considerada bajo condiciones normales. De esta manera, lo que se busca es determinar la probabilidad de dicho evento de estrés la cual, junto con la distribución de pérdidas considerada en este evento, permite construir una Distribución Híbrida a partir de la cual se mide el riesgo de la manera "más precisa posible" en el mismo sentido que se considera en la primer metodología. Ambas metodologías se pueden aplicar a cualquier distribución de pérdidas observada o considerada y presentan varias propiedades teóricas atracti- 3 vas. Entre otras, se encuentran las siguientes: • Bajo ciertos supuestos, los cuales se cumplen típicamente en la práctica, los modelos matemáticos asociados con cada metodología tienen solución. • La formulación de ambos modelos permite asignar el peso relativo que se le da al CVaR con respecto al VaR. Por lo tanto, el valor de dicha ponderación, la cual denominamos δ , se puede asociar, al menos intuitivamente, con un cierto nivel de aversión al riesgo. • Tanto los Factores de Ajuste como las Distribuciones Híbridas se pueden caracterizar en términos de una variable de referencia que determine la forma de la distribución de pérdidas (e. g. el nivel de concentración de ciertos activos). • La adición o inclusión de otras medidas de riesgo distintas al VaR y CVaR es relativamente fácil. • La incorporación de restricciones adicionales sobre los Factores de Ajuste o las Distribuciones Híbridas es relativamente sencilla. Es importante mencionar que aunque el objetivo primario de las metodologías aquí desarrolladas fue la medición del riesgo de mercado en condiciones propicias para la distorsión de los precios, dichas metodologías se pueden aplicar para adecuar la metodología estándar por cualquier característica de la distribución de pérdidas que se aleje de los supuestos de dicha metodología. Las metodologías desarrolladas se aplicaron al caso del Bono M Diciembre 2007, suponiendo que se desea medir el riesgo de la posición en dicho bono. Para el caso de la metodología de Factores de Ajuste, se obtuvieron, en entre otros resultados, que los Factores de Ajuste, para un nivel de confianza del 99%, varían en un rango de [1.38, 1.67], lo que significa incrementar el parámetro de desviación estándar entre un 38% y un 67%. Por su parte, para el caso de las Distribuciones Híbridas se obtuvieron, entre otras cosas, que las probabilidades de estrés se encuentren en un rango de [0.00344%, 3.81709%] considerando un nivel de confianza en el cálculo del VaR y CVaR de 95%. En los resultados obtenidos para ambas metodologías, se observó que tanto los Factores de Ajuste como las probabilidades de estrés de las Distribuciones Híbridas se incrementan conforme el parámetro de aversión al riesgo así lo hace. 4 Capítulo 1 Preliminares En este capítulo se presentan los conceptos y resultados teóricos necesarios para los temas que son abordados en los capítulos posteriores y se encuentra organizado de la siguiente manera: en la Sección 1.1 se presentan conceptos básicos de probabilidad; en la Sección 1.2 se introduce el concepto de medidas de riesgo; en la Sección 1.3 se definen los conceptos de VaR y CVaR; en la Sección 1.4 se dan fórmulas explícitas, bajo ciertas condiciones, de las derivadas del VaR y CVaR con respecto al nivel de confianza; en las Secciones 1.5 y 1.6 se estudian el VaR y el CVaR de las distribuciones normal y t no central, respectivamente; finalmente, en la Sección 1.7 se exponen algunos resultados de la Teoría de Valores Extremos. 1.1 Conceptos Básicos de Probabilidad En esta sección se establecen algunos resultados y definiciones que serán utilizadas en secciones posteriores del presente trabajo. Definición 1.1 (σ-álgebra). Una colección de subconjuntos de Ω es una σ-álgebra, denotada S , si satisface las siguientes tres propiedades: 1. ∅ ∈ S . 2. Si A ∈ S entonces Ac ∈ S . 3. Si A1 , A2 , . . . ∈ S entonces ∪i∞=1 Ai ∈ S . Definición 1.2 (Medida de Probabilidad). Dado un conjunto Ω y una σ-álgebra S de subconjuntos de Ω, una medida de probabilidad P es una función con dominio S que satisface: 1. P[ A] ≥ 0 para toda A ∈ S . 5 2. P[Ω] = 1. 3. Si A1 , A2 , . . . ∈ S son conjuntos disjuntos, entonces P[∪i∞=1 Ai ] = ∑i∞=1 P[ Ai ]. Definición 1.3 (Espacio de Probabilidad). Un espacio de probabilidad es una tríada (Ω, S , P) donde Ω es un conjunto cualquiera, S es la σ-álgebra de subconjuntos de Ω, y P es una medida de probabilidad definida sobre S . Definición 1.4 (Variable Aleatoria). Sea (Ω, S , P) un espacio de probabilidad. Una variable aleatoria es una función X : Ω → R tal que para toda a ∈ R {ω ∈ Ω| X (ω ) ≥ a} ∈ S . (1.1) Un caso particular de una variable aleatoria, es la función indicadora de un conjunto A ∈ S definida por: 1 si x ∈ A (1.2) 1 A (x) = 0 si x ∈ /A Definición 1.5 (Función de Distribución Acumulada). Sea (Ω, S , P) un espacio de probabilidad y X : Ω → R una variable aleatoria, entonces FX (y) = P[{ω ∈ Ω| X (ω ) ≤ y}] = PX [(−∞, y)] (1.3) es la función de distribución acumulada (FDA) correspondiente a la variable aleatoria X. Definición 1.6. Sea X una variable aleatoria con función de distribución acumulada dada por F, si existe una función integrable f tal que FX ( x ) = Z x −∞ f (z)dz (1.4) se dirá entonces que X es una variable aleatoria continua. La función f será llamada la función de densidad correspondiente a X. Definición 1.7. Sea (Ω, S , P) un espacio de probabilidad. Las variables aleatorias X y Y se distribuyen de manera idéntica si para todo conjunto A ∈ S se tiene que P [ X ∈ A ] = P [Y ∈ A ] (1.5) La distribución de una variable aleatoria queda totalmente caracterizada por su FDA como se establece en la siguiente proposición. Proposición 1.1. Dos variables aleatorias X y Y se distribuyen de forma idéntica si y sólo si tienen la misma FDA. Demostración. Ver demostración del Teorema 1.5.2 de Casella & Berger (1990). 6 Definición 1.8 (Valor Esperado). Sea X una variable aleatoria con FDA dada por F. El valor esperado de X, denotado E[ X ], se define como E[ X ] = siempre que Z ∞ −∞ Z ∞ −∞ xdF ( x ) (1.6) | x |dF ( x ) exista. Definición 1.9 (Varianza). Sea X una variable aleatoria, la varianza de X se define como V [ X ] = E[( X − E[ X ])2 ] (1.7) siempre que el valor esperado exista. 1.2 Medidas de Riesgo En esta sección se definen las medidas de riesgo y se describen algunas de sus propiedades generales. En particular, se establece la propiedad de coherencia de una medida de riesgo, en el sentido de Artzner et al. (1999). Para introducir el concepto de medidas de riesgo, se representará el valor de una posición financiera como una variable aleatoria definida dentro de un espacio de probabilidad (Ω, S , P). Definición 1.10 (Medida de Riesgo). Sea D un conjunto de posiciones financieras. Se dirá que la función M : D → R es una medida de riesgo si y sólo si satisface las siguientes propiedades: • Monotonía: Para toda X ∈ D y Y ∈ D con X ≤ Y c.s. (casi seguramente1 ) se tiene que M ( X ) ≥ M (Y ) . • Invariante bajo Traslaciones: Para toda m ∈ R se cumple M ( X + m) = M ( X ) − m. La propiedad de monotonía significa que si una posición tiene un valor mayor o igual al valor de otra posición finaciera, bajo cualquier escenario, entonces está última posición se considera más riesgosa que la primera. Por su parte, la propiedad de invarianza bajo traslaciones indica que si se agrega 1 Una propiedad se satisface casi seguramente para una variable aleatoria X si se cumple para todos puntos de su dominio, excepto posiblemente para algún subconjunto con probabilidad cero. 7 un monto m de efectivo, o de activo libre de riesgo, a una posición financiera, entonces el riesgo de está disminuye por el mismo monto m. Es importante notar que la propiedad de invarianza implica en particular que si el monto de efectivo que se agrega a la posición es precisamente el riesgo de la posición, entonces el riesgo se neutraliza. Esta observación se formaliza en el siguiente resultado. Lema 1.1. Sea X una posición financiera y M una medida de riesgo, de acuerdo a la Definición 1.10. Entonces, si se agrega una cantidad de efectivo igual al riesgo de la posición M( X ), el riesgo de la nueva posición, X + M( X ), se neutraliza. Demostración. Por la propiedad de invarianza bajo traslaciones, se cumple que M( X + m) = M( X + M ( X )) = M ( X ) − M( X ) = 0. Por lo tanto, el riesgo de la nueva posición es de cero. Definición 1.11 (Medida de Riesgo Coherente). Sea M : D → R una medida de riesgo. Se dirá que M es coherente si satisface las siguientes propiedades: • Homogeneidad Positiva: Para toda X ∈ D y λ ≥ 0 se cumple que M (λX ) = λM( X ). • Subaditividad: Para toda X, Y ∈ D se satisface M ( X + Y ) ≤ M ( X ) + M (Y ) . La homogeneidad positiva indica que si la posición se incrementa por un factor positivo entonces el riesgo se incrementa por el mismo factor2 . La subaditividad indica que si dos posiciones se combinan en una sola posición, entonces el riesgo de combinar las posiciones es menor o igual a la suma de sus riesgos considerados por separado. Resulta ser que la subaditividad está intimamente relacionada con la propiedad de convexidad como se establece en la siguiente proposición: Proposición 1.2. Sea M una medida de riesgo que satisface la propiedad de homegeneidad positiva, entonces M es una función convexa si y sólo si es subaditiva. Demostración. Sean X y Y dos posiciones financieras y M una medida de riesgo homogenea positiva. Supóngase que M es subaditiva y sea 0 ≤ λ ≤ 1. Entonces, se cumple que M (λX + (1 − λ)Y ) ≤ M (λX ) + M((1 − λ)Y ) = λM( X ) + (1 − λ) M(Y ). 2 Este axioma no se cumple si existe un riesgo de liquidez, ya que en ese caso el riesgo de la posición aumentará más rápido que el tamaño de la misma. 8 Por lo tanto, M es una función convexa. Para demostrar el recíproco supóngase que M es una medida de riesgo convexa. Entonces se sigue que 1 1 1 M(X + Y ) = M X+ Y 2 2 2 1 1 ≤ M ( X ) + M (Y ) , 2 2 de donde, M ( X + Y ) ≤ M ( X ) + M (Y ) . Luego entonces, M es una medida de riesgo subaditiva. 1.3 Los Conceptos de VaR y CVaR En esta sección se definen los conceptos de Valor en Riesgo (VaR) y Valor en Riesgo Condicional (CVaR) y se demuestra que son medidas de riesgo en el sentido de la Definición 1.10. Asimismo, se exponen algunas de sus ventajas y desventajas más importantes. Definición 1.12 (VaR). El Valor en Riesgo o VaR de una posición financiera X a un nivel de confianza α se define como: VaRα ( X ) = inf{ x ∈ R | P[− X ≤ x ] ≥ α} (1.8) Es decir el VaR no es más que el percentil más pequeño de orden α de la distribución de pérdidas asociadas a la posición financiera X. En ocasiones se asociará directamente una función de distribución acumulada FX a las pérdidas de la posición financiera X y estará dada por: FX ( x ) = P[− X ≤ x ]. (1.9) El subíndice X se omitirá para simplificar la notación en caso de que se sobreentienda por el contexto que se hace referencia a la variable aleatoria X. Dada una variable aleatoria X, El VaR para un nivel de confianza α estará dado por VaRα = F ← (α) = inf{ x ∈ R | F ( x ) ≥ α}. Para ilustrar lo anterior se presenta una posible función de distribución acumulada F en la Figura 1.1 y el correspondiente valor de VaRα = F ← (α) en la Figura 1.2. Obsérvese que el VaR esta definido para toda α ∈ (0, 1), inclusive para el valor x = 3 donde F presenta una discontinuidad. Asimismo el VaR presenta una discontinuidad en α = 1/3 debido a que F ( x ) = 1/3 para toda x ∈ [1, 2]. Proposición 1.3. El VaR es una medida de riesgo. 9 1 0.8 0.6 0.4 0.2 0 −3 −2 −1 0 1 2 3 4 5 Fig. 1.1: Gráfica de la FDA 3 2.5 2 1.5 1 0.5 0 −0.5 −1 0 0.2 0.4 0.6 Fig. 1.2: Gráfica del VaRα 10 0.8 1 Demostración. Sean X y Y dos posiciones financieras, entonces si X ≤ Y se tiene que − X ≥ −Y, por lo que { ω ∈ Ω | − X ( ω ) ≤ x } ⊂ { ω ∈ Ω | − Y ( ω ) ≤ x }, de donde P[− X ≤ x ] ≤ P[−Y ≤ x ] para toda x ∈ R. Entonces para toda x ∈ R y para toda α ∈ [0, 1], tal que P[−Y ≤ x ] ≥ α, se tendrá que P[− X ≤ x ] ≥ α. Por lo tanto dado un nivel de confianza α se tiene que inf{ x ∈ R | P[− X ≤ x ] ≥ α} ≥ inf{ x ∈ R | P[−Y ≤ x ] ≥ α} o equivalentemente, que VaRα ( X ) ≥ VaRα (Y ). La propiedad de Invarianza bajo Traslaciones se sigue de VaRα ( X + m) = inf{ x ∈ R | P[−( X + m) ≤ x ] ≥ α} = inf{ x ∈ R | P[− X ≤ x + m] ≥ α} = inf{y − m, y ∈ R | P[− X ≤ y] ≥ α} = inf{y ∈ R | P[− X ≤ y] ≥ α} − m = VaRα ( X ) − m. Una de las desventajas del VaR es que en general no es una medida subaditiva, como se ilustra en el siguiente ejemplo:3 Ejemplo 1.1. Considérense dos bonos distintos A y B de forma tal que sus probabilidades de incumplimiento sean mutuamente excluyentes (es decir si el bono A incumple en su pago entonces el bono B no incumple y viceversa). Un portafolio compuesto de ambos bonos puede tener un VaR global mayor a la suma de los VaR individuales. Por ejemplo, supóngase que ambos bonos tienen como valores de recuperación 70 y 90 con probabilidades de 3% y 2% respectivamente, y que en el resto de los casos se pueden redimir por un valor de 100. Las distribuciones de probabilidad de los bonos A, B y del portafolio compuesto por ambos bonos se resumen en la Tabla 1.1. Asumiendo que el valor inicial de cada bono es simplemente el valor esperado del payoff como se describe en la Tabla 1.1, este puede ser fácilmente calculado mediante dicha tabla. Por ejemplo, para el bono A se tiene un valor inicial de 70 · 3% + 90 · 2% + 100 · 95% = 98.9 y para el portafolio A+B se tiene un valor inicial de 170 · 6% + 190 · 4% + 200 · 90% = 197.8 Notando que la pérdida potencial en cada escenario esta dada por el valor incial menos el valor del rescate de cada bono, se obtiene la Tabla 1.2. 3 El Ejemplo 1.1 fue tomado de Acerbi et al. (2001). 11 Tab. 1.1 Evento A B A+B Prob E1 E2 E3 E4 E5 70 90 100 100 100 100 100 70 90 100 170 190 170 190 200 3% 2% 3% 2% 90% A B A+B 98.9 8.9 98.9 8.9 197.8 27.8 Tab. 1.2 Valor inicial VaR 95% A partir de dicha tabla se puede observar que VaR95% ( A + B) > VaR95% ( A) + VaR95% ( B). Por ende el VaR no es una medida de riesgo subaditiva en este caso. Para remediar algunas de las desventajas del VaR, incluyendo la falta de subaditividad, se introduce el concepto de CVaR, definido a continuación. Definición 1.13 (CVaR). El Valor en Riesgo Condicional o CVaR de una posición financiera X para un nivel de confianza α se define como: CVaRα ( X ) = El valor esperado de la α-cola de la distribución de pérdidas FX donde la distribución en cuestión esta dada por ( FX (z)−α para z ≥ VaRα ( X ) α 1− α FX (z) = 0 para z < VaRα ( X ) (1.10) A continuación se demuestra que el CVaR es una medida de riesgo. Proposición 1.4. El CVaR es una medida de riesgo. Demostración. Sean X y Y dos posiciones financieras. Si X ≤ Y entonces se sigue que P[− X ≤ x ] ≤ P[−Y ≤Rx ], por lo que FXR( x ) ≤ FY ( x ), lo cual implica ∞ ∞ que FXα ( x ) ≤ FYα ( x ), de donde −∞ zdFXα ( x ) ≥ −∞ zdFYα ( x ), o equivalentemente, CVaRα ( X ) ≥ CVaRα (Y ). 12 Para demostrar que el CVaR es invariante bajo traslaciones, considérese el caso en que Y = X + m, para ese caso se tiene que FY ( x ) = P[−Y ≤ x ] = P[−( X + m) ≤ x ] = P[− X ≤ x + m] = FX ( x + m) por definición ( FYα (z) = FY (z)−α 1− α 0 para para z ≥ VaRα (Y ) z < VaRα (Y ) (1.11) por ende ( FYα (z) = FX (z+m)−α 1− α 0 para para z + m ≥ VaRα ( X ) z + m < VaRα ( X ) por lo que FYα (z) = FXα (z + m), luego entonces Z ∞ −∞ zdFYα (z) = = = Z ∞ −∞ Z ∞ −∞ Z ∞ −∞ zdFXα (z + m) (y − m)dFXα (y) ydFXα (y) − m Z ∞ −∞ dFXα (y) = CVaRα ( X ) − m. Proposición 1.5. El CVaR es una medida de riesgo coherente. Demostración. Por la proposición anterior se tiene que el CVaR es una medida de riesgo. Para demostrar que es coherente considerénse dos posiciones financieas X y Y cualesquiera. Para demostrar la homgeneidad positiva del CVaR considérese el caso en que Y = λX con λ > 0, entonces: FY ( x ) = P[−λX ≤ x ] = P[− X ≤ x/λ] = FX ( x/λ) por definición se tiene que ( FαY (z) = FY (z)−α 1− α 0 para para sustituyendo (1.12) en (1.13) se tiene que ( FX ( λz )−α α para 1− α FY (z) = 0 para 13 (1.12) z ≥ VaRα (Y ) z < VaRα (Y ) (1.13) z/λ ≥ VaRα ( X ) z/λ < VaRα ( X ) (1.14) por lo que FYα (z) = FXα (z/λ) para toda z ∈ R, de donde se sigue que CVaRα (Y ) = = = Z ∞ −∞ Z ∞ −∞ Z ∞ zdFYα (z) zdFXα (z/λ) λydFXα (y) −∞ Z ∞ =λ −∞ ydFXα (y) = λ CVaRα ( X ). Rockafellar & Uryasev (2002) demuestran la convexidad de CVaRα , esto aunado a la Proposición 1.2 demuestra que el CVaR es una medida de riesgo coherente. En el caso de que la distribución de la variable aleatoria correspondiente a la distribución de pérdidas F sea continua, el CVaR no es más que el valor esperado de las pérdidas que exceden al VaR, como se detalla y demuestra continuación. Proposición 1.6. Sea X una posición financiera continua con función de distribución de pérdidas FX , entonces CVaRα ( X ) = E[− X | − X > VaRα ] (1.15) Demostración. Sea f la función de densidad correspondiente a la distribución FX , se sigue que CVaRα ( X ) = = = = Z ∞ −∞ zdFXα (z) 1 1−α R∞ VaRα Z ∞ VaRα z f (z)dz z f (z)dz 1 − F (VaRα ) E[− X 1{− X >VaRα } ] P(− X > VaRα ) = E[− X | − X > VaRα ] 1.4 Derivada del VaR y CVaR En esta sección se obtienen fórmulas generales de las derivadas del VaR y CVaR con respecto al nivel de confianza α, para el caso en que la función 14 de distribución acumulada es estrictamente creciente y diferenciable. Estas fórmulas serán de utilidad cuando se analice el comportamiento del factor de ajuste con respecto al nivel de confianza en el Capítulo 2. Lema 1.2. Sea F una función de distribución acumulada asociada a una variable aleatoria X. Supóngase que F es una función estrictamente creciente y diferenciable entonces ∂ CVaR( X ) ∂ VaR( X ) y ∂α ∂α existen y sus derivadas estan dadas por: ∂ VaR( X ) 1 = − ∂α f ( F 1 (α)) ∂ CVaR( X ) 1 E([ X − VaRα ( X )]+ ) = ∂α (1 − α )2 (1.16a) (1.16b) Demostración. Por definición se tiene que: VaRα ( X ) = F ← (α) = inf{t ∈ R | F (t) ≥ α} (1.17) Cómo F es estrictamente creciente, F es una función inyectiva. Además si F es diferenciable en α, será continua, por lo que para cada α ∈ (0, 1) existirá t ∈ R tal que F (t) = α y por ende la función F será suprayectiva también4 . Luego entonces F −1 existe y F ← (α) = F −1 (α) para toda α ∈ (0, 1). Así se tendrá que: ∂ VaR = ∂α 1 dF dα F −1 (α) = 1 f ( F −1 (α)) (1.18) El segundo resultado es consecuencia directa de la existencia de F −1 y de la proposición 13 en Rockafellar & Uryasev (2002). 1.5 El VaR y CVaR de una distribución normal La distribución normal es una de las distribuciones de probabilidad más útiles en el estudio del comportamiento de los activos financieros. En el presente trabajo se recurrirá con frecuencia a la distribución normal para estudiar el riesgo de los bonos gubernamentales y como punto de referencia para estudiar otras distribuciones de riesgo. En particular, en esta sección se deducirán fórmulas explícitas para el cálculo del VaR y CVaR de una distribución normal. La función de densidad de una distribución normal5 con media µ y desviación estándar σ está dada por 4 Este último punto es un tanto sutil y posiblemente valga la pena detallarlo más. Si α ∈ (0, 1) como F es una función de distribución acumulada existirán t∗ y t∗ tales que F (t∗ ) ≥ α y F (t∗ ) < α, aplicando el teorema del valor intermedio sabemos que existe t ∈ [t∗ , t∗ ] tal que F (t) = α. 5 En ocasiones se hará referencia a la distribución normal como distribución Gaussiana. 15 1 ( x − µ )2 f (x) = √ exp − 2σ2 2π y tiene como función de distribución acumulada N( x ) = (1.19) Rx −∞ f (z)dz. Proposición 1.7. Dado un nivel de confianza α ∈ (0, 1), para una variable aleatoria que se distribuye según una normal con media µ y desviación estándar σ se tiene que: VaRα = σN−1 (α) + µ CVaRα = √ (1.20a) ! σ 2π (1 − α) exp 2 − N −1 ( α ) 2 ! +µ (1.20b) Demostración. Sea m(z) = (z − µ)/σ entonces por definición Z VaRα z−µ 2 1 √ exp − dz α= 2σ −∞ 2π Z m(VaRα ) 1 − m2 √ exp = dm 2 −∞ 2π = N(m(VaRα )) por ende m−1 (N−1 (α)) = VaRα y como m−1 (z) = σz + µ se obtiene la fórmula del VaR descrita. Para demostrar la fórmula del CVaR nótese que la función de densidad de la cola de la distribución para valores de z mayores a VaRα es ( −(z−µ)2 1 √ exp para z ≥ VaRα 2 2σ 2πσ(1−α) f α (z) = 0 para z < VaRα Por lo que: CVaRα = = Z ∞ VaRα Z ∞ z f α (z)dz √ VaRα = √ = √ = = 1 2πσ(1 − α) 1 2πσ (1 − α) σ2 z exp Z ∞ m(VaRα ) Z ∞ ( z − µ )2 dz 2σ2 (σm + µ)e−m me−m 2 /2 2 /2 σdm dm + √ σµ Z ∞ e−m 2 /2 dm 2πσ(1 − α) m(VaRα ) ! ! σ m(VaRα )2 µ √ exp − + 1 − N(m(VaRα )) 2 1−α 2π (1 − α) ! ! 2 σ N −1 ( α ) √ exp − +µ 2 2π (1 − α) 2πσ (1 − α) m(VaRα ) 16 donde la última igualdad se sigue del hecho de que m(VaRα ) = N−1 (α) y N(m(VaRα )) = α. Los siguientes corolarios caracterizan el VaR y CVaR de cualquier distribución normal en términos del VaR y CVaR de una distribucíón normal estándar, así como su comportamiento respecto a cambios en el nivel de confianza. Estos resultados serán aplicados en el Capítulo 2. Corolario 1.1. Sean χα y ηα el VaRα y CVaRα de una normal estándar respectivamente, entonces el VaRα y CVaRα de una normal con media µ y desviación estándar σ están dados por: VaRα = σχα + µ (1.21a) CVaRα = σηα + µ (1.21b) Demostración. Se sigue inmediatamente de la Proposición 1.7. Corolario 1.2. El VaR y CVaR de una distribución normal estándar son funciones infinitamente diferenciables en α ∈ (0, 1) y sus primeras dos derivadas están dadas por: 1 dχ = dα (1 − α ) ηα ηα − χ α dη = dα 1−α 2 d χ χα = dα2 (1 − α)2 ηα2 (1.22b) 2(ηα − χα ) − 1/ηα d2 η = dα2 (1 − α )2 (1.22d) (1.22a) (1.22c) Demostración. De la Proposición 1.7 se puede ver que tanto el VaRα como el CVaRα son composiciones de funciones infinitamente diferenciables en el intervalo (0, 1). Asimismo sus derivadas de cualquier orden pueden ser obtenidas mediante un cálculo directo como se detalla a continuación para las derivadas de primer y segundo orden: dχ = dα 1 dN dα N −1 ( α ) = 1 2 exp(−N−1 (α) /2) √ = 1 2 (1−α) exp(−N−1 (α) /2) √ 2π 17 2π (1−α) = 1 (1 − α ) ηα dη d = dα dα √ −1 ! 1 e 2π (1 − α) 2 −N−1 (α) /2 2 −1 2 e−N (α) /2 e−N (α) /2 − √ = √ 2 2π (1 − α) 2π (1 − α) ηα ηα χ α = − 1 − α (1 − α ) ηα ηα − χ α = 1−α d2 χ d = 2 dα dα ! √ 2π (1 − α) dχ χα dα ! d dα e−N −1 (α )2 /2 1 1 d 1 + ηα 1 − α dα ηα ηα − χ α = − (1 − α)2 ηα (1 − α)2 ηα2 χα = (1 − α)2 ηα2 d2 η = dα2 = 1 1−α 1 d ( ηα − χ α ) (1 − α ) − ( ηα dα 2 = + 1 −α) − χα ) d(1dα (1 − α ) ηα − χ α − + ( ηα − χ α ) 1 ηα (1 − α )2 2(ηα − χα ) − 1/ηα (1 − α )2 A partir de (1.22a)-(1.22d) se puede deducir el comportamiento global de χα y ηα . A saber, de (1.22a) y (1.22b) se sigue inmediatamente que tanto χα como ηα son funciones estrictamente crecientes en α. Además, de (1.22c) se deduce que χα tiene un punto de inflexión en α = 0.5 y de (1.22d) que ηα tiene un punto de inflexión en α ≈ 0.291. Por último, de (1.22c) se sigue que χα es una función cóncava para α < 0.5 y convexa para α > 0.5 y de (1.22d) que ηα es una función cóncava para α < 0.291 y convexa para α > 0.291. Las observaciones anteriores se ilustran en la Figura 1.3 donde se grafican χ α y ηα . 18 VaRα y CVaRα de una distribución normal estándar 3 2 1 0 −1 −2 χα ηα −3 0 0.1 0.2 0.3 0.4 0.5 α 0.6 0.7 0.8 0.9 1 Fig. 1.3: Gráfica del VaRα y CVaRα para una distribución normal estándar. 1.6 El VaR y CVaR de una distribución t no central La distribución t no central, al igual que la distribución normal, es ampliamente utilizada en la modelación de riesgos financieros. Esto debido principalmente a que puede modelar los fenómenos de alta curtosis y colas pesadas presentadas comúnmente en las series financieras, y a su relativamente sencillo tratamiento analítico. La función de densidad de una distribución t no central6 es de la forma f T (x) = Γ Γ ν 2 ν +1 2 √ πφν 1 + (x − µ )2 φν −( 1+2 ν ) (1.23) donde µ es un parámetro de localización, φ es un parámetro de dispersión y ν es un parámetro de forma o de grados de libertad. Cabe mencionar que la distribución t de Student, también llamada t estándar, asume µ = 0, φ = 1 y ν entero. La función de distribución acumulada de la distribución t estándar con ν grados de libertad será denotada Tν . A continuación se enuncian y derivan fórmulas explícitas para el VaR y CVaR de la distribución t no central. Proposición 1.8. Dado un nivel de confianza α ∈ (0, 1) para una variable aleatoria 6 Existen parametrizaciones más generales de una distribución t no central, sin embargo, la parametrizacion descrita por la ecuación 1.23 es lo suficientemente general para los propósitos del presente trabajo. 19 con distribución t no central con parámetros µ, φ y ν > 1 se tiene que: p 1 VaRα = φT− ν (α) + µ √ 1 2 f ( T−1 ( α )) φν T− t ν (α) ν CVaRα = 1+ +µ ν−1 ν 1−α (1.24) (1.25) donde f t es la función de densidad de una distribución t estándar con ν grados de libertad. x −µ √ , φ Demostración. Sea m( x ) = α= = Γ Z VaRα Γ −∞ ν 2 entonces por definición ν +1 2 √ πφν 1 + (x − µ )2 φν −( 1+2 ν ) dx −( 1+2 ν ) 2 m √ 1+ dm ν Γ ν2 πν Γ Z m(VaRα ) −∞ ν +1 2 = Tν (m(VaRα )) 1 por ende m−1 (T− ν ( α )) = VaRα de donde se sigue que VaRα = En el caso del CVaR se tiene que 1 CVaRα = 1−α Z ∞ 1 1−α Z ∞ = VaRα √ 1 φT− ν ( α ) + µ. −( 1+2 ν ) 2 ( x − µ ) 1+ √ dx φν Γ ν2 πφν 1 T− ν (α) Γ Γ ν +1 2 x √ ν +1 ( φm + µ) 2 1+ √ √ Γ ν2 πν φ m2 ν −( 1+2 ν ) Z ∞ p 1 ( φm + µ) f t (m)dm 1 − α T−ν 1 (α) √ Z ∞ Z ∞ φ 1 = m f ( m ) dm + µ f t (m)dm t 1 − α T−ν 1 (α) 1 − α T−ν 1 (α) = (1.26) p φdm (1.27) (1.28) (1.29) donde se ha hecho uso del cambio de variable de x por m en (1.27). Haciendo el cambio de variable y = m2 /v en la primera integral de (1.29) y tomando 20 C= 1 Γ( ν+ 2 ) √ Γ( 2ν ) πν se tiene que: −( 1+2 v ) m2 m f t (m)dm = −1 Cm 1 + dm 1 ν T− Tν (α) ν (α) Z ∞ v 1+ ν = T −1 ( α )2 C (1 + y)−( 2 ) dy ν 2 ν ∞ 1+ ν C v2 (1 + y)−( 2 )+1 = T −1 ( α )2 − 1+2 ν + 1 Z ∞ Z ∞ ν ν ∞ ν −( 1+2 ν ) = (1 + y ) C (1 + y ) T−ν 1 (α)2 1−ν ν 1 ( α )2 T− ν 1 1+ ν f t (T− =− ν ( α )). 1−ν ν Para obtener la segunda integral de (1.29) nótese que Z ∞ 1 T− ν (α) f t (m)dm = 1 − Z T −1 ( α ) ν −∞ f t (m)dm = 1 − α por lo que √ φ ν T −1 ( α )2 µ (1 − α ) 1 1+ ν f t (T− ν ( α )) + 1−α ν−1 ν 1−α √ − 1 2 − 1 φν T (α) f t (Tν (α)) = 1+ ν + µ. ν−1 ν 1−α CVaRα = 1.7 Teoría de Valores Extremos En esta sección se exponen brevemente algunos de los resultados claves de la Teoría de Valores Extremos. Para una exposición más detallada, incluyendo las demostraciones de los resultados, se puede consultar, por ejemplo, Embrechts et al. (1997). Definición 1.14 (Dominio de Atracción de Máximos). Sea Xn una sucesión de variables aleatorias independientes e idénticamente distribuidas con función de distribución acumulada dada por F y Mn = max1≤i≤n ( Xi ). Si existen dos sucesiones an : N → R+ y bn : N → R y H ( x ) una función de distribución no degenerada, tales que Mn − bn lim P ≤ x = H (x) (1.30) n→∞ an 21 para toda x en los puntos de continuidad de H, entonces se dice que F pertenece al dominio de atracción de máximos de H, y a esta propiedad se le denota F ∈ DAM( H ). Definición 1.15 (Distribución de Extremos Generalizada). La distribución de extremos generalizada está dada por ( exp −(1 + ξx )−1/ξ para ξ 6= 0, Hξ ( x ) = (1.31) − x exp (−e ) para ξ = 0, donde x es tal que 1 + ξx > 0 y ξ es un parámetro de forma. Si ξ > 0, H es una distribución tipo Fréchet; si ξ < 0, H es una distribución tipo Weibull; si ξ = 0, H es una distribución de tipo Gumbel. Teorema 1.1 (Fisher-Tippett). Sea Xn una sucesión de variables aleatorias independientes e idénticamente distribuidas con función de distribución acumulada dada por F. Si F ∈ DAM( H ), entonces H es una distribución de extremos generalizada de acuerdo a la definición (1.31). Definición 1.16 (Distribución Pareto Generalizada). ( −1 1 − (1 + ξx/β) ξ para Gξ,β ( x ) = 1 − exp(− x/β) para ξ 6= 0, ξ = 0. (1.32) donde β > 0 y x ≥ 0 cuando ξ ≥ 0 mientras que 0 ≤ x ≤ − β/ξ, si ξ < 0. Definición 1.17. Dada una variable aleatoria X con función de distribución acumulada F, se define la función de excesos sobre el umbral u como Fu ( x ) = P[ X − u ≤ x | X > u] (1.33) para 0 ≤ x < x F − u, donde x F es el extremo derecho de la distribución F definido como x F = sup { x ∈ R| F ( x ) < 1}. Teorema 1.2 (Pickands-Balkema-de Haan). Sea F una función de distribución acumulada con funciones de exceso Fu , para u ≥ 0. Entonces, dado ξ ∈ R, F ∈ DAM( Hξ ) si y sólo si existe una función medible positiva β(u) tal que lim sup Fu ( x ) − Gξ,β(u) ( x ) = 0 (1.34) x ↑ x F 0≤ x ≤ x − u F donde G es la función de distribución acumulada de una v.a. Pareto Generalizada con párametros ξ y β, definida como en (1.32). 22 Capítulo 2 Factores de Ajuste de la Volatilidad 2.1 Introducción El objetivo principal de este capítulo es exponer una metodología para ajustar el parámetro de desviación estándar usado para determinar el VaR y el CVaR bajo el supuesto de normalidad de la distribución de pérdidas. Para tal efecto, este capítulo está organizado de la siguiente manera: en la Sección 2.2 se formula matemáticamente la determinación del factor de ajuste. En la Sección 2.3 se estudian algunas de las propiedades del factor de ajuste. En la Sección 2.4 se aplican los resultados derivados en las secciones anteriores en el contexto de los bonos que motivaron este trabajo de tesis. En la Sección 2.5 se descomponen los factores obtenidos en la sección anterior con el objeto de aislar otros fenómenos capturados por el factor de ajuste. En la Sección 2.6 se aplica la metodología desarrollada, en el mismo contexto considerado en la Sección 2.4, pero usando otra variable de referencia. En la Sección 2.7 se motiva el uso de la Teoría de Valores Extremos para una estimación más precisa del VaR y CVaR y con base en estas estimaciones se recalculan los factores de ajuste y se comparan con los obtenidos en secciones anteriores. Finalmente, en la Sección 2.8 se concluye. 2.2 Formulación Matemática Como se menciona en la introducción, el objetivo de este capítulo es, determinar el "ajuste adecuado" que debe aplicarse a la desviación estándar de las pérdidas para estimar el riesgo de mercado de manera más precisa, bajo condiciones de distorsión de los precios. 23 Para tal efecto, se adopta como criterio de "ajuste adecuado" la determinación de un factor de ajuste que al multiplicarse por la desviación estándar observada, dé como resultado una desviación estándar ajustada con base en la cual se estiman simultáneamente el VaR y el CVaR, de la manera "más precisa posible". Es decir, de manera tal que el VaR y CVaR estimados, utilizando la desviación estándar ajustada, se parezca lo "más posible" al VaR y CVaR observados. Concretamente, que la desviación cuadrática de los valores estimados y observados de estas medidas de riesgo sea mínima. En términos matemáticos, el factor de ajuste F ∗ se determina al resolver el problema de optimización Min (1 − δ)(VaRαE −[µ̂ E + χα (F σ̂ E )])2 + δ(CVaRαE −[µ̂ E + ηα (F σ̂ E )])2 F (2.1) donde 0 < δ < 1 es un parámetro que indica la ponderación relativa entre ajustar el VaR de la distribución empírica VaRαE y el CVaR de la distribución empírica1 CVaRαE y cuyo valor se determina a priori. Los parámetros µ̂ E y σ̂ E son, respectivamente, la media y desviación estándar de la distribución empírica. Las funciones χα y ηα representan, respectivamente, el VaR y CVaR de una distribución normal estándar y pueden ser calculadas mediante las fórmulas (1.20a) y (1.20b) del Capítulo 1. El problema de optimización (2.1) tiene una única solución explícita, la cual se enuncia y demuestra formalmente en el Teorema 2.1. Teorema 2.1. Sea α ∈ (0, 1), un nivel de confianza dado. Entonces, el factor de ajuste óptimo F ∗ que resuelve (2.1) es F∗ = (1 − δ)χα (VaRαE −µ̂ E ) + δηα (CVaRαE −µ̂ E ) σ̂ E [(1 − δ)χ2α + δηα2 ] (2.2) Demostración. Dado que la función objetivo del problema (2.1) es convexa y diferenciable en F , basta demostrar que F ∗ satisface las condiciones de optimalidad de primer orden (ver apéndice A). Dichas condiciones se reducen en este caso a la ecuación 0 = 2(1 − δ)(VaRαE −[µ̂ E + χα (F ∗ σ̂ E )])(−χα σ̂ E )+ 2δ(CVaRαE −[µ̂ E + ηα (F ∗ σ̂ E )])(−ηα σ̂ E ) o equivalentemente a la condición 0 =F ∗ [(1 − δ)χα 2 + δηα 2 ]σ̂ E −[(1 − δ)χα (VaRαE −µ̂ E ) + δηα (CVaRαE −µ̂ E )]. (2.3) 1 El VaR y CVaR empíricos fueron calculados a partir de la Proposición 8 de Rockafellar & Uryasev (2002). 24 Obsérvese que δ ∈ (0, 1) implica (1 − δ)χ2α + δηα2 > 0 (2.4) dado que χα 6= ηα para toda α ∈ (0, 1). Por lo tanto, despejando F ∗ de (2.3) se deduce (2.2). 2.3 Propiedades En esta sección se estudian algunas de las propiedades elementales del factor de ajuste F ∗ , a saber las siguientes: • El valor de F ∗ cuando las pérdidas se comportan de acuerdo a una distribución normal. • Condiciones bajo las cuales F ∗ es mayor o igual a cero. • La relación entre F ∗ y el parámetro de aversión al riesgo δ. • La relación entre F ∗ y el nivel de confianza α. 2.3.1 Caso Normal Si las pérdidas se distribuyeran de acuerdo a una distribución normal y se conocieran los parámetros verdaderos de ésta, se esperaría intuitivamente que el factor de ajuste óptimo fuese igual a uno. El siguiente resultado corrobora matemáticamente dicha intuición. Corolario 2.1. Supóngase que la distribución empírica de las pérdidas Π es normal con media µ̂ E y desviación estándar σ̂ E . Entonces, F ∗ = 1 para toda δ ∈ (0, 1) y toda α ∈ (0, 1). Demostración. Supóngase que Π ∼ N (µ̂ E , σ̂ E ). Entonces, por el Corolario 1.1, se cumple que VaRαE = µ̂ E + χα σ̂ E y CVaRαE = µ̂ E + ηα σ̂ E Luego entonces, por el Teorema 2.1, se tiene que F∗ = (1 − δ)χα (VaRαE −µ̂ E ) + δηα (CVaRαE −µ̂ E ) σ̂ E [(1 − δ)χ2α + δηα2 ] (1 − δ)χα (σ̂ E χα + µ̂ E − µ̂ E ) + δηα (σ̂ E ηα + µ̂ E − µ̂ E ) σ̂ E [(1 − δ)χ2α + δηα2 ] (1 − δ)χ2α + δηα2 = (1 − δ)χ2α + δηα2 =1 = 25 Error en la estimación de F* cuando la muestra proviene de una distribución normal Error en la estimación de F* cuando la muestra proviene de una distribución normal 35 Error 0.1 30 0.08 Cuantil Densidad 25 20 15 0.06 0.04 10 0.02 5 0 0 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.1 0.2 0.3 Magnitud del Error 0.4 0.5 0.6 0.7 0.8 0.9 Probabilidad (a) Densidad (b) Cuantil Fig. 2.1: Error en la estimación de F ∗ . Cuando la distribución empírica de pérdidas Π sigue una distribución normal con media µ E y varianza σ E , ambas desconocidas, el factor de ajuste está dado por la expresión: F∗ = σE (1 − δ)χα (µ E − µ̂ E ) + δηα (µ E − µ̂ E ) + E σ̂ σ̂ E [(1 − δ)χ2α + δηα2 ] Por lo que basta con que ambos estimadores µ̂ E y σ̂ E sean consistentes, como lo serían los estimadores por máxima verosimilitud, para que el factor de ajuste óptimo F ∗ converja a 1 conforme el tamaño de la muestra se incrementa. En la Figura 2.1 se muestra la función de densidad (histograma normalizado) y la función cuantil del error2 , dado por |F ∗ − 1| en la estimación de F ∗ , cuando se tiene una muestra de 1000 datos proveniente de una distribución normal estándar, para un nivel de confianza del α = 95% y un valor de δ = 0.5. Ambas gráficas fueron generadas a partir de 100,000 muestras de 1000 datos cada una, provenientes de una distribución normal estándar. Se puede observar que la mayor parte de los errores son cercanos a cero y que la probabilidad de tener un error mayor a 6% es prácticamente cero. 2.3.2 No Negatividad El factor de ajuste óptimo F ∗ , definido en (2.2), no siempre es positivo. Para ilustrar esto considerése el caso en que las pérdidas se comportan de acuerdo a una distribución Pareto con función de densidad dada por f (x) = 3 1 ( x ), x4 (1,∞) (2.5) 2 En este caso coinciden el error relativo y el error absoluto, por lo cual se referirá a ambos simplemte como el "error". 26 donde 1(1,∞) es igual a 1 si x ∈ (1, ∞) y cero en otro caso. Bajo esta distribución, el factor de ajuste F ∗ es negativo, por ejemplo, para δ ∈ [0, 0.05] y α ∈ [0.55, 0.625] como se puede apreciar en la Figura 2.2. Valor del Factor de Ajuste Óptimo Valor de F* Para Una Variable Aleatoria con Distribución Pareto 2 1.5 1 0.5 0 1 −0.5 1 0.9 0.5 0.8 0.7 0.6 Valor de α 0.5 0 Valor de δ Fig. 2.2: Gráfica de F ∗ para el caso de una distribución Pareto, con función de densidad dada por (2.5) y distintos niveles de confianza entre 50% y 100%. La siguiente proposición establece condiciones suficientes para garantizar que F ∗ ≥ 0. Proposición 2.1. Sea δ ∈ (0, 1) y α ∈ [0.5, 1). Supóngase VaRαE ≥ µ̂ E . Entonces F ∗ ≥ 0. Demostración. De (2.2) se deduce que F ∗ ≥ 0 si y sólo si (1 − δ)(VaRαE −µ̂ E )χα + δ(CVaRαE −µ̂ E )ηα ≥ 0. Nótese que la condición anterior se puede reescribir como (VaRαE −µ̂ E )χα + δ[(CVaRαE −µ̂ E )ηα − (VaRαE −µ̂ E )χα ] ≥ 0. (2.6) Por definición del CVaR se cumple que CVaRαE ≥ VaRαE y ηα ≥ χα , para toda α ∈ (0, 1). Por lo tanto, (CVaRαE −µ̂ E )ηα − (VaRαE −µ̂ E )χα ≥ (CVaRαE −µ̂ E )χα − (VaRαE −µ̂ E )χα = (CVaRαE − VaRαE )χα ≥ 0, donde la última desigualdad es consecuencia del supuesto α ∈ [0.5, 1). Luego entonces, es claro que VaRαE ≥ µ̂ E implica (2.6) y por lo tanto se satisface que F ∗ ≥ 0. 27 Obsérvese que la condición de suficiencia de la Proposición 2.1 para la distribución Pareto descrita en (2.5) es equivalente a la condición3 α ≥ 0.7037. Es decir, a que el nivel de confianza sea al menos de 70.37%. Por lo tanto, el factor de ajuste debe ser mayor o igual a cero para niveles de confianza mayores a 70.37%, lo cual se cumple como se puede apreciar en la Figura 2.2. Una consecuencia importante de la Proposición 2.1 es que el factor de ajuste F ∗ es mayor o igual a cero para cualquier distribución simétrica de pérdidas, bajo niveles de confianza mayores o iguales a 50%. En particular, la Proposición 2.1 garantiza que tanto la distribución normal, como la distribución t de Student tienen factores de ajuste positivos para niveles de confianza mayores a 50%. 2.3.3 F ∗ y El Nivel de Aversión al Riesgo δ Proposición 2.2. Sea δ ∈ (0, 1) y α ∈ (0.5, 1). Supóngase que VaRαE > µ̂ E . F ∗ ≥ 0 si y sólo si Entonces ∂∂δ CVaRαE −µ̂ E ηα ≥ E E χα VaRα −µ̂ (2.7) Demostración. Del Teorema 2.1 se tiene que F∗ = (1 − δ)χα (VaRαE −µ̂ E ) + δηα (CVaRαE −µ̂ E ) (1 − δ)χα 2 σ̂ E + δηα 2 σ̂ E (ηα (CVaRαE −µ̂ E ) − χα (VaRαE −µ̂ E ))δ + χα (VaRαE −µ̂ E ) (ηα 2 σ̂ E − χα 2 σ̂ E )δ + χα 2 σ̂ E ( B − A)δ + A = ( D − C )δ + C = (2.8) donde A ≡ χα (VaRαE −µ̂ E ) (2.9a) ηα (CVaRαE χα 2 σ̂ E (2.9b) B≡ C≡ E −µ̂ ) D ≡ ηα 2 σ̂ E (2.9c) (2.9d) Derivando (2.8) con respecto a δ se obtiene ∂F ∗ ( B − A)[( D − C )δ + C ] − [( B − A)δ + A]( D − C ) = ∂δ [( D − C )δ + C ]2 C ( B − A) − A( D − C ) = [( D − C )δ + C ]2 3 Para (2.10) la distribución Pareto con función de densidad dada por (2.5) se tiene que VaRα = 3 (1 − α)−1/3 y µ = 3/2. Por ende, VaRα ≥ µ si y sólo si α ≥ 1 − 23 ≈ 0.7037. 28 Claramente el denominador de (2.10) es positivo, luego entonces sólo si C ( B − A ) ≥ A ( D − C ). ∂F ∗ ∂δ ≥ 0 si y (2.11) Sustituyendo (2.9) en (2.11) y cancelando el término común χα σ̂ E , el cual es positivo por consecuencia del supuesto α ∈ (0.5, 1), se deduce que la condición (2.11) es equivalente a χα ηα (CVaRαE −µ̂ E ) − χα 2 (VaRαE −µ̂ E ) ≥ (VaRαE −µ̂ E )[ηα 2 − χα 2 ]. Dividiendo ambos lados de la desigualdad anterior por χα ηα (VaRαE −µ̂ E ) > 0 se obtiene CVaRαE −µ̂ E ηα χα χα ≥ − − E E η χ ηα VaRα −µ̂ α α o, de manera equivalente, que CVaRαE −µ̂ E ηα ≥ χα VaRαE −µ̂ E de donde se concluye (2.7). La proposición anterior indica que, dado un nivel de confianza α, el factor de escala F ∗ crece conforme δ se incrementa si y sólo si la pérdida en exceso, respecto a la pérdida esperada (µ̂ E ), asociada con el CVaRα es suficientemente grande con respecto a la correspondiente pérdida en exceso relacionada con el VaRα , donde suficientemente grande significa mayor en una proporción de al menos (ηα /χα − 1)%. Dicho porcentaje es la proporción en que el CVaRα es mayor que el VaRα para el caso de una normal estándar y representa la distancia relativa entre el CVaRα y el VaRα . Si se generaliza este concepto de distancia relativa para cualquier distribución, la Proposición 2.2 implica que F ∗ es creciente en δ si la distancia relativa entre el CVaRα y el VaRα para la distribución de pérdidas Π es mayor o igual que la correspondiente distancia relativa para una distribución normal estándar. Una vez establecidas condiciones necesarias y suficientes para la monotonicidad de F ∗ con respecto a δ es de interés analizar la manera en que F ∗ se incrementa bajo dichas condiciones. Como se demuestra en la Proposición 2.2, entre mayor sea la aversión al riesgo, menor será el incremento de F ∗ . Para tal efecto, se usa el siguiente lema. Lema 2.1. Sea δ ∈ (0, 1) y α ∈ (0, 1). Entonces, ∂2 F ∗ ∂F ∗ = − K ∂δ ∂δ2 donde K = 2( D − C ) ( D −C )δ+C > 0. 29 (2.12) Demostración. Derivando (2.10) con respecto a δ se obtiene: 2[( D − C )δ + C ][C ( B − A) − A( D − C )] ∂2 F ∗ =− ∂δ2 [( D − C )δ + C ]4 ! ! 2[( D − C )δ + C ]( D − C ) C ( B − A) − A( D − C ) =− [( D − C )δ + C ]2 [( D − C )δ + C ]2 2( D − C ) ∂F ∗ =− ( D − C )δ + C ∂δ tomando K = 2( D − C ) ( D −C )δ+C se concluye de forma inmediata (2.12). Proposición 2.3. Sea δ ∈ (0, 1) y α ∈ (0, 1). Entonces, ∂2 F ∗ ≤0 ∂δ2 si y sólo si ∂F ∗ ≥0 ∂δ (2.13) Demostración. Se sigue de forma inmediata del lema anterior. En términos geométricos, el resultado anterior indica que F ∗ , como función de δ, es cóncava si y sólo si es creciente. Por lo tanto, cualquier condición necesaria y suficiente para la monotonicidad de F ∗ con respecto a δ lo es también para la concavidad de F ∗ . El siguiente corolario vincula las condiciones de monotonicidad de la Proposición 2.2 con la concavidad de F ∗ . Corolario 2.2. Sea δ ∈ (0, 1), α ∈ (0.5, 1) y VaRαE > µ̂ E . Entonces, sólo si se satisface la condición (2.7). ∂2 F ∗ ∂δ2 ≤ 0 si y Demostración. Se concluye de manera inmediata a partir de la proposición anterior y la Proposición 2.2. Con el objeto de ilustrar los resultados anteriores, se grafica en la Figura 2.3a la diferencia CVaRα ηα − , VaRα χα para el caso de una distribución t de Student con 10 grados de libertad4 , considerando niveles de confianza entre 50% y 100%. Como se puede observar, la condición (2.7) se satisface. Por lo tanto, F ∗ es creciente en δ (Figura 2.3b). Andreev & Kanto (2005) muestran que la condición (2.7) se satisface para cualquier nivel de curtosis entre 0 y 50, y para distintos niveles de confianza, como son α = 90%, 95%, 97.5%, 99% y 99.5%. 4 El VaR y el CVaR de la distribución t de Student fueron calculados usando la Proposición 1.8 del Capítulo 1. 30 Valor de F* Para Una Variable Aleatoria Con Distribución t de Student con 10 grados de libertad Diferencia entre el cociente del CVaR al VaR de una t de Student con 10 grados de libertad y el cociente del VaR al CVaR de una normal estándar Valor del Factor de Ajuste Óptimo 4 3.5 3 2.5 2 1.5 1 1.15 1.1 1.05 1 0.95 0.9 1 1 0.8 0.5 0.6 0.6 0 0.5 0.55 0.7 0.75 0.8 0.6 0.65 0.85 0.9 0.95 1 Valor de α 0.8 0.4 0.4 0.2 0 Valor de δ (b) Gráfica de F ∗ (a) Verificación de la condición (2.7) Fig. 2.3: Distribución t de Student con 10 grados de libertad. 2.3.4 F ∗ y el Nivel de Confianza α Al igual que los resultados de monotonicidad de F ∗ con respecto a δ obtenidos en la Proposición 2.2, se pueden derivar condiciones de monotonicidad de F ∗ respecto al nivel de confianza α. La siguiente proposición establece la suficiencia de dichas condiciones. Proposición 2.4. Sea δ ∈ (0, 1) y α ∈ (0, 1). Si la función de distribución acumulada correspondiente a Π es una función estrictamente creciente y diferenciable en α F ∗ existe y ∂F ∗ ≥ 0 si y sólo si entonces ∂∂α ∂α K1 (VaRα −µ E ) + K2 (CVaRα −µ E ) + K3 ( ∂ VaR ∂ CVaR ) + K4 ( )≥0 ∂α ∂α donde K1 , K2 , K3 y K4 son funciones de δ y α dadas por: 1 − 2χα (ηα − χα ) χ2α 2 K1 (δ, α) = −(1 − δ) + δ (1 − δ ) ηα (2.14a) (1 − α ) ηα 1−α 2 η ( ηα − χ α ) χ α ( ηα − χ α ) − 2 K2 (δ, α) = −δ2 α + δ (1 − δ ) χ α (2.14b) 1−α 1−α K3 (δ, α) = (1 − δ)2 χα 3 + δ(1 − δ)χα ηα 2 2 3 K4 (δ, α) = δ ηα + δ(1 − δ)ηα χα 2 (2.14c) (2.14d) Demostración. Si la función de distribución acumulada correspondiente a Π es estrictamente creciente y diferenciable en α entonces por el Lema 1.2, ∂ VaR ∂α y ∂ CVaR existen. Asimismo por el corolario 1.2 las derivadas de χ y η existen α α ∂α y están dadas por (1.22a) y (1.22b). Partiendo de la ecuación (2.2) el factor de ajuste óptimo puede expresarse como una función del nivel de confianza α de la siguiente manera: 31 F ∗ (α) = Q(α) R(α) (2.15) donde Q(α) = (1 − δ)χα (VaRα −µ E ) + δηα (CVaRα −µ E ) 2 E E R(α) = (1 − δ)χα σ + δσ ηα 2 (2.16a) (2.16b) Partiendo de (2.15) se obtiene entonces la siguiente expresión para la derivada de F ∗ ∂F ∗ = ∂α ∂Q ∂α R ( α ) − Q(α) ∂R ∂α R ( α )2 (2.17) Definiendo S(α) ≡ ∂Q ∂R R(α) − Q(α) ∂α ∂α (2.18) es inmediatio notar que ∂F ∗ ≥0 ∂α si y sólo si S(α) ≥ 0 Luego entonces basta probar que (2.18) es no negativo. Desarrollando (2.18) y cancelando el término común σ E se obtiene: S(α) = K1 (VaRα −µ E ) + K2 (CVaRα −µ E ) + K3 ( donde K1 , K2 , K3 y K4 estan dados por (2.14) ∂ VaR ∂ CVaR ) + K4 ( ) (2.19) ∂α ∂α Una vez fijados el nivel de confianza α y el parámetro δ las constantes K1 , K2 , K3 y K4 pueden calcularse por medio de (2.14). Sin embargo se necesita una forma funcional o parámetrica de la función de distribución acumulada ∂ CVaR para poder obtener ∂ VaR por lo que la Proposición 2.4 sólo es útil ∂α y ∂α para estudiar distribuciones "teóricas". 2.4 Aplicaciones En esta sección se obtienen y analizan los factores de ajuste para dos casos particulares: el caso del Bono M Diciembre 2007, el cual corresponde al fenómeno que motivó el presente trabajo, y el caso del Bono M Junio 2011, el cual corresponde a un bono altamente concentrado, como el Bono Diciembre M 2007, pero que a diferencia de este último, no ha mostrado una distorsión tan significativa en sus precios. La consideración del Bono M Junio 2011 se hace con el objeto de contrastar los factores de ajuste para dicho bono, respecto a aquellas obtenidas para el Bono M Diciembre 2007. 32 2.4.1 Bono M Diciembre 2007 Para poder aplicar el Teorema 2.1 es necesario determinar la distribución de pérdidas a considerar. Para tal efecto, se consideraron en primera instancia las variaciones diarias porcentuales de los precios del Bono M Diciembre 2007, comprendidas entre el 4 de enero del 2001 y el 30 de noviembre del 2007. Dado que es de interés asociar el comportamiento del factor de ajuste con los altos niveles de concentración mostrados por este bono, se determinaron las distribuciones de pérdidas empíricas de las variaciones porcentuales asociadas con distintos niveles de concentración predeterminados. A partir de cada una de estas distribuciones se determinaron los factores de ajuste para distintos valores de δ, dado un nivel de confianza α. Por ejemplo, en la Figura 2.4 se grafica F ∗ para distintos valores de δ, en el caso de concentraciones mayores o iguales a 50% y considerando un nivel de confianza del 99%. Valor de F* para una concentración mayor o igual al 50% Nivel de Confianza del 99% 1.48 Valor de F* 1.46 1.44 1.42 1.4 1.38 1.36 0 0.1 0.2 0.3 0.4 0.5 0.6 Valor de δ 0.7 0.8 0.9 1 Fig. 2.4: Bono Diciembre 2007. Gráfica de F ∗ con respecto a δ, para C0 ≥ 50% y α = 99%. Por su parte en la Figura 2.5 se grafica el factor F ∗ como función de δ, para un nivel de confianza del 99%, pero considerando distintos niveles de concentración C0 . Como se puede observar en las Figuras 2.4 y 2.5, el factor F ∗ es una función creciente respecto a δ. Esto se debe a que las distribuciones consideradas satisfacen la condición (2.7) de la Proposición 2.2. Para ilustrar esto último, se tabularon los valores de ηα CVaRαE −µ y χα VaRαE −µ en el caso de una concentración mínima de 80%, considerando distintos nive33 Valor del Factor de Ajuste Óptimo F* Valor de F* para distintos niveles de concentración Nivel de Confianza del 99% 1.8 1.7 1.6 1.5 1.4 1.3 0.9 0.8 1 0.7 0.6 0.4 0.6 Rango de Concentración 0.8 0.5 0.2 0 Valor de δ Fig. 2.5: Bono Diciembre 2007. Gráfica de F ∗ para distintos niveles de concentración mínima y α = 99%. les de confianza. Esto se muestra en la Tabla 2.1. Tab. 2.1: Verificación de la Condición 2.7 2.4.2 α CVaRαE −µ̂ E VaRαE −µ̂ E ηα χα 95% 96% 97% 98% 99% 1.8291 1.7437 1.5074 1.4116 1.3246 1.254 1.2306 1.2059 1.1788 1.1457 Bono M Junio 2011 De la misma manera en que se procedió en la sección anterior, se obtuvieron los factores de ajuste para el caso del Bono M Junio 2011 para distintos valores de δ y rangos de concentración mínimos, considerando un nivel de confianza del 99%, como se muestra en la Figura 2.6. 34 Valor del Factor de Ajuste Óptimo F* Valor de F* para distintos niveles de concentración Nivel de Confianza del 99% 2.8 2.6 2.4 2.2 2 0.9 0.8 0.8 0.7 0.4 0.6 Rango de Concentración 1 0.6 0.5 0.2 0 Valor de δ Fig. 2.6: Bono Junio 2011. Gráfica de F ∗ para distintos niveles de concentración mínima y α = 99%. 2.5 Descomposición del Efecto de Distorsión Un factor de ajuste F ∗ distinto a uno no implica necesariamente una distorsión de los precios. Esto se puede deber a otras causas. Por ejemplo, las siguientes: • La distribución de pérdidas no es normal. • La distribución de pérdidas es normal, pero los parámetros estimados no son los verdaderos. Por esta razón, en esta sección se propone una manera de extraer el efecto de distorsión a partir del factor de ajuste. Para tal efecto, se supone que el factor F ∗ se descompone de la siguiente forma: F ∗ = F N∗ F D∗ (2.20) ∗ es el factor de ajuste debido a las condiciones de mercado "nordonde F N ∗ es el factor males" en las que no se presentan distorsiones de los precios, y F D que se aplica adicionalmente por distorsión de los precios. Para determinar F N∗ se considera el conjunto de aquellos títulos que no presentan dicha distorsión. En el caso particular de los bonos M Diciembre 2007 y Junio 2011, se consideró al bono M Diciembre 2024 como un bono representativo en condiciones de mercado "normales" y para el cual se determinan los factores de ajuste como a continuación se especifica. 35 Valor de F* para una concentración mayor o igual al 50% Nivel de Confianza del 99% Valor de F* 1.3 1.25 1.2 1.15 0 0.1 0.2 0.3 0.4 0.5 0.6 Valor de δ 0.7 0.8 0.9 1 Fig. 2.7: Bono Diciembre 2024. Gráfica de F ∗ con respecto a δ, α = 99%. 2.5.1 Bono M Diciembre 2024 Aplicando el mismo procedimiento utilizado para los casos de los bonos M Diciembre 2007 y Junio 2011, se obtuvieron los factores de ajuste para el bono M Diciembre 2024, considererando distintos valores de δ y un nivel de confianza α = 99%. Sin embargo, dada la muy baja concentración del bono, no es necesario tomar distintos rangos de concentración como en los casos anteriores. El resultado del cálculo se muestra en la Figura 2.7. Obsérvese que para el nivel de confianza del considerado, el factor de ajuste es mayor a uno para cualquier valor de δ. Esto se debe a que la distribución de pérdidas para el bono M Diciembre 2024 no es normal. 2.5.2 Factor de Distorsión del bono M Diciembre 2007 A partir de la relación (2.20) y utilizando los factores calculados en las secciones 2.4.1 y 2.5.1, se determinaron los factores de distorsión del bono M Diciembre 2007 para distintos valores de δ y rangos de concentración mínima. Dichos factores se muestran en la Figura 2.8. 2.6 Otras variables de referencia Aunque un alto nivel de concentración en la tenencia de la emisión de un título en particular genera condiciones propicias para la distorsión del precio del mismo, no necesariamente se sigue que dicha distorsión se de, o bien que 36 1.3 Cociente de F*Dic07/F*Dic24 para distintos niveles de concentración Nivel de Confianza del 99% Factor de Distorsión Factor de Distorsión Cociente de F*Dic07/F*Dic24 para distintos niveles de concentración Nivel de Confianza del 95% 1.2 1.1 1 0.9 0.9 1.3 1.25 1.2 1.15 1.1 0.9 0.8 0.7 0.6 Rango de Concentración 0.5 0 0.2 0.4 0.6 Valor de δ 0.8 1 0.8 0.7 0.6 Rango de Concentración (a) α = 95% 0.5 0 0.2 0.4 0.6 0.8 1 Valor de δ (b) α = 99% ∗ ) para distintos niveles de concentración Fig. 2.8: Factor de distorsión (F D mínima. la volatilidad de su precio sea significativamente menor que la observada para otras emisiones del mismo título que no se encuentran concentradas. Por lo tanto, con el afán de medir de forma más directa el impacto de la distorsión de los precios del instrumento sobre el factor de ajuste, se consideró de interés aplicar el Modelo (2.1) a otra variable de referencia. A saber, la diferencia relativa ( DR) entre los precios observados ( POBS ) y los teóricos ( PTEO ), definida como P − PTEO (2.21) DR = OBS PTEO donde el precio teórico del instrumento se obtiene a partir de algún modelo económetrico ya sea de precios del instrumento o de sus rendimientos a vencimiento. En este caso en particular, se utilizó el modelo de Nelson & Siegel (1987), con la modificación de Svensson (1994), el cual modela los rendimientos teóricos del instrumento mediante una regresión no lineal de los rendimientos a vencimiento de un conjunto de bonos comparables5 . La forma parámetrica del modelo para la tasa spot rm es: 1 − exp − τm m 1 rm = β 0 + ( β 1 + β 2 ) − β 2 exp − + m τ1 τ1 ! 1 − exp(− τm2 ) m β3 − β 3 exp − (2.22) m τ2 τ2 Nótese que el modelo de regresión es no lineal debido a los parámetros τ1 y τ2 , por lo que generalmente se fijan primero y se obtienen el resto de los 5 Nelson & Siegel (1987) proponen por ejemplo usar el modelo para ajustar una curva de bonos gubernamentales cupón cero, específicamente los T-bills. 37 Valor de F* para distintos niveles de diferenciales Nivel de Confianza del 99% Valor del Factor de Ajuste Óptimo F* Valor del Factor de Ajuste Óptimo F* Valor de F* para distintos niveles de diferenciales Nivel de Confianza del 95% 1.6 1.4 1.2 1 0.8 0.08 1 0.07 0.6 0.06 Rango de Diferenciales 1.7 1.6 1.5 1.4 1.3 0.08 1 0.07 0.8 0.2 0 Valor de δ 0.6 0.06 0.4 0.05 1.8 Rango de Diferenciales (a) α = 95% 0.8 0.4 0.05 0.2 0 Valor de δ (b) α = 99% Fig. 2.9: Bono Diciembre 2007. Factor F ∗ para distintos niveles de diferenciales mínimos. parámetros por mínimos cuadrados ordinarios, repitiéndose el proceso para distintos valores de τ1 y τ2 . Una vez obtenidos los rendimientos teóricos a través de (2.22) por medio del proceso descrito anteriormente, es posible calcular los precios teóricos del instrumento, con lo que se obtiene a su vez los diferenciales relativos dados por (2.21). En la Figura 2.9 se muestran los resultados para el bono Diciembre 2007. 2.7 2.7.1 Aplicación de la Teoría de Valores Extremos Dificultades en la estimación del VaR y CVaR Típicamente, el VaR y el CVaR se estiman utilizando la distribución empírica construida a partir de los datos observados. Por lo tanto, bajo estas circunstancias, siempre es posible encontrar un nivel de confianza α suficientemente cercano al 100% tal que el VaR y el CVaR coincidan para niveles de confianza mayores o iguales a α en la pérdida máxima registrada. Este hecho, en el caso de contar con relativamente pocos datos y considerando que la distribución de pérdidas verdadera es no acotada (e.g. normal), implica que para niveles de confianza relativamente altos se subestime el riesgo en términos del VaR y CVaR. Esta última observación es particularmente relevante en el contexto de aplicación del análisis realizado ya que a medida que se incrementa el valor de la variable de referencia (e.g. concentración) se reduce la cantidad de observaciones correspondientes. De manera sinóptica, las dificultades anteriores se describen de manera esquemática en la Figura 2.10. 38 ↑ Nivel de la variable ↓ Número de Observaciones Consideradas (N) de referencia (c) VaRα → CVaRα → Máxima Pérdida ↑ Nivel de Confianza (α) F* no es creciente respecto a δ (Condición (2.7)) Subestimación del Riesgo Fig. 2.10: Dificultades en la estimación del VaR y CVaR. Para ilustrar la problemática antes descrita, considérese el caso de las pérdidas asociadas a una concentración mayor o igual al 50% para el Bono M Diciembre 2007. Dado que la muestra contiene 501 datos, para percentiles superiores al 99.8%, se tendrá que el VaR, el CVaR y la máxima pérdida son iguales a 0.3301%, como se puede ver a partir de la Tabla 2.2. Tab. 2.2: Pérdidas asociadas a una concentración mayor o igual a 50%. Percentil Pérdidas 99.20% 99.40% 99.60% 99.80% 100% 0.1881% 0.1907% 0.1951% 0.1962% 0.3301% Debido a las dificultades de estimación anteriormente mencionadas, es de interés práctico encontrar una metodología que permita remediar parcial o totalmente dichas dificultades. Dado que la Teoría de Valores Extremos estudia precisamente el comportamiento de valores extremos, que conlleva al uso de muestras reducidas, los estimadores obtenidos mediante esta teoría son candidatos naturales para resolver estos problemas. 39 2.7.2 Estimadores del VaR y CVaR usando TVE A partir de la Teoría de Valores Extremos, McNeil (1999) deriva los estimadores del VaR y CVaR [α = u + β̂ VaR ξ̂ n (1 − α ) Nu ! −ξ̂ −1 [ \α = VaRα + β̂ − ξ̂u CVaR 1 − ξ̂ 1 − ξ̂ (2.23) (2.24) donde n es el número total de datos, Nu es el número de datos que exceden el umbral u; y ξ̂, β̂ son los estimadores de los parámetros ξ y β de la distribución Pareto Generalizada dada por ( −1 1 − (1 + ξx/β) ξ para ξ 6= 0, Gξ,β ( x ) = (2.25) 1 − exp(− x/β) para ξ = 0. donde β > 0, y x ≥ 0 cuando ξ ≥ 0 y 0 ≤ x ≤ − β/ξ si ξ < 0. La derivación de los estimadores (2.23) y (2.24) se lleva acabo a partir de la relación F ( x ) = (1 − F (u)) Fu ( x − u) + F (u) (2.26) Fu (y) = P( X − u ≤ y| X > u) (2.27) donde es la distribución de los excesos sobre el umbral u, para 0 ≤ y ≤ x F − u, y donde x F es el extremo derecho de la distribución F, definido como x F = sup{ x ∈ R| F ( x ) < 1}. Por el teorema de Pickands-Balkema-de Haan6 la distribución de excesos Fu se puede aproximar por una distribución Pareto Generalizada con parámetros ξ y β, para un umbral u "suficientemente grande". Es decir, Fu (y) ≈ Gξ,β (y) (2.28) para u suficientemente grande. Por lo tanto, F ( x ) ≈ (1 − F (u)) Gξ,β ( x − u) + F (u) (2.29) para x > u. Luego entonces, estimando F (u) con n − Nu n 6 Ver Teorema 1.2. 40 (2.30) donde Nu es el número de datos que exceden el umbral u, se deduce que F̂ ( x ) = 1 − Nu n 1 + ξ̂ x−u β̂ − 1 ξ̂ (2.31) Así, para obtener la aproximación del VaRα basta usar la definición F̂ (VaRα ) = α y despejar el VaR usando (2.31). Para obtener la aproximación (2.24) del CVaRα , se parte de la Proposición 1.6 para obtener la identidad CVaRα = VaRα + E[ X − VaRα | X > VaRα ] (2.32) demostrada en la Proposición 1.6, de la relación E[ X − VaR | X > VaR] = E[ Z ] (2.33) donde Z ∼ FVaRα , y de la aproximación FVaRα (y) ≈ Gξ (VaRα −u),β (y) para deducir que E[ X − VaRα | X > VaRα ] ≈ β + ξ (VaRα −u) 1−ξ (2.34) Por lo tanto, de (2.34) y (2.32) se obtiene (2.24). 2.7.3 Aplicación en la determinación de F ∗ Con el fin de mitigar las dificultades en la estimación del VaR y CVaR se obtuvo el factor de ajuste F ∗ aplicando TVE . Para ello se siguieron los siguientes pasos: 1. Se filtraron los datos respecto al nivel de concentración. 2. A partir de los datos obtenidos, y dado un nivel de confianza α, se escogió el umbral u tomando u = VaRα . 3. Una vez determindo el umbral se estimaron los parámetros de la distribución Pareto Generalizada. 4. A partir de la estimación anterior de los parámetros, se obtuvieron los estimadores del VaR dado por (2.23) y del CVaR dado por (2.24). 5. Con los estimadores del VaR y CVaR se obtuvo el Factor de Ajuste para distintos valores de δ y niveles de la variable de referencia. 41 Fig. 2.11: Factor de Ajuste para distintos niveles de concentración. Utilizando los datos de rendimientos del Bono M Diciembre 2007, se instrumentó el procedimiento anterior para un nivel de confianza del 95%, considerando distintos rangos de concentración. Los resultados se muestran en la Figura 2.11. Como puede apreciarse de dicha figura, la estimación del factor de ajuste F ∗ es muy similar a la obtenida con anterioridad. Aunque el procedimiento anterior puede ser automatizado fácilmente, no garantiza que el umbral escogido sea el adecuado y por ende que la estimación lo sea. Como alternativa para determinar el umbral puede utilizarse el siguiente procedimiento, propuesto por Sarma (2005), que consiste a grandes rasgos en lo siguiente: 1. Hacer un análisis exploratorio de los datos, con el fin de verificar si existe una cierta estructura de dependencia en el tiempo de las observaciones (e.g. evidencia de autocorrelación). 2. Si hay indicación de dependencia, especificar un modelo de series de tiempo adecuado. En el caso de series financieras podría utilizarse un modelo GARCH. 3. Si el modelo anterior está bien especificado, los residuos obtenidos deberán ser variables aleatorias independientes e idénticamente distribuidas. Por ende, por el Teorema de Pickands-Balkema-de Haan, para un umbral suficientemente grande, la cola de la distribución de los residuos podrá ser modelada a través de una distribución Pareto Generalizada. 4. Ajustar la distribución Pareto Generalizada para varios umbrales. Los umbrales pueden ser escogidos de tal forma que representen el 1%, 2%, 3%, ..., hasta el 15% de las observaciones extremas. Graficar los parámetros estimados, y a partir de la gráfica escoger un umbral para el cual la estimación de los parámetros sea relativamente estable. 42 5. Aplicar una prueba de bondad de ajuste para evaluar que tan significativa es la diferencia entre la cola de la distribución empírica y la cola estimada mediante la distribución Pareto Generalizada. Para ello podría utilizarse, por ejemplo, la prueba de Kolmogorov-Smirnoff (KS). Aunque el ajuste de los datos observados a partir de un modelo GARCH se encuentra más alla del alcance del presente trabajo, el lector interesado puede consultar el trabajo de Sarma (2005) para una exposición más detallada del procedimiento antes delineado. 2.8 Conclusiones La motivación principal de este capítulo fue determinar el "ajuste adecuado" que debe aplicarse a la desviación estándar de las pérdidas para estimar el riesgo de mercado de manera más precisa, bajo condiciones de distorsión de los precios. De esta manera, se adoptó un criterio para definir lo que se entendería por "ajuste adecuado". A saber, en términos de la determinación de un factor de ajuste que al multiplicarse por la desviación estándar observada, dé como resultado una desviación estándar ajustada con base en la cual se estiman simultáneamente el VaR y el CVaR, de la manera "más precisa posible". Es decir, de manera tal que el VaR y CVaR estimados, utilizando la desviación estándar ajustada, se parezca lo "más posible" al VaR y CVaR observados. Concretamente, que la desviación cuadrática de los valores estimados y observados de estas medidas de riesgo sea mínima. El criterio anterior se formuló matemáticamente como la solución de un problema de optimización que presenta las siguientes ventajas: • La formulación permite asignar el peso relativo que tiene la desviación cuadrática relacionada con el CVaR respecto a aquélla vinculada con el VaR. El valor de dicho peso relativo, denominado δ, se puede asociar, al menos intuitivamente, a un cierto nivel de aversión al riesgo en el sentido de que entre mayor sea el valor de este ponderador, mayor es la importancia se le da al valor estimado del CVaR, la medida de riesgo más conservadora de las dos consideradas en el presente análisis. • El problema de optimización tiene solución explícita y única, lo cual implica lo siguiente: – Existe una fórmula explícita para el factor de ajuste. – El factor de ajuste está caracterizado por dicho problema de optimización. • El factor de ajuste caracterizado de esta manera tiene propiedades teóricas atractivas. Por ejemplo: 43 – Es igual a uno para el caso en que la distribución de pérdidas sea una distribución normal. Es decir, en caso de que el supuesto estándar de la distribución de pérdidas se cumpla en la realidad, no hay ajuste que hacer a la desviación estándar observada. Esto implica que en la forma en que se caracteriza el factor de ajuste, no existe ningún sesgo bajo el supuesto estándar de la distribución de pérdidas. – Es mayor o igual que cero para niveles de confianza mayores o iguales al 50%, en los que el VaR observado es mayor o igual que la pérdida promedio; condiciones que típicamente se cumplen en la práctica. – Es una función creciente del ponderador δ, es decir, el factor de ajuste aumenta conforme el nivel de aversión al riesgo se incrementa, bajo las siguientes dos condiciones: ∗ El VaR observado es mayor que la pérdida promedio. ∗ La pérdida en exceso, respecto a la pérdida promedio, asociada con el CVaR es mayor que la correspondiente pérdida en exceso relacionada con el VaR en una proporción mayor o igual a la proporción en que el CVaR es mayor al VaR de una distribución normal estándar. Ambas condiciones se cumplen típicamente en la práctica. La primera debido a que usualmente la medición del VaR se hace para niveles de confianza superiores al 95%, para los cuales el VaR observado es mayor que la pérdida promedio. La segunda, dado que la distribución de las pérdidas en la práctica por lo general tiene colas pesadas. En el contexto particular en el que se aplicó la metodología desarrollada se obtuvieron los siguientes resultados: • Para el caso del Bono M Diciembre 2007, se obtuvieron los factores de ajuste considerando dos niveles de confianza, 95% y 99%, para cada uno de los cuales se tomaron en cuenta distintos niveles de concentración, variando el nivel de aversión al riesgo del 0% al 100%. Para dichos factores se observa lo siguiente: – El rango de los factores de ajuste es [0.92, 1.4], para α = 95%, y de [1.38, 1.67], para α = 99%. – Para cualquier nivel de concentración considerado se cumple que los factores de ajuste aumentan conforme el nivel de aversión al riesgo se incrementa. 44 • Para el caso del Bono M Junio 2011, el rango de los factores de ajuste para α=99% es [2.08,2.51]. En este caso los factores de ajuste disminuyen conforme se incrementa el nivel de aversión al riesgo para cualquier nivel de concentración considerando. • Para el caso del Bono M Diciembre 2024, el rango de los factores de ajuste es [1.17,1.29]. En este caso los factores de ajuste se incrementan conforme el nivel de aversión al riesgo se incrementa. • Utilizando los resultados del Bono M Diciembre 2024, se aisló el efecto de distorsión de los precios del Bono M Diciembre 2007, en términos de factores de distorsión para los que se observa lo siguiente: – En general el valor de los factores disminuyen para cualquier nivel de concentración considerado, respecto al valor de los factores sin considerar el Bono M Diciembre 2024. – Considerando un nivel de confianza del 95% los factores de ajuste se incrementam conforme se incrementa el nivel de aversión al riesgo para cualquier nivel de concentración considerando. – Considerando un nivel de confianza del 99% los factores de ajuste se incrementan conforme se incrementa el nivel de aversión al riesgo para niveles de concentración superiores al 77% y disminuyen conforme se incrementa el nivel de aversión al riesgo para niveles de concentración inferiores al 77%. La metodología desarrollada en este capítulo se puede adaptar fácilmente para • Añadir o incluir otras medidas de riesgo distintas al VaR y CVaR. • Incorporar restricciones adicionales sobre el factor de ajuste. • Utilizar otras variables de referencia. 45 Capítulo 3 Aplicación de Distribuciones Híbridas 3.1 Introducción y Motivación En el capítulo anterior se desarrolla y ejemplifica la aplicación de una metodología para ajustar el parámetro de desviación estándar con el objeto de medir el riesgo de mercado -en términos del VaR y del CVaR- de manera más precisa en condiciones de distorsión de los precios, bajo el supuesto estándar de que los rendimientos de los mismos se distribuyen de acuerdo a una distribución Gaussiana. En este capítulo, al igual que el anterior, se busca medir dicho riesgo partiendo del supuesto estándar de una distribución de pérdidas Gaussiana. Sin embargo, en lugar de ajustar el parámetro de desviación estándar, se incorpora la posibilidad de realización de un evento de estrés en el cual la distribución de pérdidas es distinta a la distribución Gaussiana que es considerada bajo condiciones normales. De esta manera, lo que se busca es determinar la verosimilitud de dicho evento de estrés la cual, junto con la distribución de pérdidas considerada en este evento, permite construir una distribución "híbrida" a partir de la cual se mide el riesgo de manera más precisa. Por lo tanto, el objetivo central de este capítulo es describir una metodología para determinar dicha distribución "híbrida". Este capítulo se encuentra organizado de la siguiente manera: en la Sección 3.2 se define, de manera formal, e ilustra el concepto de distribuciones de probabilidad híbridas. En la Sección 3.3 se formula matemáticamente el modelo para la determinación de la probabilidad de condiciones de estrés, la cual se utiliza para establecer la distribución de pérdidas híbrida. En la Sección 3.4 se estudian algunas propiedades teóricas de la probabilidad de estrés obtenida a través de dicho modelo. En la Sección 3.5 se describe la 46 instrumentación del modelo para la obtención de la probabilidad de estrés mediante la aplicación de simulación. En las Secciones 3.6 y 3.7 se aplica la metodología desarrollada en el contexto de los bonos que motivaron este trabajo de tesis. A saber, se desarrollan dos casos particulares de distribuciones híbridas considerando, en ambos casos, una distribución Gausssiana para las condiciones normales y una Gaussiana y una t de Student, respectivamente, para las condiciones de estrés. Finalmente en la Sección 3.8 se concluye. 3.2 Distribuciones Híbridas De manera formal, la distribución híbrida asociada a dos distribuciones es la distribución no condicional correspondiente a dichas distribuciones, suponiendo que éstas son distribuciones condicionales de eventos complementarios. En términos matemáticos, Definición 3.1 (Distribución Híbrida). Sea X una variable aleatoria tal que X ∼ FA si el evento A ocurre y X ∼ FB si el evento B ocurre, donde A y B son conjuntos complementarios. Entonces la distribución híbrida FH de FA y FB satisface FH ( x ) = βFA ( x ) + (1 − β) FB ( x ) (3.1) para toda x ∈ Rango( X ), donde P[ A] = β. Las distribuciones híbridas surgen de manera natural en el contexto de riesgos cuando es necesario medir el riesgo en dos circunstancias mutuamente excluyentes cuyas distribuciones son típicamente muy diferentes. Para ilustrar el concepto y la aplicación de distribuciones híbridas considerénse los siguientes ejemplos: Ejemplo 3.1 (Pérdidas por Riesgo de Crédito). Una institución financiera desea medir sus pérdidas por riesgo de crédito. Para ello, la institución estima que dichas pérdidas, en términos relativos, y las cuales se denotan por Π, ascienden a un porcentaje M, en caso de incumplimiento de sus deudores con probabilidad p, y a cero en caso contrario con probabilidad 1 − p. Dicho porcentaje M se comporta de acuerdo a una distribución triangular Λ(·| a, υ, b), donde a > 0 es el valor mínimo, υ es la moda y b su valor máximo; y cuya función de densidad (Figura 3.1) es 2( x − a ) para a≤x<υ (b− a)(υ− a) 2 ( b − x ) Λ( x | a, υ, b) = (3.2) para υ≤x<b (b− a)(b−υ) 0 en otro caso Para medir sus pérdidas, la institución determina la distribución de Π de la siguiente manera: 47 Fig. 3.1: Función de densidad de la distribución triangular Λ(·| a, υ, b). Sea I el evento en que los deudores incumplen. Entonces, se cumple P( Π ≤ x ) = P( I )P( Π ≤ x | I ) + P( I c )P( Π ≤ x | I c ) = pP(Π ≤ x | I ) + (1 − p)P(Π ≤ | I c ) donde c P( Π ≤ x | I ) = 0 1 para para x<0 x≥0 (3.3) (3.4) y P( Π ≤ x | I ) = 0 para x<a para a≤x<υ para para υ≤x<b x≥b ( x − a )2 (b− a)(υ− a) ( b − x )2 1 − (b− a)(b−υ) 1 Por lo tanto, de (3.3) a (3.5), se deduce que 0 1− p ( x − a )2 p (b− a)(υ− a) + 1 − p P( Π ≤ x ) = 2 1 − p (b−(ba−)(xb)−υ) 1 (3.5) para x < 0 para 0 ≤ x < a para a≤x<υ para para υ≤x<b x≥b (3.6) La institución financiera estima que sus pérdidas relativas pueden variar desde un valor mínimo de 30% hasta un valor máximo de 70%, con una moda de 65% y una probabilidad p de 5%. Considerando estos parámetros, se determina la distribución híbrida correspondiente utilizando (3.6) y la cual, junto con su densidad correspondiente, se ilustran en la Figura 3.2. Con base en esta distribución híbrida, la institución determina un VaR95% = 0% y un CVaR95% = 55%. Para complementar su análisis, la institución considera otros valores para la probabilidad p, a saber p = 1% y p = 10%. En la Figura 3.3 se grafican las densidades híbridas correspondientes. El VaR y 48 Función de Distribución Acumulada de las Pérdidas Π. Probabilidad de Incumplimiento P=5% Función de Densidad de las Pérdidas Π. Probabilidad de Incumplimiento P=5% 1 1 0.95 0.9 0.8 0.8 0.7 0.7 Probabilidad Probabilidad 0.9 0.6 0.5 0.4 0.6 0.5 0.4 0.3 0.3 0.2 0.2 0.1 0 0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 −0.2 1 0 Pérdida en términos relativos 0.2 0.4 0.6 0.8 Pérdida en términos relativos (a) Función de Densidad (b) Función de Distribución Acumulada Fig. 3.2: Densidad y Distribución Híbrida del Ejemplo 3.1. Función de Densidad de las Pérdidas Π. Probabilidad de Incumplimiento P=1,5 y 10% 1 P=5% P=1% P=10% 0.9 Probabilidad 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Pérdida en términos relativos Fig. 3.3: Densidad Híbrida para distintas probabilidades de incumplimiento (Ejemplo 3.1). CVaR para estas distribuciones híbridas son, respectivamente, VaR95% = 0%, CVaR95% = 11% y VaR95% = 56.47%, CVaR95% = 62.31%. Ejemplo 3.2. Considerése la institución financiera del Ejemplo 3.1, pero ahora dicha institución desea considerar también en su medición de riesgo los rendimientos que obtendría en caso de que sus deudores no incumpliesen. Esto es, se desea tomar en cuenta tanto el riesgo de crédito como el riesgo de mercado. Los rendimientos en caso de que no se presenten incumplimientos, según estimaciones de la misma institución, se distribuyen como una distribución normal con media µ = 10% y desviación estándar σ = 3%. Con base en estas consideraciones, la institución financiera determina la distribución híbrida correspondiente1 la cual, junto con sus marginales, se exhibe en la Figura 3.4. A partir de dicha distribución híbrida de pérdidas, la institución estima un VaR95% = 2.59% y un CVaR95% = 54.96%. 1 Para tal efecto se utilizó simulación, en el apéndice B se describe dicho proceso de simulación. 49 Probabilidad de no Incumplimiento Probabilidad de Incumplimiento 95% 5% Fig. 3.4: Densidades Marginales y su correspondiente Densidad Híbrida. Finalmente, antes de terminar esta sección hacemos notar que una variable aleatoria X con distribución definida de acuerdo a (3.1) se puede expresar de la forma X = X A 1 A + XB 1 B c.s. (3.7) donde X A y XB son variables aleatorias tales que X A es independiente de 1 A y XB es independiente de IB . La equivalencia entre (3.1) y (3.7) se establece en las siguientes proposiciones. Proposición 3.1. Sea X una variable aleatoria definida por (3.7), y sea β tal que P[ A] = β. Entonces la FDA de X, denotada FH , está dada por FH ( x ) = βFA ( x ) + (1 − β) FB ( x ), donde FA es la FDA de X A y FB es la FDA de XB . Demostración. FH ( x ) = P[{ω ∈ Ω| X (ω ) ≤ x }] = P[{ω ∈ Ω|( X A 1 A + XB 1 B )(ω ) ≤ x }] = P[{ω ∈ A ∪ B| X A (ω )1 A (ω ) + XB (ω )1 B (ω ) ≤ x }] = P[{ω ∈ A|( X A 1 A + XB 1 B )(ω ) ≤ x }] + P[{ω ∈ B|( X A 1 A + XB 1 B )(ω ) ≤ x }] Ahora P[{ω ∈ A|( X A 1 A + XB 1 B )(ω ) ≤ x }] = P[{ω ∈ A| X A (ω ) ≤ x }] 50 (3.8) ya que 1 A (ω ) = 1 para toda ω ∈ A y 1 B (ω ) = 0 para toda ω ∈ A. Asimismo se tiene que P[{ω ∈ A| X A (ω ) ≤ x }] = P[{ A ∩ {ω ∈ Ω| X A (ω ) ≤ x }] = P[ A]P[{ω ∈ Ω| X A (ω ) ≤ x }] = βFA ( x ) donde la penúltima igualdad se sigue de la hipótesis de independencia entre X A e I A . Análogamente se puede demostrar que P[{ω ∈ B|( X A 1 A + XB 1 B )(ω ) ≤ x }] = (1 − β) FB ( x ). Por lo tanto, se concluye que FH ( x ) = βFA ( x ) + (1 − β) FB ( x ). A continuación se establece el recíproco de la proposición anterior. Proposición 3.2. Sea X una variable aleatoria cuya FDA, denotada por FH , está dada por FH ( x ) = βFA ( x ) + (1 − β) FB ( x ), donde β = P[ A]. Entonces X = X A 1 A + XB 1 B c.s. donde X A se distribuye de acuerdo a FA y es independiente de 1 A y XB se distribuye de acuerdo a FB y es independiente de 1 B . Demostración. Se sigue directamente de la Proposición 3.1 que X y X A 1 A + XB 1 B tienen la misma FDA, por lo cual, por la Proposición que 1.1 X = X A 1 A + XB 1 B c.s. 3.3 Formulación Matemática En términos matemáticos, la distribución híbrida se determina al resolver el problema de optimización H ( β) 2 H ( β) 2 Min (1 − δ) VaRαE − VaRα + δ CVaRαE − CVaRα β∈[0,1] (3.9) donde β ∈ [0, 1] es la probabilidad con la que las pérdidas se distribuyen H ( β) de acuerdo a la distribución en condiciones de estrés; y VaRα 51 H ( β) y CVaRα 1− β β Probabilidad de Estrés ( β) Se minimiza la distancia entre VaRH (CVaRH) y VaRE (CVaRE) Fig. 3.5: Ajuste de la distribución híbrida por medio del Modelo 3.9. denotan, respectivamente, el VaR y CVaR de la distribución híbrida asociada a la probabilidad β. El proceso de determinación de la distribución híbrida mediante la solución del problema (3.9) es esquematizado en la Figura 3.5. Obsérvese que, en esencia, el problema (3.9) es el mismo que el problema (2.1), formulado para obtener el factor de ajuste óptimo. La diferencia estriba en que en un caso, el del problema (2.1), se supone que la distribución de pérdidas es normal mientras que en el otro caso, el del problema (3.9), se considera que dicha distribución de pérdidas es una distribución híbrida proveniente de dos distribuciones predeterminadas. En contraste con (2.1), en el caso del problema (3.9) no existe una solución H ( β) explícita. La razón principal de ello radica en que, en general, el VaRα y el H ( β) CVaRα no pueden expresarse como funciones explícitas de la probabilidad β. Por lo tanto, el problema (3.9) debe ser típicamente resuelto de manera numérica y la derivación de propiedades teóricas generales sobre la probabilidad óptima β∗ es más difícil que en el caso del factor de ajuste óptimo F ∗ , tratado en el capítulo anterior. No obstante dicha dificultad se derivan algunas propiedades generales en la siguiente sección. 3.4 H ( β) Propiedades del VaRα H ( β) , CVaRα y β∗ En esta sección se estudian propiedades sobre el VaR y el CVaR determinados a partir de una distribución híbrida, así como de la probabilidad de estrés 52 óptima β∗ obtenida al resolver (3.9). A saber, las siguientes: • La relación del VaR de la distribución híbrida de pérdidas con los correspondientes valores de las distribuciones de pérdidas en condiciones de normales y condiciones de estrés. H ( β) • Condiciones suficientes para la continuidad y monotonicidad del VaRα y H ( β) CVaRα como función de la probabilidad de estrés β. • Condiciones suficientes para la existencia de una probabilidad de estrés óptima β∗ . Para establecer las propiedades anteriores, es conveniente denotar por N y CE a los eventos en que las pérdidas Π se comporten en condiciones normales y condiciones de estrés, respectivamente. De esta manera, la distribución híbrida considerada H ( β) para las pérdidas Π implica, por las Proposiciones 3.1 y 3.2 , que éstas se pueden expresar como Π = Π N 1 N + ΠCE 1CE c.s. donde Π N y ΠCE son las pérdidas en condiciones normales y en condiciones de estrés, respectivamente; 1 N y 1CE son variables indicadores de los eventos N y CE, respectivamente, y donde se cumple que P[CE] = β. Las funciones de distribución acumulada de Π N y ΠCE serán denotadas FN y FCE respectivamente. 3.4.1 Propiedades Básicas Proposición 3.3. Supóngase que Π N y ΠCE son variables aleatorias continuas y que VaRα (Π N ) ≤ VaRα (ΠCE ). Entonces, H ( β) VaRα (Π N ) ≤ VaRα ≤ VaRα (ΠCE ) para toda β ∈ [0, 1]. Demostración. H ( β) FH (VaRα )=α = βα + (1 − β)α = β FCE (VaRα (ΠCE )) + (1 − β) FN (VaRα (Π N )) ≤ β FCE (VaRα (ΠCE )) + (1 − β) FN (VaRα (ΠCE )) = FH (VaRα (ΠCE )). Por lo tanto, H ( β) FH (VaRα ) ≤ FH (VaRα (ΠCE )), 53 lo cual implica, por lo monotonía de FH , que H ( β) VaRα ≤ VaRα (ΠCE ). H ( β) De manera análoga se demuestra que VaRα (Π N ) ≤ VaRα . Corolario 3.1. Supóngase que Π N y ΠCE son variables aleatorias continuas, y que H ( β) −∞ < VaRα (Π N ) ≤ VaRα (ΠCE ) < ∞, entonces VaRα < ∞ para toda β ∈ [0, 1]. H ( β) ≤ VaRα (ΠCE ) para < ∞ y de manera similar se demuestra que Demostración. Por la Proposición 3.3 se tiene que VaRα toda β ∈ [0, 1] por lo que H ( β) −∞ < VaRα 3.4.2 . H ( β) VaRα H ( β) Monotonicidad y Continuidad del VaRα H ( β) y CVaRα H ( β) H ( β) Para demostrar la monotonicidad y continuidad del VaRα y CVaRα se hace uso del concepto de dominancia estocástica que a continuación se define. Definición 3.2. Sean X y Y dos variables aleatorias que representan las pérdidas de un portafolio, se dice que X domina estocásticamente2 a Y, lo cual se denota como X Y, si P [ X > u ] ≤ P [Y > u ] , para toda u ∈ R. (3.10) En palabras, la definición anterior indica que X domina a Y si y sólo si, dado un umbral u, la probabibilidad de que X sea mayor a u es menor o igual a la probabilidad que Y sea mayor a u. En particular, si X y Y denotan pérdidas financieras, la dominancia estocástica de X sobre Y significa que dado un umbral de pérdidas u, es más probable que las pérdidas de Y superen dicho umbral que las pérdidas de X. Es decir, en un contexto de pérdidas, la dominancia estocástica de X sobre Y captura la idea de que X "es menos riesgoso" que Y. Esta idea es formalizada en la Proposición 3.4. Antes de exponer los resultados de esta sección, se presenta el siguiente lema, que demuestra una caracterización alternativa del concepto de dominancia estocástica anteriormente definido, la cual es útil para demostrar los resultados que se presentan posteriormente. Lema 3.1. Sean X y Y dos variables aleatorias. Entonces X Y si y sólo si FX (u) ≥ FY (u), ∀ u ∈ R. 2 Dentro de la teoría estándar de dominancia estocástica, ésta dominancia es una del tipo de primer orden. De hecho, obsérvese que la desigualdad en la Definición 3.2 va en sentido inverso a la definición tradicional, ya que en este caso todo se encuentra en términos de pérdidas. 54 Demostración. Supóngase que X Y. Entonces, por definición se cumple P[ X > u] ≤ P[Y > u], ∀ u ∈ R, lo cual se cumple si y sólo si, 1 − P[ X ≤ u] ≤ 1 − P[Y ≤ u], ∀ u ∈ R, o equivalentemente si, FX (u) ≡ P[ X ≤ u] ≥ P[Y ≤ u] ≡ FY (u), ∀ u ∈ R. Proposición 3.4. Sean X y Y variables aleatorias tales que X Y. Entonces VaRα ( X ) ≤ VaRα (Y ) para toda α ∈ [0, 1]. Demostración. Por el Lema 3.1 si X Y, entonces FX (u) ≥ FY (u), ∀ u ∈ R. Sea α ∈ [0, 1], entonces FX (u) ≥ α ⇒ FY (u) ≥ α, ∀ α ∈ [0, 1], de donde {u ∈ R| FX (u) ≥ α} ⊂ {u ∈ R| FY (u) ≥ α}, ∀ α ∈ [0, 1], lo cual su vez implica que, inf{u ∈ R| FX (u) ≥ α} ≤ inf{u ∈ R| FY (u) ≥ α}, ∀ α ∈ [0, 1], o equivalentemente que, VaRα ( X ) ≤ VaRα (Y ), ∀ α ∈ [0, 1]. H ( β) VaRα ). Proposición 3.5 (Monotonicidad del Sean FCE y FN funciones estrictamente crecientes, y supóngase que Π N ΠCE . Entonces, para cualquier nivel H ( β) de confianza α ∈ [0, 1] predeterminado, se cumple que la función β 7→ VaRα H ( β) VaRα es no decreciente. Demostración. Obsérvese que basta demostrar que FH ( β) es decreciente en β para toda x ∈ R, dado que β 1 ≤ β 2 implica que FH ( β1 ) ( x ) ≥ FH ( β2 ) ( x ) para toda x ∈ R, lo que a su vez implica, por el Lema 3.1 y la Proposción 3.4, que H ( β1 ) VaRα H ( β2 ) ≤ VaRα ∀ α ∈ [0, 1]. Para demostrar que FH ( β) es decreciente 55 en β, nótese que Π N ΠCE implica, por el Lema 3.1, que FN ( x ) ≥ FCE ( x ), o equivalentemente, que FCE ( x ) − FN ( x ) ≤ 0. Por lo tanto, FH ( β) ( x ) = βFCE ( x ) + (1 − β) FN ( x ) = β( FCE ( x ) − FN ( x )) + FN ( x ). es una función (lineal) decreciente en β, para toda x ∈ R. H ( β) Proposición 3.6 (Monotonicidad del CVaRα ). Sean FCE y FN funciones estrictamente crecientes, y supóngase que Π N ΠCE , y −∞ < VaRα (Π N ) ≤ VaRα (ΠCE ) < ∞. Entonces, para cualquier nivel de confianza predeterminado α ∈ [0, 1] la función H ( β) β 7→ CVaRα es no decreciente. Demostración. Antes de demostrar la proposición, se hace la siguiente observación: Dado que Π N ΠCE , se sigue del Lema 3.1 que β 1 ≤ β 2 implica que FH ( β1 ) ≥ FH ( β2 ) , y por lo tanto α FH (β 1) = FH ( β1 ) − α 1−α ≥ FH ( β2 ) − α 1−α = FHα ( β2 ) (3.11) α (z) ≤ 1 − FHα ( β ) (z). y por ende se tiene que 1 − FH ( β1 ) 2 Para demostrar la proposición, nótese que el valor esperado de una variable aleatoria continua con soporte [ L, ∞) y FDA dada por F, puede ser representado como E[ X ] = L + Z ∞ L [1 − F (z)]dz. (3.12) Así tomando L = VaRα ( X ), CVaRα ( X ) puede ser expresado como CVaRα ( X ) = VaRα ( X ) + Z ∞ VaRα [1 − F α (z)]dz (3.13) donde F α (z) representa la α − cola de la distribución de pérdidas como definido H ( β1 ) en la Definición 1.13. Por ende, denotando u1 = VaRα 56 H ( β2 ) y u2 = VaRα se sigue que H ( β1 ) CVaRα = u1 + = u1 + Z ∞h u1 Z u2 i α 1 − FH ( β ) ( z ) dz (3.14) 1 h u1 Z i α 1 − FH ( z ) dz + (β ) 1 ∞ u2 h i α 1 − FH ( z ) dz (β ) 1 Z ∞h i α 1 − FH ( z ) dz ≤ u1 + ( u2 − u1 ) · 1 + ( β1 ) u2 Z ∞h i α 1 − FH = u2 + ( β 1 ) ( z ) dz u2 Z ∞h i α 1 − FH ( z ) dz ≤ u2 + ( β2 ) (3.16) (3.17) (3.18) u2 H ( β2 ) = CVaRα (3.15) . (3.19) α (z) ≤ Donde (3.14) se sigue de (3.13), (3.16) se sigue del hecho que 1 − FH ( β1 ) 1, (3.18) se sigue de (3.11) y (3.19) se sigue de (3.13). H ( β) Proposición 3.7 (Continuidad del VaRα ). Sean FN y FCE funciones estrictamente monótonas y continuas y supóngase Π N ΠCE y que −∞ < VaRα (Π N ) ≤ VaRα (ΠCE ) < ∞. H ( β) Entonces, la función β 7→ VaRα es continua, para toda α ∈ [0, 1]. Demostración. Sea β ∈ [0, 1] y β n : N → [0, 1] una sucesión que converge al valor β. Se probará que H(βn ) lim β n = β ⇒ lim VaRα n→∞ n→∞ H(βn ) Por el Corolario 3.1 la sucesión VaRα . esta acotada y por la Proposición 3.5 H(βn ) es no decreciente, por lo que limn→∞ VaRα probar que dicho límite es igual a H ( β) = VaRα H ( β) VaRα . existe. Por lo tanto basta con Para tal efecto, obsérvese que α = lim α (3.20) n→∞ H(β ) = lim FH ( β n ) VaRα n n→∞ h i H(β ) H(β ) = lim β n FCE VaRα n + (1 − β n ) FN VaRα n n→∞ H(β ) H(β ) = β lim FCE VaRα n + (1 − β) lim FN VaRα n n→∞ n→∞ H(βn ) H(β ) = βFCE lim VaRα + (1 − β) FN lim VaRα n (3.21) = βFCE ( x ) + (1 − β) FN ( x ∗ ). (3.25) n→∞ ∗ n→∞ 57 (3.22) (3.23) (3.24) H(βn ) donde x ∗ = limn→∞ VaRα se deduce que H ( β) . Sea y∗ = VaRα , entonces por (3.20) y (3.25), βFCE ( x ∗ ) + (1 − β) FN ( x ∗ ) = α = βFCE (y∗ ) + (1 − β) FN (y∗ ), (3.26) para toda β ∈ [0, 1]. En particular, para β = 1 y β = 0 se obtiene que FCE ( x ∗ ) = FCE (y∗ ) y FN ( x ∗ ) = FN (y∗ ) lo cual implica, por la monotonía estricta de FCE y FN , que x ∗ = y∗ , o lo que H(βn ) H ( β) = VaRα es lo mismo, que el limn→∞ VaRα H ( β) Para demostrar la continuidad del CVaRα sultado: . se requiere del siguiente re- Lema 3.2. Si g es una función integrable en R, entonces la función G (u) = Z ∞ u g(z)dz (3.27) es continua en u, para toda u ∈ R. Demostración. Si g es una función integrable en R, se sigue del Teorema 8 del Capítulo 13 de Spivak (1996) que la sucesión de funciones definidas por Gn (u) = Z n u g(z)dz son continuas en u ∈ R, para toda n ∈ N. Dado que G (u) = lim Gn (u) = n→∞ Z ∞ u g(z)dz (3.28) Se sigue que ( Z ) Z n ∞ lim sup{| G (u) − Gn (u)|} = lim sup g(z)dz − g(z)dz n → ∞ u ∈R n → ∞ u ∈R u u Z ∞ g(z)dz = lim sup n→∞ n u ∈R =0 (3.29) (3.30) (3.31) Por lo tanto, Gn (u) converge uniformemente a G (u). Como Gn (u) es continua para toda u ∈ R y para toda n ∈ N, se sigue que la función G (u) es continua para toda u ∈ R. H ( β) Proposición 3.8 (Continuidad del CVaRα ). Sean FCE y FN funciones estrictamente monótonas y continuas; y supóngase que Π N ΠCE y que −∞ < VaRα (Π N ) ≤ VaRα (ΠCE ) < ∞. H ( β) Entonces, la función β 7→ CVaRα es continua para toda α ∈ [0, 1]. 58 H ( β) Demostración. De la definición de CVaRα H ( β) CVaRα se sigue que Z ∞ 1 z [ β f CE (z) + (1 − β) f N (z)]dz (3.32) 1 − α VaRαH (β) Z ∞ Z ∞ β 1−β = z f ( z ) dz + z f N (z)dz (3.33) CE H ( β) H ( β) 1−α 1−α VaRα VaRα = Por el Lema 3.2 se deduce que GCE (u) ≡ Z ∞ u z f CE (z)dz y GN (u) ≡ Z ∞ u z f N (z)dz (3.34) H ( β) son continuas en u, para toda u ∈ R. Por lo tanto, dado que VaRα es una función continua con respecto a β, se concluye que la composición H ( β) GN (VaRα H ( β) ) y GCE (VaRα ) son continuas con respecto a β, de donde se H ( β) concluye de (3.33) que el CVaRα es una función continua con respecto a β. 3.4.3 Existencia y algunas propiedades de β∗ En la siguiente Proposición se establece la existencia de una solución para el problema de optimización (3.9). Es decir, se establece la existencia de una probabilidad óptima de estrés óptima β∗ . Proposición 3.9. Sean FN y FCE funciones estrictamente monótonas y continuas, y supóngase Π N ΠCE y que −∞ < VaRα (Π N ) ≤ VaRα (ΠCE ) < ∞. Entonces el problema de optimización (3.9) tiene solución. Demostración. Dado que la función objetivo del problema de optimización (3.9) se puede expresar como H ( β) 2 H ( β) 2 G ( β) ≡ (1 − δ) VaRαE − VaRα + δ CVaRαE − CVaRα H ( β) H ( β) y que las funciones VaRα y CVaRα son continuas en β, por las Proposiciones 3.7 y 3.8, se desprende entonces que G ( β) es una función continua, al ser una composición de funciones continuas. Por lo tanto, dado que la función objetivo G ( β) se minimiza sobre el intervalo [0, 1] el cual es un cojunto compacto, se concluye que G ( β) alcanza un mínimo en [0, 1] y por ende que (3.9) tiene solución. A continuación se establecen dos resultados con respecto a la solución óptima de (3.9) para dos casos particulares. A saber, para el caso δ = 0, es decir cuando sólo es de interés ajustar el VaR, y el caso en que el VaR y CVaR observado coinciden con aquellos derivados en condiciones normales. 59 Proposición 3.10. Supóngase VaRα (ΠCE ) ≥ VaRα (Π N ) y δ = 0. Entonces la solución óptima de (3.9) es β̃ = 0 Demostración. Por la Proposición 3.3 se cumple que H ( β) VaRα (Π N ) ≤ VaRα ≤ VaRα (ΠCE ) para toda β ∈ [0, 1]. Si β = 0 se tiene que FH ( x ) = 0 · FCE ( x ) + 1 · FN ( x ) = FN ( x ) H ( β) por lo que VaRα = VaRα (Π N ), luego entonces β̃ = 0 es un óptimo para (3.9). Proposición 3.11. Supóngase VaRαE ( X ) = VaRα (Π N ) y CVaRαE ( X ) = CVaRα (Π N ). Entonces β∗ = 0 es una solución óptima para el problema de optimización (3.9). Demostración. Obsérvese que 2 2 G (0) = (1 − δ) VaRαE − VaR(Π N ) + δ CVaRαE − CVaR(Π N ) =0 (3.35) (3.36) donde la última igualdad es consecuencia de la hipótesis. Por lo tanto, dado que G ( β) ≥ 0 para toda β ∈ [0, 1], se concluye que β∗ = 0 es un mínimo. Una vez formulada formalmente la determinación de la distribución híbrida en términos de la probabilidad de crisis β y de haber establecido algunas propiedades de esta última, se aborda en la siguiente sección la resolución numérica del problema de optimización (3.9). 3.5 Determinación de la probabilidad óptima β∗ La resolución numérica del problema (3.9) requiere la determinación de H ( β) 2 H ( β) 2 G ( β) = (1 − δ) VaRαE − VaRα + δ CVaRαE − CVaRα (3.37) para cada β ∈ [0, 1]. Para ello, es necesario obtener la distribución híbrida H ( β) H ( β) y a partir de ésta obtener VaRα H ( β) y CVaRα H ( β) VaRα . Dado que no siempre es H ( β) posible encontrar fórmulas explicitas para y CVaRα , se deben estimar sus valores. Para tal efecto, se propone utilizar simulación. Esto debido a que es fácil de instrumentar y de adaptar para cualquier par de distribuciones que se consideren para conformar la distribución híbrida. A saber, se genera una muestra de la distribución híbrida, de tamaño m, a partir de la cual se 60 H ( β) H ( β) estiman VaRα y CVaRα . De esta manera, la función objetivo (3.37) es aproximada por la función 2 H ( β) 2 d αH ( β) + δ CVaRαE −CVaR \α Ĝ ( β) = (1 − δ) VaRαE −VaR (3.38) H ( β) H ( β) H ( β) H ( β) dα \α donde VaR y CVaR son estimadores de VaRα y CVaRα obtenidos a partir de la muestra generada. Con base en dicha aproximación, se resuelve (3.9), obteniéndose una probabilidad óptima aproximada c β∗i . Claramente, la precisión de dicho valor depende tanto del tamaño de la muestra como de la muestra particular generada. Por lo tanto, es natural generar varias muestras, obtener una probabilidad óptima aproximada para cada una de ellas y utilizar el promedio de estos valores como un valor aproximado de la probabilidad de estrés óptima. Por lo tanto, se propone utilizar el siguiente algoritmo genérico: I. Se generan n muestras de tamaño m de la distribución híbrida3 . II. A partir de cada muestra i generada, i = 1 . . . n, se determina Ĝ ( β) y se resuelve (3.9), obteniéndose el valor óptimo c β∗i . III. Se estima la probabilidad óptima β∗ como 1 c β∗ = n n β∗i ∑c (3.39) i =1 Para la determinación de estos valores se hacen las siguientes consideraciones: • El error en la estimación se mide por medio del error relativo, definido como c β∗ − β∗ ∗ (3.40) eR ( β ) ≡ β∗ donde β∗ es la probabilidad de estrés óptima que resuelve el problema de optimización (3.9). • Si las n muestras son independientes, entonces, dado que por construcción son idénticamente distribuidas, el teorema del límite central implica c β∗ − E[ c β∗ ] √ i → N (0, 1) σβc∗ / n (3.41) i donde σβc∗ denota la desviación estándar común pero desconocida de i cada c β∗i ; y N (0, 1) representa una distribución normal estándar. 3 Esta muestra se genera utilizando un vector de valores aleatorios con distribución uniforme, un vector de valores aleatorios con distribución idéntica a la de condiciones normales y un vector de valores aleatorios con distribución idéntica a la de condiciones de estrés. La construcción de la distribución híbrida a partir de estos vectores se especifica en el Apéndice B, Sección B.2. 61 • Reemplazando la desviación estándar poblacional σβc∗ en (3.41) por la i desviación estándar muestral Sn,βc∗ i 1 = n−1 s n ∑ i =1 c β∗i − c β∗ 2 (3.42) se tiene que c β∗ − E[ c β∗ ] √ i → t n −1 Sn,βc∗ / n (3.43) i donde tn−1 es una distribución t de Student con n − 1 grados de libertad. Por tanto, se deduce c∗ β − E[ c β∗i ] √ ≤ tn−1,1−θ/2 = 1 − θ. P (3.44) Sn,βc∗i / n donde θ ∈ [0, 1] es el nivel de significancia en la estimación del error e R ( β ∗ ). • Obsérvese que ∆(n, θ ) ≡ tn−1,1−θ/2 Sn,βc∗ √ i n ! (3.45) satisface lim ∆(n, θ ) = 0 n→∞ (3.46) Por lo tanto, es posible escoger una n suficientemente grande, de forma tal que ∆(n, θ ) ≤ γ| c β∗ | (3.47) para un valor 0 < γ < 1 predeterminado. Luego entonces de (3.44) y (3.47) se sigue que h i ∗ (3.48) β∗i ] ≤ ∆(n, θ ) 1 − θ = P c β − E[ c i h ∗ ∗ ≤ P c β − E[ c β∗i ] ≤ γ c β (3.49) i h ∗ ∗ = P c β − E[ c β∗i ] ≤ γ c β − E[ c β∗i ] + E[ c β∗i ] (3.50) i h ∗ ∗ ≤ P c β − E[ c β∗i ] ≤ γ c β − E[ c β∗i ] + E[ c β∗i ] (3.51) h i ∗ = P (1 − γ ) c β − E[ c β∗i ] ≤ γ| c β∗ | (3.52) # " |c β∗ − E[ c β∗i ]| γ ≤ (3.53) =P | β∗ | 1−γ 62 Si E[ c β∗i ] = β∗ , entonces c β∗ es un estimador insesgado4 de β∗ y se deduce por (3.53), que: " # |c β∗ − β∗ | γ P ≤ ≥ 1 − θ. | β∗ | 1−γ (3.54) A partir de las consideraciones anteriores, se utiliza el siguiente algoritmo para estimar la probabilidad óptima β∗ del modelo (3.9), dado un error relativo γ0 y un nivel de confianza 1 − θ. 1. Generar un número incial predeterminado n0 de muestras, de tamaño m, a partir de las cuales se obtienen las estimaciones c β∗i , para i = 1 . . . n0 , de acuerdo a lo descrito en el inciso II; n := n0 . 2. Calcular c β∗ , de acuerdo a (3.39), y ∆(n, θ ), de acuerdo a (3.45), a partir de los valores c β∗i para i = 1 . . . n. 3. Si ∆(n,θ ) c∗ | |β ≤ γ0 1+ γ 0 entonces terminar: β∗ es aproximado por el estimador c β∗ y I (γ0 , θ ) = [ c β∗ (n) − ∆(n, θ ), c β∗ (n) + ∆(n, θ )] (3.55) es un intervalo de confianza de 100(1 − θ )% para β∗ . En caso contrario, generar otra muestra de tamaño m, n := n + 1 e ir al paso 2. 3.5.1 Determinación de la Distribución Híbrida Para construir la distribución híbrida se deben determinar las distribuciones que se usarán para las condiciones normales y las condiciones de estrés. Para tal efecto, es natural considerar distribuciones conocidas y estimar sus parámetros con base en datos observados, si es posible, o una opinión experta. En el problema particular que nos atañe, se consideró una distribución Gaussiana para el caso de condiciones normales, y una distribución Gaussiana o t no central para el caso de condiciones de estrés. Los parámetros de dichas distribuciones se determinaron de la siguiente manera: Para cada rango de concentración c considerado5 , 1. Se filtraron los datos de acuerdo al rango de concentración (c) 6 . 4 En el Apéndice C se discute brevemente el problema del sesgo potencial en la estimación de β∗ . rango de concentración es un intervalo de la forma [c0 , ∞). ejemplo los datos filtrados de acuerdo al rango de concentración [50%, ∞), representan los datos de rendimientos diarios (en términos de pérdidas) cuya concentración diaria fue mayor a 50%. 5 Un 6 Por 63 2. Para los datos filtrados se obtuvo una banda superior de las pérdidas, para el nivel de confianza predeterminado α, especificada por µ̂c + N−1 (α)σ̂c (3.56) donde: • µ̂c es la media estimada (promedio aritmético) de las pérdidas que satisfacen la restricción de concentración dada por c y • σ̂c es la desviación estándar estimada de las pérdidas que satisfacen la restricción de concentración dada por c. 3. La distribución en el caso de condiciones normales es N (µ̂c , σ̂c ). 4. Los parámetros en condiciones de estrés se determinaron a partir de los datos (pérdidas) que rebasan la banda superior. Esta construcción tiene las siguientes ventajas: • Si la distribución empírica de las pérdidas es Gaussiana, ésta coincidará con la distribución en casos normales, por lo cual no habrá que hacer ajuste alguno y la probabilidad de estrés β∗ sera igual a 0. • Esta construcción hace que el ajuste dado por la probabilidad de β∗ sea comparable al ajuste dado por F ∗ en el siguiente sentido: un valor de β∗ = 0 corresponde al caso en que no se ajusta ni el VaR ni el CVaR, que es equivalente al caso en que F ∗ = 1, y un valor de β∗ > 0 corresponde al caso en que es necesario ajustar el VaR y el CVaR, como sería el caso en que F ∗ > 1. 3.6 Caso Gaussiano-Gaussiano El primer caso particular que se considera es aquél en que tanto la distribución en condiciones normales como la de estrés son distribuciones Gaussianas. En este caso, la densidad de la distribución híbrida esta dada por f H ( β) ( x ) = √ β 2πσCE e − 21 x −µCE σCE 2 + 1−β √ 2πσN e − 12 x −µ N σN 2 (3.57) donde β es la probabilidad de ocurrencia del evento de éstres; µCE y σCE son la media y desviación estándar respectivas de la distribución de los rendimientos en caso de éstres; y donde µ N y σN son la media y desviación estándar de los rendimientos bajo condiciones normales. Es importante enfatizar que el supuesto de normalidad para ambas distribuciones no restringe mucho la forma de la distribución híbrida. En particular, ésta puede ser una distribución bimodal o leptocúrtica. Por ejemplo, 64 si β = 0.6, µCE = −1, σCE = 1, µ N = 2 y σN = 1 se tiene una distribución bimodal (ver Figura 3.6a). Asimismo, si β = 0.5, µCE = 0, σCE = 1, µ N = 0 y σN = 9, se tiene una distribución leptocúrtica (ver Figura 3.6b). Densidad Híbrida combinación de dos normales 0.25 0.2 0.2 0.15 0.15 Densidad Densidad Densidad Híbrida combinación de dos normales 0.25 0.1 0.05 0 −4 0.1 0.05 −3 −2 −1 0 1 2 3 0 −4 4 −3 −2 −1 x 0 1 2 3 4 x (a) Densidad Bimodal (b) Densidad Leptocúrtica Fig. 3.6: Densidades híbridas combinación de dos normales. 3.6.1 Solución utilizando simulación Se resolvió el problema de optimización (3.9) bajo el supuesto de que las pérdidas se distribuyen de acuerdo a la densidad (3.57), utilizando los rendimientos diarios de los precios limpios para el bono M Diciembre 2007, tomando distintos niveles de concentración y de aversión al riesgo. Para tal efecto, se utilizó el algoritmo de simulación descrito en la Sección 3.5, considerando los siguientes parámetros: error relativo γ = 1%, n0 = 10, m = 10, 000. El primer parámetro fue determinado con base en un nivel de precisión deseado, mientras que el segundo fue definido de manera arbitraria. Por su parte, para determinar el valor de m se hicieron las siguientes consideraciones: • Se determinó la distribución empírica de c β∗i para distintos valores de m y δ. A saber para los casos m =2’000, 5’000, 10’000 y 20’000; y δ=0, 0.5 y 1. Por ejemplo, en la Figura 3.7 se ilustran las densidades para el caso particular de δ = 0.5 y α = 0.95 7 . • En las distribuciones estimadas en el inciso anterior, se determinó el mínimo valor de m, tal que la desviación estándar de la distribución fuese menor o igual al 10% del valor de la media de la misma, para todas las δ’s consideradas. Dicho valor es m = 10, 000. 7 Las distribuciones empíricas fueron obtenidas resolviendo el problema de optimizacion (3.9) n=10,000 veces. Se puede notar que la dispersión de la distribución de las c β∗i disminuye y que valor de su media respectiva se reduce conforme aumenta el valor de m. Este efecto se debe, H ( β) presumiblemente, al sesgo en la estimación de VaRα 65 H ( β) y CVaRα . Distribución Empírica de β , para distintos valores de m. i δ = 0.5, α = 95% m=5000 m=10000 m=2000 m=20000 200 180 160 Densidad 140 120 100 80 60 40 20 0 0.01 0.015 0.02 0.025 0.03 0.035 0.04 Beta Fig. 3.7: Distribución Empírica de c β∗i para distintos valores de m. En la Figura 3.8 se muestran las probabilidades óptimas β∗ obtenidas para distintas combinaciones de aversión al riesgo (δ) y rangos de concentración, considerando un nivel de confianza α del 95%. A partir de los resultados obtenidos se hacen las siguientes observaciones: • Las probabilidades de estrés varían entre valores muy cercanos al 0%, asociados con δ = 0, y valores ligeramente menores al 4%, asociados con δ = 100%. • El valor de β∗ se incrementa conforme aumenta el parámetro de aversión al riesgo δ. Es decir, entre mayor sea la ponderación que se le da al CVaR, mayor es la probabilidad de estrés requerida para ajustar el riesgo. • En general, no hay un efecto claramente discernible de la concentración sobre el valor de la probabilidad de estrés óptima β∗ . Sin embargo, se observa que a mayor nivel de concentración, mayor es en promedio la probabilidad β∗ . Finalmente, a fin de ilustrar el requerimento computacional del algoritmo, se presenta en la Figura 3.9 el número de muestras generadas para la obtención de β∗ . En particular, se observa claramente que el número de simulaciones requiridas cuando δ = 0 es considerablemente mayor al resto de los casos. Esto se debe a que la probabilidad de estrés es muy cercana a 0 y por lo tanto, el error relativo en la estimación tiende a ser relativamente grande. 3.6.2 Solución mediante integración numérica En la Sección 3.5 se señala que, en general, es difícil obtener una expresión H ( β) explícita del VaRα H ( β) y CVaRα , y por lo tanto, de la función objetivo del 66 Valor de β* para distintos niveles de concentración Nivel de Confianza del 95% Probabilidad de Éstres β 0.04 0.03 0.02 0.01 0 0.9 0.8 1 0.7 0.6 0.5 Rango de Concentración 0.8 0.4 0.6 0.2 0 Valor de δ Fig. 3.8: Gráfica de β∗ para distintos niveles de concentración mínima. Número de muestras generadas Nivel de Confianza del 95% 5 No de muestras generadas x 10 2 1.5 1 0.5 0 0.9 0.8 0.7 0.6 Rango de Concentración 0.5 0 0.2 0.4 0.6 0.8 1 Valor de δ Fig. 3.9: Número de muestras generadas para obtener c β∗ . 67 problema (3.9). Sin embargo, para el caso particular que se estudia en esta sección se pueden obtener fórmulas implícitas, a partir de las cuales es posible obtener una estimación mediante métodos númericos. Dichas fórmulas implícitas se formulan y demuestran en las siguientes proposiciones. H ( β) Proposición 3.12. El VaRα es solución de la ecuación u − µN u − µCE =α + (1 − β ) N βN σCE σN (3.58) para u ∈ R. H ( β) Demostración. Por definición, si u = VaRα , debe satisfacer " 2 2 # Z u x −µ x −µ 1−β β − 12 σ CE − 21 σ N N CE √ + √ dx = α e e −∞ 2πσCE 2πσN (3.59) o, de forma equivalente β Z u − 12 e √ −∞ x −µCE σCE 2 dx + (1 − β) 2πσCE Z u − 12 e −∞ √ 2 x −µ N σN 2πσN dx = α (3.60) simplificando la primera integral de la ecuación (3.60) se obtiene Z u − 12 e −∞ √ x −µCE σCE 2 dx = 2πσCE u−µCE σCE Z −∞ 1 2 e− 2 x √ dx = N 2π u − µCE σCE (3.61) Análogamente para la segunda integral de la ecuación (3.60) se obtiene Z ∞ − 12 e √ u x −µ N σN 2 2πσN dx = N u − µN σN (3.62) y, sustituyendo (3.61) y (3.62) en (3.60), se obtiene la ecuación (3.58). H ( β) La Proposición 3.12 permite encontrar el VaRα para una distribución híbrida, combinación de dos normales, con función de densidad dada por (3.57), resolviendo la ecuación (3.58) para u. Aunque la ecuación (3.58) no tiene una H ( β) solución explícita para el VaRα , puede ser resuelta por métodos numéricos. H ( β) VaRα , H ( β) Una vez obtenido es posible calcular de forma explícita el CVaRα como se establece en la siguiente Proposición. H ( β) Proposición 3.13. El CVaRα está dado por " 1 µCE − u µN − u H ( β) βN µCE + (1 − β)N µN CVaRα = 1−α σCE σN + βσCE e − 12 u−µCE σCE 68 2 + (1 − β)σN e √ 2π − 21 u−µ N σN 2 # (3.63) H ( β) donde u = VaRα . H ( β) H ( β) Demostración. Tomando u = VaRα , el CVaRα estará dado por la expresión " 2 2 # Z ∞ x −µ x −µ β 1−β 1 − 21 σ N − 21 σ CE N CE √ + √ xe xe dx (3.64) 1−α u 2πσCE 2πσN Nótese que la integral de la expresión anterior puede ser escrita como β Z ∞ − 12 xe √ u x −µCE σCE 2 dx + (1 − β) 2πσCE Z ∞ − 21 xe √ u x −µ N σN 2 dx 2πσN (3.65) Usando el cambio de variable m(u) = (u − µCE )/σCE en la primera integral de la expresión anterior, se obtiene que Z ∞ − 12 xe √ u x −µCE σCE 2πσCE 2 dx = 1 2 Z ∞ m(u) = σCE (σCE m + µCE )e− 2 x √ σCE dm 2πσCE 1 Z ∞ m(u) Z ∞ m(u) 1 2 e− 2 m √ dm 2π (3.67) 2 1 = 2 me− 2 m √ dm + µCE 2π (3.66) σCE e− 2 m(u) √ + µCE N(−m(u)) 2π (3.68) Por lo tanto, Z ∞ − 12 xe √ u x −µCE σCE 2 2πσCE dx = σCE e − 12 √ u−µCE σCE 2 + µCE N 2π µCE − u σCE (3.69) Analogamente para la segunda integral de la expresión (3.65) se obtiene Z ∞ − 12 xe √ u x −µ N σN 2πσN 2 dx = σN e − 12 √ u−µ N σN 2π 2 + µN N µN − u σN (3.70) Finalmente, sustituyendo (3.69) y (3.70) en (3.65) y multiplicando por se obtiene (3.63). 1 1− α Con base en las dos proposiciones anteriores se obtuvo la probabilidad de estrés óptima β∗ , para mismos niveles de aversión al riesgo y rangos de concentración considerados en la Subsección 3.6.1. Los resultados se muestran en la Figura 3.10. Como se puede observar, los resultados son muy parecidos a aquéllos obtenidos aplicando el algoritmo de simulación. De hecho, para verificar esto de manera más precisa, se calcularon las diferencias entre las superficie de β∗ determinada por simulación β∗sim y aquélla calculada mediante integración numérica β∗num . Dicha superficie "diferencia" se muestra en la Figura 3.11 y a partir de ésta se observa lo siguiente: 69 Valor de β* para distintos niveles de concentración Nivel de Confianza del 95% Probabilidad de Éstres β 0.04 0.03 0.02 0.01 0 0.9 0.8 1 0.7 0.6 0.6 0.5 Rango de Concentración 0.8 0.4 0.2 0 Valor de δ Fig. 3.10: Gráfica de β∗ con respecto a δ, para distintos niveles de concentación mínima y α = 95%. • Las diferencias son mínimas, ya que su valor máximo es igual a 0.002. • Las diferencias, en general, son positivas, lo cual indica que la probabilidad de estrés se encuentra consistentemente sobreestimada aplicando el método de simulación. • Las mayores diferencias se encuentran para el caso en que δ = 0. Esto se debe a que la probabilidad de estrés es más cercana a 0, y por ende más difícil de estimar mediante la simulación, debido a que el error relativo en la estimación de β∗ es relativamente grande. Diferencias de β* simulada vs β* por integración numérica, para distintos niveles de concentración. Nivel de Confianza del 95% −3 Diferencias en el cálculo de β* x 10 3 2 1 0 −1 0.9 0.8 0.7 0.6 Rango de Concentración 0.5 0 0.2 0.4 0.6 0.8 1 Valor de δ Fig. 3.11: Gráfica de las diferencias de β∗sim − β∗num , para distintos valores de δ y rangos de concentación, con α = 95%. 70 3.7 Caso Gaussiano-t El segundo caso particular que se considera es aquél en que la distribución en condiciones normales es una Gaussiana y la distribución en condiciones de estrés es una t no central8 . De esta manera, la densidad de la distribución híbrida en este caso está dada por 2 x −µ −( 1+2 ν ) − 12 σ N 2 N ( x − µCE ) e √ f H ( x ) = βCν 1 + + (1 − β ) (3.71) , φCE ν σN 2π donde Cν es una constante de normalización de la distribución t no central definida como 1 Γ ν+ 2 √ . (3.72) Cν = Γ ν2 πφCE ν µCE es la media de la distibución t no central y φCE es un parámetro de dispersión que se relaciona con la desviación estándar σCE de la siguiente manera: r p ν σCE = φCE , (3.73) ν−2 donde ν es un parámetro relacionado con los grados de libertad de la distribución y el cual se supondrá en lo sucesivo mayor a 2 a fin de que de que la ecuación (3.73) tenga sentido. De igual forma que en el caso Gaussiano-Gaussiano, µCE y σCE representan la media y la desviación estándar respectivamente de los rendimientos en condiciones de estrés, mientras que µ N y σN representan la media y desviación estándar de los rendimientos en condiciones normales. Asimismo, β representa la probabilidad de estrés. El caso Gaussiano-t tiene la ventaja de presentar mayor flexibilidad en la modelación de los rendimientos en condiciones de estrés, dado que, por una parte, la distribución t permite modelar las colas pesadas y alta curtosis que regularmente se presentan en las series financieras, y por otra parte la distribución Gaussiana puede ser considerada un caso particular de la t, ya que, por el teorema del límite central, la distribución t converge a una normal cuando el parámetro ν tiende a infinito. 3.7.1 Solución utilizando simulación Para poder resolver el problema (3.9) en este caso es necesario determinar los parámetros de la distribución t-no central para las condiciones de estrés. Para tal efecto, se procedió de la siguiente manera: 8 Ver Capítulo de Preliminares, sección 1.6 71 1. Se obtuvieron los grados de libertad ν de la distribución, a partir de la curtosis en exceso estimada de los datos Kν , mediante la relación9 ν = K6ν + 4. 2. Se estimó la desviación estándar de la distribución en condiciones de estrés a partir de los datos. Usando dicha estimación, se el obtuvo 2 2 . parámetro de dispersión mediante la relación10 φCE = ν− σ CE ν Con base en las consideraciones anteriores, se resolvió el problema de optimización (3.9) bajo el supuesto (3.71) utilizando los rendimientos diarios del precio limpio para el bono M Diciembre 2007; y tomando en cuenta distintos niveles de concentración y de aversión al riesgo. Para tal efecto, y al igual que en el caso Gaussiano, se utilizó el algoritmo de simulación descrito en la Sección 3.5, considerando los parámetros de error relativo γ = 1%, n0 = 10 y m = 10, 000. Estos parámetros fueron obtenidos de manera análoga a lo descrito en la Subsección 3.6.1. Los resultados obtenidos se ilustran en la Figura 3.12, a partir de la cual se hacen las siguientes observaciones: • Las probabilidades de estrés obtenidas son muy similares a las del caso Gaussiano-Gaussiano11 . • Al igual que en el caso Gaussiano-Gaussiano el valor de β∗ se incrementa conforme aumenta el parámetro de aversión al riesgo. • Conforme aumenta la concentración la probabilidad de estrés β∗ aumenta (en promedio). Asimismo, al igual que se hizo en el caso Gaussiano-Gaussiano, se presenta en la Figura 3.13 el número de muestras generadas para obtener la probabilidad de estrés óptima β∗ en el caso Gaussiano-t. Esto con el fin de visualizar el esfuerzo computacional del algoritmo de simulación. De la misma manera que en el caso Gaussiano-Gaussiano, el esfuerzo computacional para δ = 0 es mayor que en el resto de los casos, debido a que la probabilidad de estrés en dicho caso es muy cercana a cero. 3.7.2 Solución mediante integración numérica Al igual que en el caso Gaussiano-Gaussiano, en el caso Gaussiano-t también H ( β) H ( β) se pueden obtener condiciones que el VaRα y CVaRα deben satisfacer y a partir de las cuales ser obtenidos. Dichas condiciones se describen y demuestran en las siguientes Proposiciones. 6 curtosis en exceso de la distribución t no central está dada por Kν = ν− 4 . Despejando el parámetro ν en términos de Kν se obtiene la relación descrita. 10 Se obtiene despejando el parámetro φ CE de la ecuación (3.73). 11 Esto se analizará con un poco más de profundidad en la Subsección 3.7.3. 9 La 72 Valor de β* para distintos niveles de concentración Nivel de Confianza del 95% Probabilidad de Éstres β 0.04 0.03 0.02 0.01 0 0.9 0.8 1 0.7 0.6 0.5 Rango de Concentración 0.8 0.4 0.6 0.2 0 Valor de δ Fig. 3.12: β∗ por Simulación. Caso Gaussiano-t. Número de muestras generadas Nivel de Confianza del 95% 5 No de muestras generadas x 10 2 1.5 1 0.5 0 0.9 0.8 0.7 0.6 Rango de Concentración 0.5 0 0.2 0.4 0.6 0.8 1 Valor de δ Fig. 3.13: Número de muestras generadas para obtener c β∗ . Caso Gaussiano-t. 73 H ( β) Proposición 3.14. El VaRα es solución de la ecuación u − µCE u − µN √ =α βTν + (1 − β ) N φCE σN (3.74) para u ∈ R. H ( β) Demostración. Por definición, si u = VaRα , debe satisfacer 1+ ν 2 Z u 2 −( 2 ) 1 x −µ N ( x − µ ) 1 − β − CE dx = α (3.75) βCν 1 + + √ e 2 σN φCE ν −∞ 2πσN o, de forma equivalente Z u β −∞ Cν 1 + ( x − µCE φCE ν −( )2 1+ ν 2 ) dx + (1 − β) Z u − 12 e −∞ √ x −µ N σN 2 2πσN dx = α (3.76) Para simplificar la primera integral de la ecuación anterior, se puede hacer el √ u−µ cambio de variable m(u) = √φ CE , y notando que φCE Cν es la constante de CE normalización para una distribución t de Student, se tiene que Z u −∞ Cν ( x − µCE )2 1+ φCE ν −( 1+2 ν ) dx = Z m(u) p −∞ φCE Cν = Tν (m(u)) u − µCE √ = Tν φCE m2 1+ ν −( 1+2 v ) dm (3.77) La segunda integral de la ecuación (3.76) es idéntica la ecuación (3.62) de la demostración de la Proposición 3.12. H ( β) Proposición 3.15. El CVaRα H ( β) CVaRα = √ φCE ν m ( u )2 1+ f t (m(u)) + µCE Tν (−m(u)) ν−1 ν 2 u−µ − 21 σ N N 1 − β σB e µN − u √ + + µN N (3.78) 1−α σN 2π β 1−α H ( β) donde u = VaRα está dado por y m(u) = (u√ −µCE ) . φCE H ( β) Demostración. Dado u = VaRα H ( β) , el CVaRα 74 está dado por la expresión 1 1−α Z ∞ u 2 βCν x 1 + ( x − µCE ) φCE ν −( 1+2 ν ) + 1−β √ 2πσN xe − 12 x −µ N σN 2 dx La integral de la expresión anterior puede ser escrita como Z ∞ β u Cν x 1 + ( x − µCE φCE ν −( )2 1+ ν 2 ) dx + (1 − β) Haciendo el cambio de variable m(u) = expresión anterior, se obtiene: Z ∞ u ( x − µCE )2 Cν x 1 + φCE ν u−µCE √ φCE Z ∞ − 12 xe √ u x −µ N σN 2 2πσN dx (3.79) en la primera integral de la −( 1+2 ν ) dx = Z ∞ m(u) C( p m2 φCE m + µCE ) 1 + ν −( 1+2 ν ) dm (3.80) √ donde C = Cν φCE es la constante de normalización de una distribución t de Student. La ecuación (3.80) a su vez es igual a p −( 1+2 ν ) −( 1+2 v ) Z ∞ m2 m2 Cm 1 + dm + µCE C 1+ dm ν ν m(u) m(u) (3.81) Z ∞ φCE La primera integral de la expresión (3.81) puede ser simplificada usando el cambio de variable y(m) = m2 /ν, obteniéndose: Z ∞ m2 Cm 1 + ν m(u) −( 1+2 ν ) Z ∞ ν 1+ ν C (1 + y ) − ( 2 ) dy 2 m(u)2 /ν ∞ 1+ ν C (1 + y)−( 2 )+1 = − 1+2 ν + 1 m(u)2 dm = ν ∞ ν −( 1+2 ν ) = (1 + y ) C (1 + y ) m ( u )2 1−ν ν ν m ( u )2 =− 1+ f t (m(u)), (3.82) 1−ν ν por otra parte, Z ∞ m2 C 1+ ν m(u) −( 1+2 v ) dm = 1 − Tν (m(u)) = Tν (−m(u)). 75 (3.83) Sustituyendo (3.82) y (3.83) en (3.81), se tiene que √ φCE ν ν−1 m ( u )2 1+ ν f t (m(u)) + µCE Tν (−m(u)) (3.84) es igual a la primera integral en la ecuación (3.79), mientras que la segunda integral de la ecuación (3.79) puede ser obtenida de directamente de la ecuación (3.70). Con base en las dos proposiciones anteriores se obtuvo la probabilidad de estrés óptima β∗ , para los mismos niveles de aversión al riesgo y rangos de concentración considerados en la Subsección 3.7.1. Los resultados se muestran en la Figura 3.14. Valor de β* para distintos niveles de concentración Nivel de Confianza del 95% Probabilidad de Éstres β 0.04 0.03 0.02 0.01 0 0.9 0.8 1 0.7 0.6 Rango de Concentración 0.8 0.4 0.6 0.5 0.2 0 Valor de δ Fig. 3.14: Gráfica de β∗ con respecto a δ, para distintos niveles de concentación mínima y α = 95%. Como era de esperarse, los resultados son muy parecidos a los obtenidos aplicando el algoritmo de simulación. Para verificar esto, se calcularon la diferencias entre las superficies de β∗ calculada mediante simulación β∗sim y aquélla obtenida por integración numérica β∗num . Dicha superficie "diferencia" se muestra en la Figura 3.15. Como se puede observar a partir de la Figura 3.15, las diferencias en general son positivas, indicando que el método de simulación tiende a subestimar la probabilidad de estrés óptima. También puede observarse que al igual que en el caso Gaussiano-Gaussiano las mayores diferencias se dan cuando β∗ es aproximadamente cero. 76 Diferencias de β* simulada vs β* por integración numérica, para distintos niveles de concentración. Nivel de Confianza del 95% −3 Diferencias en el cálculo de β* x 10 3 2 1 0 −1 0.9 0.8 0.7 0.6 0.5 Rango de Concentración 0 0.2 0.4 0.6 0.8 1 Valor de δ Fig. 3.15: Gráfica de las diferencias de β∗sim − β∗num , para distintos valores de δ y rangos de concentación, con α = 95%. Caso Gaussiano-t. 3.7.3 Comparación entre el modelo Gaussiano-Gaussiano y el Gaussiano-t Finalmente, para terminar esta sección, se comparan los resultados obtenidos con los dos tipos de distribución híbrida considerados. Para ello, se calculó la diferencia entre la superficie de probabilidades de estrés del modelo Gaussiano-Gaussiano, denotada β∗N , y la superficie correspondiente del modelo Gaussiano-t, denotada β∗T . Ambas superficies fueron calculadas mediante integración numérica. Dicha superficie diferencia se muestra en la Figura 3.16. Diferencias β*N − β*T para distintos niveles de concentración Nivel de Confianza del 95% Diferencias en el cálculo de β*N−β*T −4 x 10 10 5 0 −5 0.9 0.8 0.7 0.6 Rango de Concentración 0.5 0 0.2 0.4 0.6 0.8 1 Valor de δ Fig. 3.16: Diferencia entre β∗N y β∗T . Como puede apreciarse a partir de la Figura 3.16, la probabilidad de es- 77 trés obtenida mediante una distribución híbrida del tipo Gaussiano-Gaussiano prácticamente no difiere respecto a la obtenida mediante una distribución híbrida del tipo Gaussiano-t, ya que las diferencias más grandes son del orden de 10−4 . También puede observarse a partir de la Figura 3.16, que las diferencias son en general positivas, o equivalentemente, que la probabilidad de estrés en el caso Gaussiano-Gaussiano es mayor a la probabilidad de estrés en el caso Gaussiano-t. Esto se debe a que la distribución t no central modela mejor las colas pesadas de la distribución empírica y por ende se requiere de una ponderación menor de la distribución en condiciones de estrés para obtener un buen ajuste. 3.8 Comparación de β∗ con el factor de ajuste F ∗ Tanto en este capítulo como en el anterior, el objetivo central ha sido el mismo: desarrollar una metodología para medir el riesgo de mercado -en términos del VaR y CVaR- de manera más precisa bajo condiciones de distorsión de los precios. Para ello, en ambos casos se ha partido del mismo supuesto estándar consistente en que los rendimientos se comportan de acuerdo a una distribución Gaussiana. La diferencia entre ambas metodologías estriba en la forma en que se parte, o se adecua dicho supuesto. En un caso se optó por ajustar el parámetro de desviación estándar mediante un cierto factor de ajuste F ∗ . En el otro caso se decidió construir una distribución, que fuera por un lado consistente con la distribución Gaussiana bajo condiciones normales y, por el otro, que considerará la probabilidad de condiciones de estrés, medida en términos de una probabilidad β∗ , en que las pérdidas se distribuyen de acuerdo a otra distribución no necesariamente Gaussiana y no necesariamente con los mismos parámetros. Dado que tanto el factor de ajuste F ∗ como la probabilidad de estrés β∗ son determinadas esencialmente por el mismo tipo de criterio, se puede afirmar que son equivalentes y por lo tanto, es de interés estudiar esta equivalencia. Para tal efecto, se decidió usar el nivel de aversión al riesgo δ como variable de "triangulación" o de "vinculación", suponiendo un nivel de concentración c y un nivel de confianza α fijos. Es decir, dados c y α se conocen F ∗ (δ) y β∗ (δ) para cada δ ∈ [0, 1], de donde F ∗ se asocia a β∗ si y sólo si F ∗ y β∗ corresponden a la misma δ. De esta manera, para el caso concreto del Bono M Diciembre 2007, se construyeron las gráficas de las Figuras 3.17 y 3.18, que corresponden, respectivamente, a los casos GaussianoGaussiano y Gaussiano-t. Como se observa claramente en dichas gráficas, la probabilidad de estrés β∗ se incrementa conforme el factor de ajuste F ∗ así lo hace también. Este comportamiento es consecuencia del comportamiento monotónico de F ∗ y β∗ con respecto a δ anteriormente observado. Desde un punto de vista práctico, la relación derivada entre F ∗ y β∗ es útil 78 Relación entre F* y β* 0.04 0.035 Valor de β* 0.03 0.025 50% 60% 70% 80% 0.02 0.015 0.01 0.005 0 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 Valor de F* Fig. 3.17: Relación entre F ∗ y β∗ para distintos rangos de concentración y α = 95%. Caso Gaussiano-Gaussiano. Relación entre F* y β* 0.04 0.035 Valor de β* 0.03 0.025 50% 60% 70% 80% 0.02 0.015 0.01 0.005 0 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 Valor de F* Fig. 3.18: Relación entre F ∗ y β∗ para distintos rangos de concentración y α = 95%. Caso Gaussiano-t. 79 ya que, por ejemplo, permite al administrador de riesgos determinar el factor de ajuste a aplicar a la desviación estándar estimada dada una evaluación, posiblemente subjetiva, de la probabilidad de estrés o crisis implícita asociada a dicho factor. 80 3.9 Conclusiones La motivación central de este capítulo fue desarrollar una metodología para medir el riesgo de mercado en condiciones de distorsión de los precios la cual, a diferencia de lo que se hizo en el Capítulo 2, incorpora la posibilidad de un evento de estrés en el que la distribución de probabilidad de las pérdidas es distinta a la distribución Gaussiana típicamente considerada en condiciones normales. De esta forma, se desarrolló una metodología para la construcción de una distribución de probabilidad "híbrida", que considera simultáneamente el comportamiento de los rendimientos tanto en condiciones normales como en condiciones de estrés, a partir de la cual se mide el riesgo de mercado en términos del VaR y CVaR. Para determinar dicha distribución híbrida, se requiere predeterminar un par de distribuciones, una que caracteriza los rendimientos en condiciones normales y otra que lo hace en condiciones de estrés, las cuales se combinan probabilísticamente, en términos de una probabilidad de estrés, de tal forma que las mediciones de riesgo obtenidas con base en dicha distribución híbrida se ajusten "lo mejor posible" a las correspondientes medidas de riesgo observadas. Específicamente, bajo el criterio de que la desviación cuadrática de los valores estimados y observados sea mínima. Por lo tanto, la determinación de la distribución híbrida se formula matemáticamente como la solución de un problema de optimización, muy similar al planteado en el capítulo anterior para determinar el factor de ajuste. Dicha formulación presenta las siguientes ventajas: • La formulación permite asignar el peso relativo que tiene la desviación cuadrática relacionada con el CVaR respecto a aquélla vinculada con el VaR. El valor de dicho peso relativo, denominado δ, se puede asociar, al menos intuitivamente, a un cierto nivel de aversión al riesgo en el sentido de que entre mayor sea el valor de este ponderador, mayor es la importancia se le da al valor estimado del CVaR, la medida de riesgo más conservadora de las dos consideradas en el presente análisis. • El problema de optimización tiene solución para cualquier par de distribuciones que conforman la distribución híbrida, bajo el supuesto de que dichas distribuciones satisfagan una cierta condición de dominancia estocástica. Dicho supuesto es típicamente satisfecho en la práctica. Por otro lado, dado que desafortunadamente el problema de optimización no tiene una solución explícita, se propuso y desarrolló una metodología, basada en simulación, para resolver el problema de manera numérica. Esta metodología presenta las siguientes ventajas: – No se necesitan conocer fórmulas explícitas (o implícitas) para el cálculo del VaR y CVaR de la distribución híbrida considerada. 81 – El método se puede aplicar fácilmente para cualquier tipo de distribuciones en condiciones normales y en condiciones de estrés consideradas. – Es posible, en principio, acotar arbitrariamente el error en la estimación de la probabilidad de estrés con un cierto nivel de confianza predeterminado. La metodología desarrollada se aplicó en el contexto particular del Bono M Diciembre 2007 para dos casos concretos: uno en el que se supone que tanto la distribución en condiciones normales como la de estrés son Gaussianas, y otra en el que la distribución en condiciones normales es Gaussiana, pero t no central en condiciones de estrés. Los resultados obtenidos en cada caso son los siguientes: • Gaussiano-Gaussiano: – El rango de probabilidades es [0.00344%, 3.78408%], para α=95%. – Para cualquier nivel de concentración la probabilidad de estrés se incrementa conforme el parámetro de aversión al riesgo δ se incrementa. – No hay un efecto claramente discernible de la concentración sobre la probabilidad de estrés, sin embargo, hay una ligera tendencia de está a incrementarse conforme aumenta la concentración. • Gaussiano-t: – El rango de probabilidades es [0.00346%, 3.81709%], para α=95%. – Para cualquier nivel de concentración la probabilidad de estrés se incrementa conforme el parámetro de aversión al riesgo δ se incrementa. – No hay un efecto claramente discernible de la concentración sobre la probabilidad de estrés, sin embargo, hay una ligera tendencia de está a incrementarse conforme aumenta la concentración. La metodología desarrollada en este capítulo se puede adaptar fácilmente para • Incoporar distintos tipos de distribuciones híbridas de riesgo. • Considerar otro tipo de medidas de riesgo, diferentes al VaR y CVaR. • Utilizar otras variables de referencia. 82 Conclusiones Generales El objetivo primario de este trabajo de tesis fue proponer una metodología para medir el riesgo de mercado en condiciones propicias para la distorsión de los precios. Así, se determinaron dos metodologías para tal efecto. Ambas desarrolladas bajo la premisa de adecuar la metodología estándar, que supone que la distribución de pérdidas se distribuye de acuerdo a una variable aleatoria normal, y considerando como medidas de riesgo el VaR y el CVaR. Una de estas metodologías determina un Factor de Ajuste que escala el parámetro de desviación estándar, mientras que la otra construye una Distribución Híbrida que considera simultáneamente una distribución Gausssiana, para modelar las pérdidas en condiciones normales, y otra distribución, no necesariamente Gaussiana, para modelar las pérdidas en condiciones de estrés. En ambos casos, se busca estimar el riesgo de la manera "más precisa posible". Es decir, se determinan el Factor de Ajuste y la Distribución Híbrida tales que el riesgo estimado a partir de ellos sea lo más parecido posible al riesgo observado. Aunque las metodologías aquí desarrolladas fueron en principio desarrolladas para medir el riesgo de mercado en condiciones propicias para la distorsión de los precios, éstas pueden aplicarse para adecuar la metodología estándar por cualquier característica o conjunto de características de la distribución de pérdidas que se aleje de los supuestos de dicha metodología. Por lo tanto, su aplicabilidad es potencialmente bastante amplia. Tanto la metodología de Factores de Ajuste como la de Distribuciones Híbridas son formuladas en términos de modelos matemáticos, similares en espíritu, a partir de los cuales se demuestran varias propiedades teóricas interesantes y los cuales pueden incorporar fácilmente restricciones adicionales, a fin de adaptarlas a contextos más específicos, así como considerar medidas de riesgo adicionales o distintas al VaR o CVaR. Entre las propiedades teóricas demostradas en este trabajo que, en nuestro juicio, sobresale del resto es aquélla relacionada con el comportamiento monótono creciente del Factor de Ajuste respecto al parámetro de aversión al riesgo δ . Dicha propiedad, además de ser intuitivamente correcta, se cumple esencialmente bajo la condición de que la distancia relativa entre el VaR y el CVaR de la distribución de pérdidas sea "suficientemente grande". A saber, mayor o igual que la correspondiente distancia en el caso que la distribu83 ción de pérdidas sea una Gaussiana. Esta condición es interesante ya que induce una partición de las distribuciones de pérdidas: aquéllas que cumplen la condición, las cuáles denominamos riesgosas, y aquéllas otras que no la cumplen, llamadas no riesgosas. Creemos que sería de interés ahondar en las consecuencias de dicha condición. 84 Apéndice A Convexidad y Condiciones de Optimalidad Definición A.1 (Conjunto Convexo). Un subconjunto C de Rn es convexo si y sólo si (1 − λ) x + λy ∈ C ∀ x, y ∈ C y λ ∈ (0, 1). Definición A.2 (Función Convexa). Sea C un conjunto convexo en Rn , entonces f : C → R es una función convexa si y sólo si f ((1 − λ) x + λy) ≤ (1 − λ) f ( x ) + λ f (y) ∀ x, y ∈ C y λ ∈ (0, 1). Definición A.3 (Función Cóncava). Sea C un conjunto convexo en Rn . Una función f : C → R con C convexo, es cóncava si y sólo − f es convexa. Proposición A.1. Sea f : ( a, b) → R una función dos veces diferenciable y cuya segunda derivada es continua. Entonces f es convexa (cóncava) en ( a, b) si y sólo si su segunda derivada f 00 es no negativa (no positiva) en ( a, b). Demostración. Ver, por ejemplo, Teorema 4.4 de Rockafellar (1970). Definición A.4 (Condiciones de Optimalidad de Primer Orden). Sea f : D ⊂ Rn → R. Entonces, se dice que x ∗ ∈ D satisface las condiciones de optimalidad de primer orden si y sólo si ∇ f ( x ∗ ) = 0. Teorema A.1. Sea C un conjunto convexo abierto en Rn y f : C → R una función convexa y diferenciable en C. Entonces x ∗ ∈ C es un mínimo global si y sólo si x ∗ satisface las condiciones de optimalidad de primer orden. 85 Demostración. Es consecuencia directa de la Proposición 2.6 de Zangwill (1969). 86 Apéndice B Simulación B.1 Método Monte Carlo El método Monte Carlo consiste, en su forma más sencilla, en formular algún juego de azar o proceso estocástico cuyo valor esperado sea la solución al problema planteado (Bauer, 1958). Sin embargo, puede ser utilizado para obtener prácticamente cualquier estadística de una distribución por medio de un muestreo repetido aún si no se conoce su forma parámetrica. Para ilustrar el método considerése el siguiente ejemplo. Ejemplo B.1 (Simulación de π). Supóngase que se desea estimar el valor π con un cierto nivel de precisión. Para ello se formula el siguiente problema probabilístico: se escogen puntos al azar uniformemente distribuidos sobre un cuadrado cuyo lado tiene longitud uno, y se cuentan el número de puntos que se encuentran dentro del cuarto de circunferencia inscrita en el cuadrado, como se muestra en la Figura B.1. Así la probabilidad de que un punto se encuentre dentro del área delimitada será exactamente π/4. Más formalmente, sean X y Y variables aleatorias con distribución uniforme en el intervalo [0, 1], y Sn una variable aleatoria que cuente el número de ocasiones, en n intentos, en los que X 2 + Y 2 ≤ 1. nπ π Entonces Sn ∼ Binomial( nπ 4 , 4 (1 − 4 )) y E [ Sn /n ] = π/4. Para ver que tan buena es la aproximación obtenida por medio de la simulación, se calculará la probabilidad de que el error relativo sea menor o igual a una cierta constante 87 1 Puntos fuera de la circunferencia 0.9 0.8 0.7 Y 0.6 0.5 Puntos dentro de la circunferencia 0.4 0.3 0.2 0.1 0 0 0.2 0.4 0.6 0.8 1 X Fig. B.1: Simulación de π. e > 0. Así: Sn /n − π/4 Sn − n(π/4) P ≤ e = P n(π/4) ≤ e π/4 s " # Sn − n(π/4) n(π/4) = P p ≤e n(π/4)(1 − π/4) (1 − π/4) s s ! ! n(π/4) n(π/4) ≈N e − N −e (1 − π/4) (1 − π/4) s ! n(π/4) − 1. = 2N e (1 − π/4) A partir de esto es posible definir la función s ! n(π/4) − 1, Ψ(e, n) = 2N e (1 − π/4) (B.1) que indica la probabilidad de tener un error relativo menor o igual a e en n simulaciones1 . Resolviendo la ecuación Ψ(e, n) = 0.95 para distintos valores de e, se puede determinar el número de simulaciones necesarias para alcanzar la precisión requerida en la estimación, con un nivel de confianza del 95%. Los resultados se muestran en la Tabla B.1. Como puede observarse a partir de dicha tabla, el número de simulaciones necesarias crece rápidamente respecto a la reducción en el error de la aproximación, siendo necesario aumentar el número de simulaciones por un factor de 100 para reducir el error en un factor de 10. 1 Observesé que se ha utilizado el teorema del límite central para aproximar el verdadero valor. 88 Tab. B.1: Simulación de π B.2 Error Relativo Número de Simulaciones 10−1 10−2 10−3 10−4 10−5 10−6 1.04964 × 102 1.04964 × 104 1.04964 × 106 1.04964 × 108 1.04964 × 1010 1.04964 × 1012 Simulación de Distribuciones Híbridas Sea X una v.a. cuya función de distribución es FH ( x ) = βFA ( x ) + (1 − β) FB ( x ), (B.2) donde FA y FB son funciones de distribución y β ∈ [0, 1]. Este tipo de distribuciones se denominan distribuciones híbridas y se definen formalmente en la Sección 3.2. Para generar una v.a. con dicha distribución se puede usar el siguiente algoritmo: 1. Se genera un valor aleatorio de una distribución uniforme [0,1], digamos U. 2. Si U < β entonces se genera un valor aleatorio a partir de la distribución FA . En caso contrario, se genera un valor aleatorio a partir de la distribución FB . El procedimiento anterior se repite un número predeterminado de veces, digamos n, a fin de obtener una muestra de tamaño n de la v.a. X. 89 Apéndice C El caso del sesgo en la estimación de β∗ Koji & Maasaki (2005) analizan el problema del sesgo porcentual en los estimadores tradicionales del VaR y CVaR. El sesgo porcentual del VaR es definido por: λvm = Media del VaR − VaR∗ VaR∗ (C.1) donde VaR∗ denota el valor teórico del VaR. Asimismo el sesgo porcentual del CVaR es definido por: λcv m = Media del CVaR − CVaR∗ CVaR∗ (C.2) donde CVaR∗ denota el CVaR teórico. El procedimiento utilizado por Koji & Maasaki (2005) consiste en obtener por simulación N muestras aleatorias indepedientes, de tamaño m cada una, y a partir de cada muestra, estimar el VaR y CVaR promedios, los cuales se comparan contra su valor teórico para obtener el sesgo porcentual como definido por (C.1) y (C.2). Koji & Maasaki (2005) analizan el caso particular de la distribución t con 3, 4 y 5 grados de libertad, tomando N = 1000 y m = 100, 200 y 300 y concluyen que para m = 300, λvm varía entre -2.97% y -4.18% mientras que λcv m varía entre -0.79% y 1.1%. H ( β) dα Ya que la estimación de c β∗i depende de los estimadores VaR H ( β) H ( β) \α y CVaR H ( β) del VaRα y CVaRα , respectivamente, es de esperarse que exista un sesgo en su estimación. Luego entonces se tendrá que ∗ β E[ c β ∗ ] = (1 + λ m ) β ∗ 90 (C.3) β∗ donde λm denota el sesgo porcentual en la estimación de β∗ y esta definido como: β∗ λm = E[ c β∗ ] − β∗ β∗ (C.4) Asimismo Koji & Maasaki (2005) muestran evidencia de que el sesgo en la estimación del VaR y CVaR se reducen conforme se incrementa el tamaño de la muestra, o en otras palabras, que los estimadores son asintóticamente β∗ insesgados, por lo que es plausible suponer que λm sea asintóticamente insesgado. Por lo tanto, es de esperarse que para un valor de m "suficientemente grande", el sesgo en la estimación de β∗ sea "pequeño". 91 Bibliografía Acerbi, C., Nordio, C., & Sirtori, C. (2001). Expected Shortfall as a Tool for Financial Risk Management. ArXiv Condensed Matter e-prints. Andreev, A. & Kanto, A. (2005). Conditional Value-at-Risk estimation using non-integer values of degrees of freedom in Students t-distribution. The Journal of Risk, 7(2). Artzner, P., Delbaen, F., Eber, J. M., & Heath, D. (1999). Coherent measures of risk. Mathematical Finance, 9(3), 203–228. Bauer, W. F. (1958). The Monte Carlo Method. Journal of the Society for Industrial and Applied Mathematics, 6(4). Casella, G. & Berger, R. L. (1990). Statistical Inference. Duxbury Press. Embrechts, P., Klüppelberg, C., & Mikosch, T. (1997). Modelling Extremal Events for Insurance and Finance. Berlin: Springer. Koji, I. & Maasaki, K. (2005). On the significance of expected shortfall as a coherent risk measure. Journal of Banking and Finance. McNeil, A. J. (1999). Internal Modelling and CAD II, chapter Extreme Value Theory for risk managers, (pp. 93–113). RISK Books. Nelson, C. R. & Siegel, A. F. (1987). Parismonious modeling of yield curves. The Journal of Business, 60(4). Rockafellar, T. R. (1970). Convex Analysis. Princeton University Press. Rockafellar, T. R. & Uryasev, S. P. (2002). Conditional Value-at-Risk for General Loss Distributions. Journal of Banking and Finance. Sarma, M. (2005). Characterization of the tail behavior of financial returns: studies from India. Working Paper, EURANDOM. Spivak, M. (1996). CALCULUS, Second Edition. W.A. Benjamin, Inc., New York. 92 Svensson, L. (1994). Estimating and Interpreting Forward Interest Rates: Sweden. Working Paper No. 4871, NBER. National Bureau of Economic Research. Zangwill, W. (1969). Nonlinear Programming: A Unified Approach. Prentice-Hall. 93