Valores Extremos Multivariados mediante R-vines Leonardo Moreno II Jornadas LPE-MAREN La Paloma, Rocha, 2014 Esquema: Eventos extremos El Problema Una idea de Cópulas Regular Vines Estimación y Predicciones Eventos extremos climáticos. Inundaciones rı́o amarillo 1931 China Eventos extremos climáticos. Inundaciones en León México Eventos extremos climáticos. Deslaves 1999 Venezuela Eventos extremos climáticos. Temporal 2005 Uruguay Eventos extremos climáticos. Temporal 2005 Uruguay Eventos extremos ¿Es posible predecir determinados eventos extremos? Poca información.... Figura : Estimación de la cola de la distribución Una Aplicación: LLuvias Extremas en Guanajuato Una Aplicación: LLuvias Extremas en Guanajuato volver Estaciones seleccionadas ● 11040 ● 11020 ● 11095 ● 11051 ● 11071 ● 11033 ● 11036 ● 11028 ● 11003 ● 11052 ● ● 11009 11005 ● 11013 ● 11001 ● 11006 ● 11079 ● 11072 ● 11021 ● 11031 ● 11002 • Se decide trabajar con 20 estaciones que presentan datos simultáneamente en 37 años. Cópulas: Teorema de Sklar Para cópulas bidimensionales Sea H la función de distribución conjunta de una v.a vectorial (X , Y ) con F y G las distribuciones marginales (supongamos continuas). Entonces existe y es única la cópula C tal que 2 ∀(x, y) ∈ R cumple que, H(x, y ) = C(F (x), G(y)). (1) Propiedades • Sean M(u, v ) ≡ min(u, v ) y W (u, v ) ≡ max(u + v − 1, 0). Entonces para toda cópula C se cumple que, W (u, v ) ≤ C(u, v ) ≤ M(u, v ). W y M son llamadas las cotas inferior y superior de Fréchet-Hoeffding para Cópulas • Sean X e Y v.a absolutamente continuas. X e Y son independientes si y sólo si CXY (u, v ) = Π(u, v ) ≡ u.v . (2) Densidad de la Función de Cópula Se llama densidad asociada a la cópula C(u1 , u2 ) a, c(u1 , u2 ) = ∂ 2 C(u1 , u2 ) . ∂u1 ∂u2 (3) En v.a absolutamente continuas se cumple que, f (x1 , x2 ) = c(F1 (x1 ), F2 (x2 ))f1 (x1 )f2 (x2 ), (4) Cópulas paramétricas Algunas Familias Cópulas paramétricas Algunas Familias Cópulas paramétricas Denisdad Cópula FGM Simulación de 200 valores Algunas Familias 1.00 ● ● ● ● ● ● ● ● ● ● ● ● ● C(u,v) ● ● ● ● ● y ● ● ● ● ●● ● y ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● 0.25 ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.50 ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● x ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Morgenstern ● ● ● ● ● ● ● ● ● 0.75 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● • Farlie-Gumbel- ● ● ● ● ● ● ● ● 0.00 0.00 0.25 0.50 x θ = 0,7 0.75 1.00 Cópulas paramétricas Densidad Cópula Normal Simulación de 200 valores Algunas Familias 1.00 ● ● ● ● ● ● ● ● ● ● ● ● ● ● C(u,v) ● ● ● ● ● ● ● ● ● ● ● y ● ● ● ● ● 0.00 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.25 0.50 x θ = 0,25 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●● ● ● ● ● ● 0.00 ● ● ● ● ● ● ● ● ● 0.25 ● ● ● ● ● ● x ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● 0.50 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● y ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● 0.75 Morgenstern • Gaussiana ● ● ● ● ● • Farlie-Gumbel- ● ● ● ● 0.75 1.00 Cópulas paramétricas Densidad Cópula Student Simulación de 200 valores Algunas Familias 1.00 ● ● ● ● ● ● ● ● ● C(u,v) ● ● ● ● ● y y ● ● ●● ● ● ● 0.00 ● ●● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● 0.25 ● ● ● ● x ● ●● ● ● ● ● ● ● ●● ● ● ● ●●● ● ● ●● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● 0.50 ● ● ● ●● ● ● ● Morgenstern • Gaussiana • Student ●● ● ● ● ● ● ● ● ●● ● ● ● 0.75 ● ● ● ● ● ● ● ● ● ● ● ● • Farlie-Gumbel- ● ● ● ● ● ● ● ● ● 0.00 0.25 0.50 x ρ = 0,7 y 4 g.l 0.75 1.00 Cópulas paramétricas Densidad Cópula Clayton Simulación de 200 valores Algunas Familias 1.00 ● ● ● ● ● ● ● ● ● ● ● ● ● 0.75 ● C(u,v) ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● y ● ● 0.50 ● ● ● ● y ● ● ● ● ● ●● ● ● ● • Clayton ●● 0.00 ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● 0.25 0.50 x θ = 1,5 ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● 0.00 ● ●● ● ● ● ● ● ● ● ● ● ● ● ● 0.25 ● ● ● ● ● ● ● ● x ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Morgenstern ● ●●● ● ● ● ● ● ● ● ●● ● • Gaussiana • Student ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● • Farlie-Gumbel- ● ● ● ● ● ● 0.75 1.00 Cópulas Extremas Algunas Familias Cópulas Extremas Algunas Familias Cópulas Extremas Denisdad Cópula Gumbel Simulación de 200 valores 1.00 ●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● • Gumbel-Hougaard ● ● ● ● ● ● ● ● ● y ● ● ● ● ● ● y ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.50 ● ● ● ● 0.25 x α = 2/3 ● ● ● ● ● 0.00 ● ● ● ● 0.00 ● ● ● ● ● ●● ● ●●● ●● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● 0.25 ● ● ● ●● ● ● ● x ● ● ● ● ● ● ● ● ● ● ● 0.50 ● ● ● ● ●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● 0.75 ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● C(u,v) Algunas Familias ● 0.75 1.00 Cópulas Extremas Denisdad Cópula Galambos Simulación de 200 valores 1.00 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ●● ● y ● ● ● ● ● ● x ● ● ● ● ● ● ● 0.00 ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● 0.25 0.50 x α = 2/3 ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.00 ● ● ● ● ● ●● ● 0.25 ● ● ● ● ● ● ● ● ● ● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● y ● ● ● ● ● 0.50 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● • Gumbel-Hougaard • Galambos ● ● ● ● ● ● ● 0.75 ● ● ● ● ●● ● ● ● ● C(u,v) Algunas Familias 0.75 1.00 Cópulas Extremas Densidad Cópula Husler−Reiss Simulación de 200 valores 1.00 ●● ● ● ● ● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● y ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.00 0.00 ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.25 0.50 x a = 3/2 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● • Hüsler-Reiss ● ● ● ● ● ● ● ● ● ● 0.25 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.50 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● y ● ● ● ● ● ● ● ● x ● ● ● ● ● ● ● ● • Gumbel-Hougaard • Galambos ● ●● ● ● ● ● ● ● ● ● 0.75 C(u,v) Algunas Familias 0.75 1.00 Cópulas Extremas Densidad Cópula t−extremal Simulación de 200 valores 1.00 ● ● ● ● ● ● ● ● ● ● ● ● y ● ● ●● ● ● ●● ● 0.50 ● y ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.25 0.50 x ρ = 2/3 y 4 g.l ● ● ● ● ● 0.00 ● ● ● ● ● ● ● ● ● ● ● ● ● 0.00 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.25 ● ● ● ● ●● ● ● ● ● ● ● ● ● ● x ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● 0.75 • Gumbel-Hougaard • Galambos • Hüsler-Reiss • t-Extremal ● ● ● ● ● ●●●● ● ● ● ● ● C(u,v) Algunas Familias 0.75 1.00 Estructura de R-vines f1,2,3,4,5 = f1 f2 f3 f4 f5 c12 c13 c34 c15 c23/1 c14/3 c35/1 c24/13 c45/13 c25/134 , 13 15 12 1 5 2 13 3 34 2 4 23/1 24/13 14/3 45/13 El número posible de R-vines en Rd es /1 34 12 35/1 35 14/3 1 3/ 24/13 d! 22 25/134 15 45/13 (d−2)(d−3) 2 . Ejemplo. C-vines f1,2,3,4,5 = f1 f2 f3 f4 f5 c12 c13 c14 c15 c23/1 c24/1 c25/1 c34/12 c35/12 c45/123 A1 A2 1 13 4 5 13 14 A4 23/1 34/12 25/1 45/123 12 24/1 35/ 34 / 12 A3 35/12 /1 3 25 14 2 23 /1 24/1 12 12 15 15 Ejemplos: D-vines f1,2,3,4,5 = f1 f2 f3 f4 f5 c12 c23 c34 c45 c13/2 c24/3 c35/4 c14/23 c25/34 c15/234 , A1 1 12 2 23 3 34 4 45 5 A2 12 13/2 23 A3 13/2 14/23 24/3 24/3 34 A4 25/34 35/4 14/23 15/234 25/34 35/4 45 Selección del Modelo La selección de la cópula R-vines consta de 3 pasos. 1. Seleccionar la estructura R-vines entre todas la posibles. 2. Elegir las d(d − 1)/2 familias paramétricas de cópulas de a pares. 3. Estimar los parámetros de las cópulas seleccionadas. Selección de la estructura R-vines • Procedimiento secuencial introducido por Diı́mann, Brechmann, Czado y Kurowicka (2013), [5]. • Se elige una medida de dependencia δi,j que le asigne pesos a las aristas. • Bajo un algoritmo (usamos Prim) adecuado se selecciona un árbol, el primero del conjunto, que maximice, X arsitas e={i,j} |δi,j | Relaciones de dependencia (δi,j ). Correlación Relaciones de dependencia. Correlación Otras medidas de Dependencia • Rango Correlación de Kendall, (“Kendall’s tau”). ρτ (X , Y ) = P[(X1 − X2 )(Y1 − Y2 ) > 0] − P[(X1 − X2 )(Y1 − Y2 ) < 0], donde (X1 , Y1 ) y (X2 , Y2 ) pares de v.a iid con distribución F . • Coeficiente Dependencia en las Colas. λu = lı́m P(Y > F2−1 (u)|X > F1−1 (u)), u→1− • El F -madograma (para un campo aleatorio). ν F (h) = 1 E F Z (x + h) − F Z (x) , 2 • Distancia covarianza (Szekely 2007) y MIC (Reshef 2011). (5) Selección de Familias. • Luego de elegida la estructura se seleccionan las familias de cópulas bidimensionales y se estiman los parámetros de cada cópula por máxima verosimilitud. • El método de simplificación, que consiste en considerar cópulas de una sola familia, y truncamiento, suponer que a partir de cierto nivel las cópulas son independientes, fueron introducidos por Brechmann, Czado y Aas en el 2012, [1]. • Por último se calculan las distribuciones condicionales empı́ricas de forma recursiva pues. A partir de ellas se reitera el algoritmo. Primer árbol de la R-vine (lluvioso) ver mapa Algunas Predicciones Junio − Agosto perı́odo (años) Mediana Media Desvı́o P ∗(supere 100 mm) P ∗(supere 150 mm) 10 20 30 40 50 105.2 116.0 123.4 127.2 133.0 110.6 122.5 129.1 133.5 139.2 23.4 25.3 25.4 27.4 28.7 0.625 0.87 0.948 0.98 0.994 0.063 0.121 0.161 0.194 0.268 GRACIAS!! Referencias (1) E.Brechmann; C. Czado; K. Aas. Truncated regular vines in high dimensions with application to financial data. Canadian Journal of Statistics, 40(1):68–85, 2012. K. Aas; C. Czado; A. Frigessi; H. Bakken. Pair-copula constructions of multiple dependence. Insurance, Mathematics and Economics, 44:182–198, 2009. J.F. Dissmann. Statistical inference for regular vines and application. Master’s thesis, Technische Universit at Munchen., 2010. D. Kurowicka and R. Cooke. Uncertainty analysis with high dimensional dependence modelling. Wiley, 2006. J. Diı́Mann; E. C. Brechmann; C. Czado; D. Kurowicka. Selecting and estimating regular vine copulae and application to financial returns. Computational Statistics & Data Analysis, 59:52–69, 2013. O. Morales-Nápoles. Bayesian belief nets and vines in aviation safety and other applications. PhD thesis, Technische Universiteit Delft, 2008. Referencias (2) R. Nelsen. An introduction to copulas. Springer-Verlag, 2006. A. Sklar. Fonctions de reṕartition a n dimensions et leurs marges. Publ. Inst. Stat. Univ. Paris, 8:229–231, 1959. R.M Cooke T. Bedford. Probability density decomposition for conditionally dependent random variables modeled by vines. Annals of Mathematics and Artificial Intelligence, 32:245–268, 2001. H.Joe; J.J. Xu. The estimation method of inference functions for margins for multivariate models. Technical report, Department of Statistics, University of British Columbia, 1996.