Valores Extremos Multivariados mediante R-vines

Anuncio
Valores Extremos Multivariados mediante R-vines
Leonardo Moreno
II Jornadas LPE-MAREN
La Paloma, Rocha, 2014
Esquema:
Eventos extremos
El Problema
Una idea de Cópulas
Regular Vines
Estimación y Predicciones
Eventos extremos climáticos.
Inundaciones rı́o amarillo 1931
China
Eventos extremos climáticos.
Inundaciones en León
México
Eventos extremos climáticos.
Deslaves 1999
Venezuela
Eventos extremos climáticos.
Temporal 2005
Uruguay
Eventos extremos climáticos.
Temporal 2005
Uruguay
Eventos extremos
¿Es posible predecir determinados
eventos extremos?
Poca información....
Figura : Estimación de la cola de la distribución
Una Aplicación: LLuvias Extremas en Guanajuato
Una Aplicación: LLuvias Extremas en Guanajuato
volver
Estaciones seleccionadas
●
11040
●
11020
●
11095
●
11051
●
11071
●
11033
●
11036
●
11028
●
11003
●
11052
●
●
11009
11005
●
11013
●
11001
●
11006
●
11079
●
11072
●
11021
●
11031
●
11002
• Se decide trabajar con 20 estaciones que presentan datos
simultáneamente en 37 años.
Cópulas: Teorema de Sklar
Para cópulas bidimensionales
Sea H la función de distribución conjunta de una v.a vectorial
(X , Y ) con F y G las distribuciones marginales (supongamos
continuas). Entonces existe y es única la cópula C tal que
2
∀(x, y) ∈ R cumple que,
H(x, y ) = C(F (x), G(y)).
(1)
Propiedades
• Sean M(u, v ) ≡ min(u, v ) y W (u, v ) ≡ max(u + v − 1, 0).
Entonces para toda cópula C se cumple que,
W (u, v ) ≤ C(u, v ) ≤ M(u, v ).
W y M son llamadas las cotas inferior y superior de
Fréchet-Hoeffding para Cópulas
• Sean X e Y v.a absolutamente continuas. X e Y son
independientes si y sólo si CXY (u, v ) = Π(u, v ) ≡ u.v .
(2)
Densidad de la Función de Cópula
Se llama densidad asociada a la cópula C(u1 , u2 ) a,
c(u1 , u2 ) =
∂ 2 C(u1 , u2 )
.
∂u1 ∂u2
(3)
En v.a absolutamente continuas se cumple que,
f (x1 , x2 ) = c(F1 (x1 ), F2 (x2 ))f1 (x1 )f2 (x2 ),
(4)
Cópulas paramétricas
Algunas
Familias
Cópulas paramétricas
Algunas
Familias
Cópulas paramétricas
Denisdad Cópula FGM
Simulación de 200 valores
Algunas
Familias
1.00
●
●
●
●
●
●
●
●
●
●
●
●
●
C(u,v)
●
●
●
●
●
y
●
●
●
●
●●
●
y
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
0.25
●
● ●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
0.50
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
x
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
Morgenstern
●
●
●
●
●
●
●
●
●
0.75
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
• Farlie-Gumbel-
●
●
●
●
●
●
●
●
0.00
0.00
0.25
0.50
x
θ = 0,7
0.75
1.00
Cópulas paramétricas
Densidad Cópula Normal
Simulación de 200 valores
Algunas
Familias
1.00
●
●
●
●
●
●
●
●
●
●
●
●
●
●
C(u,v)
●
●
●
●
●
●
●
●
●
●
●
y
●
●
●
●
●
0.00
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
0.25
0.50
x
θ = 0,25
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
● ●
●
● ●
●
●
●● ●
●
●●
●
●
● ●
●
0.00
●
●
●
●
●
●
●
●
●
0.25
●
● ●
●
●
●
x
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
● ●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
0.50
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
● ●
●
y
●
●
●
●
●
●
●
●
●
●●
●
● ●
●
●
0.75
Morgenstern
• Gaussiana
●
●
●
●
●
• Farlie-Gumbel-
●
●
●
●
0.75
1.00
Cópulas paramétricas
Densidad Cópula Student
Simulación de 200 valores
Algunas
Familias
1.00
●
●
●
● ●
●
●
●
●
C(u,v)
●
●
●
●
●
y
y
●
●
●●
●
● ●
0.00
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●●
●
●●
●
●
●
0.25
●
●
●
●
x
●
●●
● ●
●
●
●
●
●● ● ●
●
●●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
● ●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
● ●
●
●
●
● ●
●
0.50
●
● ●
●●
●
●
●
Morgenstern
• Gaussiana
• Student
●●
●
●
●
●
● ●
●
●●
●
●
●
0.75
●
●
● ●
●
●
●
●
●
●
●
●
• Farlie-Gumbel-
●
●
●
●
●
●
●
●
●
0.00
0.25
0.50
x
ρ = 0,7 y 4 g.l
0.75
1.00
Cópulas paramétricas
Densidad Cópula Clayton
Simulación de 200 valores
Algunas
Familias
1.00
●
●
●
●
●
●
●
●
●
●
●
●
●
0.75
●
C(u,v)
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
y
●
●
0.50
●
●
●
●
y
●
●
●
●
●
●●
● ●
●
• Clayton
●●
0.00
● ●
●
●
●
●● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●●
●
0.25
0.50
x
θ = 1,5
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
0.00
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
0.25
●
●
●
●
●
●
●
●
x
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Morgenstern
●
●●●
●
● ●
●
●
●
●
●●
●
• Gaussiana
• Student
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
• Farlie-Gumbel-
●
●
●
●
●
●
0.75
1.00
Cópulas Extremas
Algunas
Familias
Cópulas Extremas
Algunas
Familias
Cópulas Extremas
Denisdad Cópula Gumbel
Simulación de 200 valores
1.00
●● ●
●
● ●
●
●
●
●
●
●●
●
●
●
●
• Gumbel-Hougaard
●
●
●
●
●
● ●
●
●
y
●
●
● ●
●
●
y
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
0.50
●
●
●
●
0.25
x
α = 2/3
●
●
●
●
●
0.00
●
●
●
●
0.00
●
● ●
●
●
●●
●
●●●
●●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
0.25
●
●
●
●●
●
●
●
x
●
●
●
●
●
●
●
●
●
●
●
0.50
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
0.75
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
C(u,v)
Algunas
Familias
●
0.75
1.00
Cópulas Extremas
Denisdad Cópula Galambos
Simulación de 200 valores
1.00
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●●
●
y
●
●
●
●
●
●
x
●
● ●
●
●
●
●
0.00
● ●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
0.25
0.50
x
α = 2/3
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0.00
●
●
●
●
●
●● ●
0.25
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
y
●
●
●
●
●
0.50
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
• Gumbel-Hougaard
• Galambos
●
●
●
●
●
●
●
0.75
●
●
●
●
●●
●
●
●
●
C(u,v)
Algunas
Familias
0.75
1.00
Cópulas Extremas
Densidad Cópula Husler−Reiss
Simulación de 200 valores
1.00
●●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
y
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0.00
0.00
●
●
●
●●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
0.25
0.50
x
a = 3/2
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
• Hüsler-Reiss
●
●
●
●
●
●
●
●
●
●
0.25
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
0.50
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
y
●
●
●
●
●
●
●
●
x
●
●
●
●
●
●
●
●
• Gumbel-Hougaard
• Galambos
● ●●
●
●
●
●
●
●
●
●
0.75
C(u,v)
Algunas
Familias
0.75
1.00
Cópulas Extremas
Densidad Cópula t−extremal
Simulación de 200 valores
1.00
●
●
●
●
● ●
●
● ●
●
●
●
y
●
●
●● ●
●
●●
●
0.50
●
y
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
0.25
0.50
x
ρ = 2/3 y 4 g.l
●
● ●
●
●
0.00
●
●
●
●
●
●
●
●
●
●
●
●
●
0.00
●
●
●
●
● ●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
0.25
● ●
●
●
●●
●
●
●
●
●
●
●
●
●
x
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
0.75
• Gumbel-Hougaard
• Galambos
• Hüsler-Reiss
• t-Extremal
●
●
●
● ●
●●●●
●
●
●
●
●
C(u,v)
Algunas
Familias
0.75
1.00
Estructura de R-vines
f1,2,3,4,5 = f1 f2 f3 f4 f5 c12 c13 c34 c15 c23/1 c14/3 c35/1 c24/13 c45/13 c25/134 ,
13
15
12
1
5
2
13
3
34
2
4
23/1
24/13
14/3
45/13
El número posible de R-vines en Rd es
/1
34
12
35/1
35
14/3
1
3/
24/13
d!
22
25/134
15
45/13
(d−2)(d−3)
2
.
Ejemplo. C-vines
f1,2,3,4,5 = f1 f2 f3 f4 f5 c12 c13 c14 c15 c23/1 c24/1 c25/1 c34/12 c35/12 c45/123
A1
A2
1
13
4
5
13
14
A4
23/1
34/12
25/1
45/123
12
24/1
35/
34 /
12
A3
35/12
/1
3
25
14
2
23
/1
24/1
12
12
15
15
Ejemplos: D-vines
f1,2,3,4,5 = f1 f2 f3 f4 f5 c12 c23 c34 c45 c13/2 c24/3 c35/4 c14/23 c25/34 c15/234 ,
A1
1
12
2
23
3
34
4
45
5
A2
12
13/2
23
A3
13/2
14/23
24/3
24/3
34
A4
25/34
35/4
14/23
15/234
25/34
35/4
45
Selección del Modelo
La selección de la cópula R-vines consta de 3 pasos.
1. Seleccionar la estructura R-vines entre todas la posibles.
2. Elegir las d(d − 1)/2 familias paramétricas de cópulas de a
pares.
3. Estimar los parámetros de las cópulas seleccionadas.
Selección de la estructura R-vines
• Procedimiento secuencial introducido por Diı́mann,
Brechmann, Czado y Kurowicka (2013), [5].
• Se elige una medida de dependencia δi,j que le asigne pesos a
las aristas.
• Bajo un algoritmo (usamos Prim) adecuado se selecciona un
árbol, el primero del conjunto, que maximice,
X
arsitas e={i,j}
|δi,j |
Relaciones de dependencia (δi,j ). Correlación
Relaciones de dependencia. Correlación
Otras medidas de Dependencia
• Rango Correlación de Kendall, (“Kendall’s tau”).
ρτ (X , Y ) = P[(X1 − X2 )(Y1 − Y2 ) > 0] − P[(X1 − X2 )(Y1 − Y2 ) < 0],
donde (X1 , Y1 ) y (X2 , Y2 ) pares de v.a iid con distribución F .
• Coeficiente Dependencia en las Colas.
λu = lı́m P(Y > F2−1 (u)|X > F1−1 (u)),
u→1−
• El F -madograma (para un campo aleatorio).
ν F (h) =
1 E F Z (x + h) − F Z (x) ,
2
• Distancia covarianza (Szekely 2007) y MIC (Reshef 2011).
(5)
Selección de Familias.
• Luego de elegida la estructura se seleccionan las familias de
cópulas bidimensionales y se estiman los parámetros de cada
cópula por máxima verosimilitud.
• El método de simplificación, que consiste en considerar
cópulas de una sola familia, y truncamiento, suponer que a
partir de cierto nivel las cópulas son independientes, fueron
introducidos por Brechmann, Czado y Aas en el 2012, [1].
• Por último se calculan las distribuciones condicionales
empı́ricas de forma recursiva pues. A partir de ellas se reitera
el algoritmo.
Primer árbol de la R-vine (lluvioso)
ver mapa
Algunas Predicciones
Junio − Agosto
perı́odo (años)
Mediana Media Desvı́o P ∗(supere 100 mm) P ∗(supere 150 mm)
10
20
30
40
50
105.2
116.0
123.4
127.2
133.0
110.6
122.5
129.1
133.5
139.2
23.4
25.3
25.4
27.4
28.7
0.625
0.87
0.948
0.98
0.994
0.063
0.121
0.161
0.194
0.268
GRACIAS!!
Referencias (1)
E.Brechmann; C. Czado; K. Aas.
Truncated regular vines in high dimensions with application to financial data.
Canadian Journal of Statistics, 40(1):68–85, 2012.
K. Aas; C. Czado; A. Frigessi; H. Bakken.
Pair-copula constructions of multiple dependence.
Insurance, Mathematics and Economics, 44:182–198, 2009.
J.F. Dissmann.
Statistical inference for regular vines and application.
Master’s thesis, Technische Universit at Munchen., 2010.
D. Kurowicka and R. Cooke.
Uncertainty analysis with high dimensional dependence modelling.
Wiley, 2006.
J. Diı́Mann; E. C. Brechmann; C. Czado; D. Kurowicka.
Selecting and estimating regular vine copulae and application to financial returns.
Computational Statistics & Data Analysis, 59:52–69, 2013.
O. Morales-Nápoles.
Bayesian belief nets and vines in aviation safety and other applications.
PhD thesis, Technische Universiteit Delft, 2008.
Referencias (2)
R. Nelsen.
An introduction to copulas.
Springer-Verlag, 2006.
A. Sklar.
Fonctions de reṕartition a n dimensions et leurs marges.
Publ. Inst. Stat. Univ. Paris, 8:229–231, 1959.
R.M Cooke T. Bedford.
Probability density decomposition for conditionally dependent random variables modeled by vines.
Annals of Mathematics and Artificial Intelligence, 32:245–268, 2001.
H.Joe; J.J. Xu.
The estimation method of inference functions for margins for multivariate models.
Technical report, Department of Statistics, University of British Columbia, 1996.
Descargar