Un Nuevo Enfoque - UAM-I

Anuncio
Modelos Probabilı́sticos de Valores Máximos en Hidrologı́a: Un
Nuevo Enfoque
Agustı́n Felipe Breña Puyol
UAM-I.Depto. de Ingenierı́a de Procesos e Hidráulica
Resumen
Tradicionalmente los modelos probabilı́sticos que se
han desarrollado para analizar la frecuencia de valores máximos de eventos hidrológicos, utilizan únicamente la muestra de datos que está integrada por los
valores máximos anuales, motivo por el cual este tipo
de modelos no utilizan de manera precisa y adecuada la información que está contenida en las muestras
de eventos hidrológicos. Por tal situación, el objetivo que persigue este artı́culo es desarrollar nuevos esquemas para analizar la frecuencia de valores máximos en el campo de la hidrologı́a estadı́stica, a través
de modelos que utilizan muestras de diferente longitud en lugar de la muestra de valores máximos anuales. Asimismo, para ilustrar la eficiencia de los modelos propuestos se desarrolla un ejercicio numérico con los datos de las lluvias mensuales registradas en la estación del Servicio Meteorológico Nacional durante un periodo de 129 años (1877-2005). Finalmente, con los resultados obtenidos se concluye
que los modelos propuestos son una alternativa viable para obtener lluvias de diseño más precisas que
el método tradicional.
máximos anuales, a partir de diferentes funciones de
distribución de probabilidad con un número variable de parámetros, ha tenido una aplicación continua a lo largo del tiempo.
Al respecto, puede decirse que en las últimas décadas, se han desarrollado análisis de frecuencia de
eventos máximos anuales por diversos autores, sobresaliendo las aplicaciones realizadas por Hazen
(1914), Gumbel (1941, 1958), Chow (1951, 1964),
Jenkinson (1955), Houghton (1978), Ahmad y Al
(1988), Ahmad (1988) y algunos otros.
No obstante, en este artı́culo se desarrollan varios
modelos probabilı́sticos de valores máximos cuyo objetivo es evaluar las variaciones en la estimación de
su frecuencia, utilizando para ello series de valores
de mayor longitud que las series de valores máximos anuales.
Además, es importante recalcar que el método clásico que se ha desarrollado para evaluar la frecuencia de valores extremos utiliza únicamente la serie
de valores máximos anuales, mientras que en los modelos probabilı́sticos que se proponen como el nuevo enfoque, se podrán utilizar series de diferente longitud.
Introducción
El análisis de frecuencia de valores máximos es un
desarrollo matemático establecido en el campo de la
hidrologı́a, para predecir la ocurrencia de los principales eventos hidrológicos tales como precipitaciones, escurrimientos, evaporaciones, temperaturas y
algunos más. En general, se puede decir que la estructura matemática del análisis de frecuencia de valores máximos radica en utilizar en forma conjunta la
herramienta de las funciones de distribución de probabilidad y las series de tiempo constituidas por valores máximos, y a partir de su vinculación predecir su ocurrencia para diferentes periodos de retorno
o probabilidades.
Finalmente, para demostrar la eficiencia de los modelos probabilı́sticos que se proponen como una nueva alternativa, se realiza una aplicación numérica con
datos de lluvia mensual registrados en la estación climatológica del Servicio Meteorológico Nacional, ubicada en Tacubaya, D. F.
Hipótesis de base
La hipótesis de base de los modelos probabilı́sticos se
fundamentan en la teorı́a de valores extremos y en las
funciones de distribución de probabilidad, que se han
desarrollado para evaluar la frecuencia en términos
de la probabilidad de ocurrencia.
Por su parte, el análisis de frecuencia de valores
54
Modelos Probabilı́sticos. . . Agustı́n Felipe Breña Puyol.
Sea X una serie cronológica de variables aleatorias
con una distribución común del tipo:
F (X) = P (X ≤ x)
Ahora bien, la serie X se puede dividir en N muestras de longitud k, de tal manera que:

X=

X1 ,
Xk+1 ,
−−−
X2 ,
Xk+2 ,
−−−
X(N −1)k+1
X(N −2)k+2

...
Xk
...
X2k 

−−− −−− 
...
XN k
(2)
donde N es el número de años disponibles; y N k es
el número total de valores de la serie X.
Ahora bien, se procede a determinar el número de variables de cada una de las muestras de diferente longitud que se puede definir a partir de la serie cronológica original.
La primera muestra esta integrada por el número total de valores de la serie X, que se puede definir como el conjunto de N muestras de 12 valores mensuales, es decir las muestras tendrá 12N valores.
Posteriormente, si en la serie X se extrae un solo
valor por año, se obtendrá la segunda muestra de N
valores máximos Xm , constituida por:
Xm = {xmax1 , Xmax2 , . . . XmaxN }
(3)
Finalmente, existe una tercera muestra formada por
12 muestras Xk , asociadas al mes k, k = 1, 2, . . . , 12.
El número de valores de cada muestra xk es de N
valores.
Por otra parte y de acuerdo con la teorı́a de valores
extremos (Gumbel, 1958), se tiene que:
M (x) = P (xmax ≤ x)
(Xmax ≤ x)
(1)
Por ejemplo, una serie tı́pica puede ser el conjunto
de precipitaciones mensuales máximas que ocurren
en una estación de medición o bien en una región
hidrológica.

55
(4)
El evento Xmax ≤ x implica que los otros valores de
la serie X son iguales o inferiores a x, es decir:
= (X1 ≤ x, X2 ≤ x, . . . , Xk ≤ x)
= ∩(Xi ≤ x)
(5)
y como la variable X es aleatoria:
∩(Xi ≤ x) =
Y
(Xi ≤ x);
i = 1, 2, 3, . . . k (6)
Entonces:
M (x) =
k
Y
P (Xi ≤ x) =
i=1
k
Y
Fi (x)
(7)
i=1
Ahora bien, como todas las variables tienen la misma
función de distribución, de acuerdo con la hipótesis
de partida, se obtiene que:
M (x) = [F (x)]k
(8)
La ecuación (8) es válida únicamente para el caso donde el valor máximo anual ocurre indistintamente en cada uno de los meses del año, es decir si en la muestra disponible de N años, el número de veces que el máximo anual ha ocurrido en un
mes en particular, por ejemplo julio, es en promedio N/12.
Estructura de los modelos
El modelo probabilı́stico que se propone para evaluar
la frecuencia de valores máximos, para el caso donde
el valor máximo anual se produce indistintamente en
cada uno de los meses del año, esta representado por
la ecuación (8).
No obstante, en las muestras de eventos máximos
de fenómenos hidrológicos hay meses donde el valor máximo anual no se presenta jamás y, en consecuencia, será necesario estimar el valor de k, a partir de datos reales que se han registrado, para una variable hidrológica máxima.
Ahora bien, con el apoyo de las muestras de lluvias
máximas en 24 horas que han ocurrido en la República Mexicana y que se tienen disponibles en formato electrónico en el Extractor Rápido de Información Climatológica (IMTA, 1999) y en la Información de 322 Estaciones Climatológicas de Referencia (CNA, 2000), se ha determinado que los valores máximos anuales están concentrados en 4 meses del año, es decir el valor de k es igual a 4.
56
ContactoS 66, 54–57 (2007)
En consecuencia, la ecuación (8) se modifica a:
M (x) = [F (x)]4
(9)
La ecuación (9) representa el modelo probabilı́stico de valores máximos para el caso especı́fico donde el valor de k = 4 y las muestras de precipitación
mensual correspondientes a cada uno de los 4 meses tienen la misma función de distribución.
Ahora bien, a partir del modelo probabilı́stico representado por la ecuación (9) se han propuesto 4 modelos alternativos cuyo objetivo es detectar los cambios
en la estimación de la frecuencia de valores máximos, cuando se utilizan muestras de valores máximos de diferente longitud.
Por su parte, las caracterı́sticas y estructura matemática de los 4 modelos que han sido seleccionados para evaluar la frecuencia de valores máximos son:
Modelo (1):
M1 (x) = [Fmax (x)]
(10)
donde F1,2 (x) es la frecuencia asociada con las 2
muestras de precipitación mensual donde se concentran los valores máximos anuales de mayor ocurrencia. En este modelo el número de valores es igual a
(2N ).
Número de valores de las muestras de diferente longitud
Para determinar el número de valores de los 4 modelos que han sido seleccionados para evaluar la frecuencia, se procede a utilizar las series X y Fk (x).
Con el auxilio de la primera serie se determina la
muestra de N valores máximos Xm , constituida por
Xm = {Xmax1 , Xmax2 , . . . XmaxN }, mientras que
para los modelos que utilizan las muestras de valores mensuales se recurre a la serie Fk (x).
La tabla 1 indica el número de valores de las 4 muestras mensuales.
Tabla 1. Número
Año
1
2
3
..
.
N
de valores de las 4 muestras mensuales
X1
X2
X3
X4
X11
X21
X31
X41
X12
X22
X32
X42
X13
X23
X33
X43
..
..
..
..
.
.
.
.
X1N X2N X3N X4N
donde Fmax (x) es la frecuencia asociada con la muestra de N valores máximos Xm .
Modelo (2):
M2 (x) = [F1,2,3,4 (x)]4
(11)
donde F1,2,3,4 (x) es la frecuencia asociada con las
4 muestras de precipitación mensual donde se concentran los valores máximos anuales. En este modelo el número de valores es igual a (4N ).
Modelo (3):
M3 (x) = [F1,2,3 (x)]3
(12)
Con el apoyo de la tabla 1 se determinan para los modelos M2 , M3 y M4 , el número de valores de cada una
de las muestras de diferente longitud, que serán utilizadas para estimar la frecuencia de valores máximos.
La tabla 2 indica el número de valores que han sido
asignados a cada una de las muestras de los modelos
alternativos.
Evaluación de la frecuencia
La variable de análisis de la frecuencia de valores
máximos será la altura de lluvia XT y para cada uno
de los modelos seleccionados se calculará el valor de
XT correspondiente a un periodo de retorno.
donde F1,2,3 (x) es la frecuencia asociada con las 3
muestras de precipitación mensual donde se concentran los valores máximos anuales de mayor ocurrencia. En este modelo el número de valores es igual a
(3N ).
Ahora bien, para calcular la altura de lluvia máxima
XT , se utilizan las funciones de distribución de probabilidad con un número variable de parámetros, y a
lo largo del tiempo ha tenido una aplicación muy fecunda en el campo de la hidrologı́a.
Modelo (4):
Asimismo, es importante recalcar que cada una de
las funciones de distribución que se han diseñado para calcular la frecuencia de valores máximos proporciona ajustes de magnitud variable entre los datos
M4 (x) = [F1,2 (x)]2
(13)
Modelos Probabilı́sticos. . . Agustı́n Felipe Breña Puyol.
57
Tabla 2. Número de valores de las muestras de los modelos probabilı́sticos
Modelo
M1 (x)
M2 (x)
M3 (x)
M4 (x)
Número de valores de las muestras
Xmax = [Xmax1 , Xmax2 , . . . , XmaxN ]
X1,2,3,4 = [X11 , X12 , . . . , X1N ; X21 , X22 , . . . , X2N ; X31 , X32 , . . . , X3N ; X41 , X42 , . . . , X4N ]
X1,2,3 = [X11 , X12 , . . . , X1N ; X21 , X22 , . . . , X2N ; X31 , X32 , . . . , X3N ]
X1,2 = [X11 , X12 , . . . , X1N ; X21 , X22 , . . . , X2N ]
observados y los teóricos. Por tal situación y previo análisis de los datos disponibles y de la bondad de ajuste, entre datos observados y teóricos, fue
seleccionada la función de Gumbel, como el criterio más preciso para evaluar la frecuencia de valores máximos.
A continuación se determinará para cada modelo la
expresión que permitirá evaluar la frecuencia de lluvia máxima XT , utilizando la función de distribución de Gumbel (1958).
Modelo (1):
De acuerdo con Gumbel (1958) la forma explı́cita de
la función de distribución está representada por:
(x − a)
F (x) = exp − exp −
c
(14)
donde a y c son los parámetros de ubicación y escala,
respectivamente.
Además, por definición el concepto del periodo de
retorno Tr , se define como:
F (x) = 1
1
Tr
(15)
Si se sustituyen las ecuaciones (14) y (15) en la (10),
la cual representa el modelo probabilı́stico M1 (x),
y después de varias transformaciones algebraicas se
obtiene:
Tr
X̂T = â − ĉ ln ln
Tr − 1
Sustituyendo las ecuaciones (14) y (15) en la (11),
la cual representa el modelo probabilı́stico M2 (x),
y después de varias transformaciones algebraicas se
obtiene:
X̂T = â − ĉ ln ln
(17)
donde X̂T es el valor de la altura de lluvia, en mm;
â y ĉ son los parámetros estimados a partir de las
4 muestras mensuales X1,2,3,4 ; Tr es el periodo de
retorno, en años; K es una constante equivalente a
K = 1/4; y ln es el logaritmo natural.
Modelo (3):
Si se sustituyen las ecuaciones (14) y (15) en la (12),
la cual representa el modelo probabilı́stico M3 (x),
y después de varias transformaciones algebraicas se
obtiene:
X̂T = â − ĉ ln ln
Tr
− ĉ ln(K)
Tr − 1
(18)
donde X̂T es el valor de la altura de lluvia, en mm;
â y ĉ son los parámetros estimados a partir de las
3 muestras mensuales X1,2,3 ; Tr es el periodo de retorno, en años; K es una constante equivalente a
K = 1/3; y ln es el logaritmo natural.
Modelo (4):
Si se procede a sustituir las ecuaciones (14) y (15)
en la (13), la cual representa el modelo probabilı́stico M4 (x), y después de varias transformaciones algebraicas se obtiene:
(16)
X̂T = â − ĉ ln ln
donde X̂T es el valor de la altura de lluvia, en mm;
â y ĉ son los parámetros estimados a partir de la
muestra de valores máximos anuales Xmax ; Tr es
el periodo de retorno, en años; y ln es el logaritmo
natural.
Modelo (2):
Tr
− ĉ ln(K)
Tr − 1
Tr
− ĉ ln(K)
Tr − 1
(19)
donde X̂T es el valor de la altura de lluvia, en mm;
â y ĉ son los parámetros estimados a partir de las 2
muestras mensuales X1,2 ; Tr es el periodo de retorno,
en años; K es una constante equivalente a K = 1/2;
y ln es el logaritmo natural.
58
ContactoS 66, 54–57 (2007)
Aplicación numérica
La estación climatológica del Servicio Meteorológico
Nacional, ubicada en Tacubaya, D. F., ha sido seleccionada para aplicar los modelos probabilı́sticos propuestos para evaluar la frecuencia de valores máximos de lluvia.
Los datos de lluvia mensual registrados durante un
periodo de 129 años (1877-2005) han sido seleccionados para la aplicación numérica de los modelos y
a partir de su análisis se han determinado las muestras de lluvias de diferente longitud requeridas para los modelos, ası́ como la distribución mensual de
los valores máximos.
La tabla 3 indica la distribución mensual de los valores máximos durante el periodo de registro y los resultados destacan que en los meses de junio, julio,
agosto y septiembre se concentran el mayor número de valores máximos, es decir el valor de k es igual
a 4.
Tabla 3. Distribución mensual de los valores máximos
Mes
Número de valores máximos
Mayo
1
Junio
26
Julio
43
Agosto
32
Septiembre
25
Octubre
2
Total
129
Además, para calcular las alturas de lluvia X̂t , asociadas a diferentes periodos de retorno, con los modelos probabilı́sticos propuestos, se calcularon la magnitud de los parámetros â y ĉ de cada uno de ellos.
Para llevar a cabo tal acción, se utilizo el método de
momentos (Chow, 1964) y las muestras de datos extraı́das del registro de lluvias mensuales de la estación Servicio Meteorológico Nacional.
Los resultados se sintetizan en las expresiones siguientes:
Modelo M1 (x):
X̂T = 175,215903−43,68638507 ln ln
Tr
Tr − 1
X̂T
=
111,1901325 − 47,52225796 ln ln
1
−47,52226796 ln( )
4
(21)
Modelo M3 (x):
X̂T
Tr
= 114,8514181 − 47,67393607 ln ln
Tr − 1
1
−47,67393607 ln( )
(22)
3
Modelo M4 (x):
Tr
= 124,9715429 − 45,03167907 ln ln
Tr − 1
1
−45,03167907 ln( )
(23)
2
X̂T
Posteriormente, con el auxilio de las ecuaciones (20),
(21), (22) y (23) se determinan las curvas de frecuencia de las lluvias observadas y las teóricas para periodos de retorno que oscilen entre 1 y 100 años y al
analizarlas en forma visual permite detectar el grado de ajuste.
A modo de ejemplo y para ilustrar el comportamiento de las curvas de frecuencia las figuras 1 y 2 ilustran los resultados obtenidos por los modelos M1 (x)
y M2 (x), los cuales presentan los niveles de ajuste de mayor precisión entre las lluvias observadas y
las teóricas.
No obstante, existen métodos cuantitativos que miden la bondad de ajuste entre los elementos de las
muestras de eventos hidrológicos y las funciones de
distribución de probabilidad.
El método del Error Estándar de Ajuste (EEA) desarrollado por Kite (1977) mide cuantitativamente la
bondad de ajuste entre los valores observados Xi de
una muestra de datos y los calculados X̂i con una
función de distribución de probabilidad con el apoyo de la expresión:
(20)
"P
EEAj =
Modelo M2 (x):
Tr
Tr − 1
n
i=1 (Xi
− X̂i )
n−p
#1/2
(24)
Modelos Probabilı́sticos. . . Agustı́n Felipe Breña Puyol.
7.9cm4.9cmc:/cs/n66ne/modelos/modelo01.bmp
Figura 1. Curva de frecuencia obtenida con el modelo
M1 (x).
Figura 1.
Figura 2. Curva de frecuencia obtenida con el modelo
donde es el valor estimado del error estándar de ajuste asociado a la j-ésima función de distribución de
probabilidad; , i = 1, 2, 3,. . . ,n son las magnitudes de
los valores observados; , i = 1, 2, 3,...,n son las magnitudes de los valores teóricos calculados con la j-ésima función de distribución de probabilidad para las
mismas frecuencias que los eventos ; es el número total de valores de la muestra de datos; y es el número de parámetros de j-ésima función de distribución
de probabilidad.
Aplicando el criterio de Kite (1977) se calculó el
error estándar de ajuste (EEA) de los modelos probabilı́sticos propuestos para evaluar la frecuencia de
lluvias máximas y en la tabla 4 se indican los resultados obtenidos.
Analizando globalmente los resultados se concluye
que el modelo proporciona el mejor ajuste entre las
lluvias observadas y teóricas, ya que presenta el EEA
de menor magnitud.
Tabla 4. Error estándar de ajuste EEA de los modelos
probabilı́sticos.
Modelo probabilı́stico
Modelo
Modelo
Modelo
Modelo
M1 (x)
M2 (x)
M3 (x)
M4 (x)
Error estándar de ajuste
EEA, en mm
7.33
6.90
9.87
20.31
59
El modelo resultó ser más eficiente para estimar lluvias asociadas a diferentes periodos de retorno, que
el modelo tradicional el cual utiliza solamente la
muestra de valores máximos anuales.
Por su parte, las aplicaciones principales de las lluvias asociadas a un determinado periodo de retorno,
que se estiman con el modelo , es diseñar, revisar,
operar y proteger estructuras hidráulicas tales como drenaje urbano y drenaje de aeropuertos, alcantarillas de vı́as de comunicación y algunas otras más.
Finalmente, con el mismo esquema y estructura de
los modelos propuestos en este artı́culo se están analizando lluvias ciclónicas y orográficas, las cuales tienen una gran incidencia en diferentes cuencas hidrológicas de nuestro paı́s.
Bibliografı́a Ahmad, M. I. (1988). Application of
statistical methods to flood frequency analysis. Thesis pres. in fulfillment of Ph. D. degree, Univ. of St.
Andrews, Scotland.
Ahmad, M. I., Sinclair, C. D. y Werrity, A. (1988).
Log-logistic flood frequency analysis. J. Hydrol., 98,
pp. 205-224.
Chow, V. T. (1951). A general formula for hydrologic frequency analysis. Trans. Amer. Geophys. Union
No. 32, pp. 231-237.
Chow, V. T. (1964). Handbook of Applied Hydrology. McGraw-Hill, New York, NY.
Colisión Nacional del Agua, CNA (2000). Información de 322 Estaciones Climatológicas de Referencia, 1893-1998). Información climatológica disponible en formato electrónico.
Gumbel, E. J. (1941). The return period of flood
flows. Ann. Math. Statist., 12(2), pp. 163-190.
En el Anexo A se adjunta el registro de las lluvias mensuales de la estación climatológica Servicio Meteorológico Nacional, Tacubaya, D. F., donde
se ilustra el proceso para obtener la muestra de lluvias máximas anuales.
Gumbel, E. J. (1958). Statistics of extremes. Columbia University Press, New York, NY.
Conclusiones
Los resultados obtenidos al aplicar los modelos probabilı́sticos con los datos de la muestra de lluvias
mensuales registradas en la estación del Servicio Meteorológico Nacional, han demostrado la eficiencia
del nuevo esquema que permite estimar la frecuencia de valores máximos asociados con eventos hidrológicos.
Houghton, J. C. (1978). Birth of a parent: The Wakeby distribution for modelling flood flows. Water
Resources Res. 14(6), pp. 1105-1109.
Hazen, A. (1914). Storage to be provided in impounding reservoirs for municipal water supply. Trans.
ASCE, 77, Paper No. 1308, pp. 1547-1550.
Instituto Mexicano de Tecnologı́a del Agua, IMTA (1999). Extractor Rápido de Información Climatológica, v. 2.0. Información climatológica disponible en formato electrónico.
60
Jenkinson, A. F. (1955). The frequency distribution
of the annual maximum (or minimum) values of meteorological elements. Quart. J. Roy. Meteor. Soc.,
81, pp. 158-171.
Kite, G. W. (1977). Frequency and risk analysis in
hydrology. Water Resources Publications, Fort Collins, CO, 224 p.
ContactoS 66, 54–57 (2007)
Descargar