Modelos Probabilı́sticos de Valores Máximos en Hidrologı́a: Un Nuevo Enfoque Agustı́n Felipe Breña Puyol UAM-I.Depto. de Ingenierı́a de Procesos e Hidráulica Resumen Tradicionalmente los modelos probabilı́sticos que se han desarrollado para analizar la frecuencia de valores máximos de eventos hidrológicos, utilizan únicamente la muestra de datos que está integrada por los valores máximos anuales, motivo por el cual este tipo de modelos no utilizan de manera precisa y adecuada la información que está contenida en las muestras de eventos hidrológicos. Por tal situación, el objetivo que persigue este artı́culo es desarrollar nuevos esquemas para analizar la frecuencia de valores máximos en el campo de la hidrologı́a estadı́stica, a través de modelos que utilizan muestras de diferente longitud en lugar de la muestra de valores máximos anuales. Asimismo, para ilustrar la eficiencia de los modelos propuestos se desarrolla un ejercicio numérico con los datos de las lluvias mensuales registradas en la estación del Servicio Meteorológico Nacional durante un periodo de 129 años (1877-2005). Finalmente, con los resultados obtenidos se concluye que los modelos propuestos son una alternativa viable para obtener lluvias de diseño más precisas que el método tradicional. máximos anuales, a partir de diferentes funciones de distribución de probabilidad con un número variable de parámetros, ha tenido una aplicación continua a lo largo del tiempo. Al respecto, puede decirse que en las últimas décadas, se han desarrollado análisis de frecuencia de eventos máximos anuales por diversos autores, sobresaliendo las aplicaciones realizadas por Hazen (1914), Gumbel (1941, 1958), Chow (1951, 1964), Jenkinson (1955), Houghton (1978), Ahmad y Al (1988), Ahmad (1988) y algunos otros. No obstante, en este artı́culo se desarrollan varios modelos probabilı́sticos de valores máximos cuyo objetivo es evaluar las variaciones en la estimación de su frecuencia, utilizando para ello series de valores de mayor longitud que las series de valores máximos anuales. Además, es importante recalcar que el método clásico que se ha desarrollado para evaluar la frecuencia de valores extremos utiliza únicamente la serie de valores máximos anuales, mientras que en los modelos probabilı́sticos que se proponen como el nuevo enfoque, se podrán utilizar series de diferente longitud. Introducción El análisis de frecuencia de valores máximos es un desarrollo matemático establecido en el campo de la hidrologı́a, para predecir la ocurrencia de los principales eventos hidrológicos tales como precipitaciones, escurrimientos, evaporaciones, temperaturas y algunos más. En general, se puede decir que la estructura matemática del análisis de frecuencia de valores máximos radica en utilizar en forma conjunta la herramienta de las funciones de distribución de probabilidad y las series de tiempo constituidas por valores máximos, y a partir de su vinculación predecir su ocurrencia para diferentes periodos de retorno o probabilidades. Finalmente, para demostrar la eficiencia de los modelos probabilı́sticos que se proponen como una nueva alternativa, se realiza una aplicación numérica con datos de lluvia mensual registrados en la estación climatológica del Servicio Meteorológico Nacional, ubicada en Tacubaya, D. F. Hipótesis de base La hipótesis de base de los modelos probabilı́sticos se fundamentan en la teorı́a de valores extremos y en las funciones de distribución de probabilidad, que se han desarrollado para evaluar la frecuencia en términos de la probabilidad de ocurrencia. Por su parte, el análisis de frecuencia de valores 54 Modelos Probabilı́sticos. . . Agustı́n Felipe Breña Puyol. Sea X una serie cronológica de variables aleatorias con una distribución común del tipo: F (X) = P (X ≤ x) Ahora bien, la serie X se puede dividir en N muestras de longitud k, de tal manera que: X= X1 , Xk+1 , −−− X2 , Xk+2 , −−− X(N −1)k+1 X(N −2)k+2 ... Xk ... X2k −−− −−− ... XN k (2) donde N es el número de años disponibles; y N k es el número total de valores de la serie X. Ahora bien, se procede a determinar el número de variables de cada una de las muestras de diferente longitud que se puede definir a partir de la serie cronológica original. La primera muestra esta integrada por el número total de valores de la serie X, que se puede definir como el conjunto de N muestras de 12 valores mensuales, es decir las muestras tendrá 12N valores. Posteriormente, si en la serie X se extrae un solo valor por año, se obtendrá la segunda muestra de N valores máximos Xm , constituida por: Xm = {xmax1 , Xmax2 , . . . XmaxN } (3) Finalmente, existe una tercera muestra formada por 12 muestras Xk , asociadas al mes k, k = 1, 2, . . . , 12. El número de valores de cada muestra xk es de N valores. Por otra parte y de acuerdo con la teorı́a de valores extremos (Gumbel, 1958), se tiene que: M (x) = P (xmax ≤ x) (Xmax ≤ x) (1) Por ejemplo, una serie tı́pica puede ser el conjunto de precipitaciones mensuales máximas que ocurren en una estación de medición o bien en una región hidrológica. 55 (4) El evento Xmax ≤ x implica que los otros valores de la serie X son iguales o inferiores a x, es decir: = (X1 ≤ x, X2 ≤ x, . . . , Xk ≤ x) = ∩(Xi ≤ x) (5) y como la variable X es aleatoria: ∩(Xi ≤ x) = Y (Xi ≤ x); i = 1, 2, 3, . . . k (6) Entonces: M (x) = k Y P (Xi ≤ x) = i=1 k Y Fi (x) (7) i=1 Ahora bien, como todas las variables tienen la misma función de distribución, de acuerdo con la hipótesis de partida, se obtiene que: M (x) = [F (x)]k (8) La ecuación (8) es válida únicamente para el caso donde el valor máximo anual ocurre indistintamente en cada uno de los meses del año, es decir si en la muestra disponible de N años, el número de veces que el máximo anual ha ocurrido en un mes en particular, por ejemplo julio, es en promedio N/12. Estructura de los modelos El modelo probabilı́stico que se propone para evaluar la frecuencia de valores máximos, para el caso donde el valor máximo anual se produce indistintamente en cada uno de los meses del año, esta representado por la ecuación (8). No obstante, en las muestras de eventos máximos de fenómenos hidrológicos hay meses donde el valor máximo anual no se presenta jamás y, en consecuencia, será necesario estimar el valor de k, a partir de datos reales que se han registrado, para una variable hidrológica máxima. Ahora bien, con el apoyo de las muestras de lluvias máximas en 24 horas que han ocurrido en la República Mexicana y que se tienen disponibles en formato electrónico en el Extractor Rápido de Información Climatológica (IMTA, 1999) y en la Información de 322 Estaciones Climatológicas de Referencia (CNA, 2000), se ha determinado que los valores máximos anuales están concentrados en 4 meses del año, es decir el valor de k es igual a 4. 56 ContactoS 66, 54–57 (2007) En consecuencia, la ecuación (8) se modifica a: M (x) = [F (x)]4 (9) La ecuación (9) representa el modelo probabilı́stico de valores máximos para el caso especı́fico donde el valor de k = 4 y las muestras de precipitación mensual correspondientes a cada uno de los 4 meses tienen la misma función de distribución. Ahora bien, a partir del modelo probabilı́stico representado por la ecuación (9) se han propuesto 4 modelos alternativos cuyo objetivo es detectar los cambios en la estimación de la frecuencia de valores máximos, cuando se utilizan muestras de valores máximos de diferente longitud. Por su parte, las caracterı́sticas y estructura matemática de los 4 modelos que han sido seleccionados para evaluar la frecuencia de valores máximos son: Modelo (1): M1 (x) = [Fmax (x)] (10) donde F1,2 (x) es la frecuencia asociada con las 2 muestras de precipitación mensual donde se concentran los valores máximos anuales de mayor ocurrencia. En este modelo el número de valores es igual a (2N ). Número de valores de las muestras de diferente longitud Para determinar el número de valores de los 4 modelos que han sido seleccionados para evaluar la frecuencia, se procede a utilizar las series X y Fk (x). Con el auxilio de la primera serie se determina la muestra de N valores máximos Xm , constituida por Xm = {Xmax1 , Xmax2 , . . . XmaxN }, mientras que para los modelos que utilizan las muestras de valores mensuales se recurre a la serie Fk (x). La tabla 1 indica el número de valores de las 4 muestras mensuales. Tabla 1. Número Año 1 2 3 .. . N de valores de las 4 muestras mensuales X1 X2 X3 X4 X11 X21 X31 X41 X12 X22 X32 X42 X13 X23 X33 X43 .. .. .. .. . . . . X1N X2N X3N X4N donde Fmax (x) es la frecuencia asociada con la muestra de N valores máximos Xm . Modelo (2): M2 (x) = [F1,2,3,4 (x)]4 (11) donde F1,2,3,4 (x) es la frecuencia asociada con las 4 muestras de precipitación mensual donde se concentran los valores máximos anuales. En este modelo el número de valores es igual a (4N ). Modelo (3): M3 (x) = [F1,2,3 (x)]3 (12) Con el apoyo de la tabla 1 se determinan para los modelos M2 , M3 y M4 , el número de valores de cada una de las muestras de diferente longitud, que serán utilizadas para estimar la frecuencia de valores máximos. La tabla 2 indica el número de valores que han sido asignados a cada una de las muestras de los modelos alternativos. Evaluación de la frecuencia La variable de análisis de la frecuencia de valores máximos será la altura de lluvia XT y para cada uno de los modelos seleccionados se calculará el valor de XT correspondiente a un periodo de retorno. donde F1,2,3 (x) es la frecuencia asociada con las 3 muestras de precipitación mensual donde se concentran los valores máximos anuales de mayor ocurrencia. En este modelo el número de valores es igual a (3N ). Ahora bien, para calcular la altura de lluvia máxima XT , se utilizan las funciones de distribución de probabilidad con un número variable de parámetros, y a lo largo del tiempo ha tenido una aplicación muy fecunda en el campo de la hidrologı́a. Modelo (4): Asimismo, es importante recalcar que cada una de las funciones de distribución que se han diseñado para calcular la frecuencia de valores máximos proporciona ajustes de magnitud variable entre los datos M4 (x) = [F1,2 (x)]2 (13) Modelos Probabilı́sticos. . . Agustı́n Felipe Breña Puyol. 57 Tabla 2. Número de valores de las muestras de los modelos probabilı́sticos Modelo M1 (x) M2 (x) M3 (x) M4 (x) Número de valores de las muestras Xmax = [Xmax1 , Xmax2 , . . . , XmaxN ] X1,2,3,4 = [X11 , X12 , . . . , X1N ; X21 , X22 , . . . , X2N ; X31 , X32 , . . . , X3N ; X41 , X42 , . . . , X4N ] X1,2,3 = [X11 , X12 , . . . , X1N ; X21 , X22 , . . . , X2N ; X31 , X32 , . . . , X3N ] X1,2 = [X11 , X12 , . . . , X1N ; X21 , X22 , . . . , X2N ] observados y los teóricos. Por tal situación y previo análisis de los datos disponibles y de la bondad de ajuste, entre datos observados y teóricos, fue seleccionada la función de Gumbel, como el criterio más preciso para evaluar la frecuencia de valores máximos. A continuación se determinará para cada modelo la expresión que permitirá evaluar la frecuencia de lluvia máxima XT , utilizando la función de distribución de Gumbel (1958). Modelo (1): De acuerdo con Gumbel (1958) la forma explı́cita de la función de distribución está representada por: (x − a) F (x) = exp − exp − c (14) donde a y c son los parámetros de ubicación y escala, respectivamente. Además, por definición el concepto del periodo de retorno Tr , se define como: F (x) = 1 1 Tr (15) Si se sustituyen las ecuaciones (14) y (15) en la (10), la cual representa el modelo probabilı́stico M1 (x), y después de varias transformaciones algebraicas se obtiene: Tr X̂T = â − ĉ ln ln Tr − 1 Sustituyendo las ecuaciones (14) y (15) en la (11), la cual representa el modelo probabilı́stico M2 (x), y después de varias transformaciones algebraicas se obtiene: X̂T = â − ĉ ln ln (17) donde X̂T es el valor de la altura de lluvia, en mm; â y ĉ son los parámetros estimados a partir de las 4 muestras mensuales X1,2,3,4 ; Tr es el periodo de retorno, en años; K es una constante equivalente a K = 1/4; y ln es el logaritmo natural. Modelo (3): Si se sustituyen las ecuaciones (14) y (15) en la (12), la cual representa el modelo probabilı́stico M3 (x), y después de varias transformaciones algebraicas se obtiene: X̂T = â − ĉ ln ln Tr − ĉ ln(K) Tr − 1 (18) donde X̂T es el valor de la altura de lluvia, en mm; â y ĉ son los parámetros estimados a partir de las 3 muestras mensuales X1,2,3 ; Tr es el periodo de retorno, en años; K es una constante equivalente a K = 1/3; y ln es el logaritmo natural. Modelo (4): Si se procede a sustituir las ecuaciones (14) y (15) en la (13), la cual representa el modelo probabilı́stico M4 (x), y después de varias transformaciones algebraicas se obtiene: (16) X̂T = â − ĉ ln ln donde X̂T es el valor de la altura de lluvia, en mm; â y ĉ son los parámetros estimados a partir de la muestra de valores máximos anuales Xmax ; Tr es el periodo de retorno, en años; y ln es el logaritmo natural. Modelo (2): Tr − ĉ ln(K) Tr − 1 Tr − ĉ ln(K) Tr − 1 (19) donde X̂T es el valor de la altura de lluvia, en mm; â y ĉ son los parámetros estimados a partir de las 2 muestras mensuales X1,2 ; Tr es el periodo de retorno, en años; K es una constante equivalente a K = 1/2; y ln es el logaritmo natural. 58 ContactoS 66, 54–57 (2007) Aplicación numérica La estación climatológica del Servicio Meteorológico Nacional, ubicada en Tacubaya, D. F., ha sido seleccionada para aplicar los modelos probabilı́sticos propuestos para evaluar la frecuencia de valores máximos de lluvia. Los datos de lluvia mensual registrados durante un periodo de 129 años (1877-2005) han sido seleccionados para la aplicación numérica de los modelos y a partir de su análisis se han determinado las muestras de lluvias de diferente longitud requeridas para los modelos, ası́ como la distribución mensual de los valores máximos. La tabla 3 indica la distribución mensual de los valores máximos durante el periodo de registro y los resultados destacan que en los meses de junio, julio, agosto y septiembre se concentran el mayor número de valores máximos, es decir el valor de k es igual a 4. Tabla 3. Distribución mensual de los valores máximos Mes Número de valores máximos Mayo 1 Junio 26 Julio 43 Agosto 32 Septiembre 25 Octubre 2 Total 129 Además, para calcular las alturas de lluvia X̂t , asociadas a diferentes periodos de retorno, con los modelos probabilı́sticos propuestos, se calcularon la magnitud de los parámetros â y ĉ de cada uno de ellos. Para llevar a cabo tal acción, se utilizo el método de momentos (Chow, 1964) y las muestras de datos extraı́das del registro de lluvias mensuales de la estación Servicio Meteorológico Nacional. Los resultados se sintetizan en las expresiones siguientes: Modelo M1 (x): X̂T = 175,215903−43,68638507 ln ln Tr Tr − 1 X̂T = 111,1901325 − 47,52225796 ln ln 1 −47,52226796 ln( ) 4 (21) Modelo M3 (x): X̂T Tr = 114,8514181 − 47,67393607 ln ln Tr − 1 1 −47,67393607 ln( ) (22) 3 Modelo M4 (x): Tr = 124,9715429 − 45,03167907 ln ln Tr − 1 1 −45,03167907 ln( ) (23) 2 X̂T Posteriormente, con el auxilio de las ecuaciones (20), (21), (22) y (23) se determinan las curvas de frecuencia de las lluvias observadas y las teóricas para periodos de retorno que oscilen entre 1 y 100 años y al analizarlas en forma visual permite detectar el grado de ajuste. A modo de ejemplo y para ilustrar el comportamiento de las curvas de frecuencia las figuras 1 y 2 ilustran los resultados obtenidos por los modelos M1 (x) y M2 (x), los cuales presentan los niveles de ajuste de mayor precisión entre las lluvias observadas y las teóricas. No obstante, existen métodos cuantitativos que miden la bondad de ajuste entre los elementos de las muestras de eventos hidrológicos y las funciones de distribución de probabilidad. El método del Error Estándar de Ajuste (EEA) desarrollado por Kite (1977) mide cuantitativamente la bondad de ajuste entre los valores observados Xi de una muestra de datos y los calculados X̂i con una función de distribución de probabilidad con el apoyo de la expresión: (20) "P EEAj = Modelo M2 (x): Tr Tr − 1 n i=1 (Xi − X̂i ) n−p #1/2 (24) Modelos Probabilı́sticos. . . Agustı́n Felipe Breña Puyol. 7.9cm4.9cmc:/cs/n66ne/modelos/modelo01.bmp Figura 1. Curva de frecuencia obtenida con el modelo M1 (x). Figura 1. Figura 2. Curva de frecuencia obtenida con el modelo donde es el valor estimado del error estándar de ajuste asociado a la j-ésima función de distribución de probabilidad; , i = 1, 2, 3,. . . ,n son las magnitudes de los valores observados; , i = 1, 2, 3,...,n son las magnitudes de los valores teóricos calculados con la j-ésima función de distribución de probabilidad para las mismas frecuencias que los eventos ; es el número total de valores de la muestra de datos; y es el número de parámetros de j-ésima función de distribución de probabilidad. Aplicando el criterio de Kite (1977) se calculó el error estándar de ajuste (EEA) de los modelos probabilı́sticos propuestos para evaluar la frecuencia de lluvias máximas y en la tabla 4 se indican los resultados obtenidos. Analizando globalmente los resultados se concluye que el modelo proporciona el mejor ajuste entre las lluvias observadas y teóricas, ya que presenta el EEA de menor magnitud. Tabla 4. Error estándar de ajuste EEA de los modelos probabilı́sticos. Modelo probabilı́stico Modelo Modelo Modelo Modelo M1 (x) M2 (x) M3 (x) M4 (x) Error estándar de ajuste EEA, en mm 7.33 6.90 9.87 20.31 59 El modelo resultó ser más eficiente para estimar lluvias asociadas a diferentes periodos de retorno, que el modelo tradicional el cual utiliza solamente la muestra de valores máximos anuales. Por su parte, las aplicaciones principales de las lluvias asociadas a un determinado periodo de retorno, que se estiman con el modelo , es diseñar, revisar, operar y proteger estructuras hidráulicas tales como drenaje urbano y drenaje de aeropuertos, alcantarillas de vı́as de comunicación y algunas otras más. Finalmente, con el mismo esquema y estructura de los modelos propuestos en este artı́culo se están analizando lluvias ciclónicas y orográficas, las cuales tienen una gran incidencia en diferentes cuencas hidrológicas de nuestro paı́s. Bibliografı́a Ahmad, M. I. (1988). Application of statistical methods to flood frequency analysis. Thesis pres. in fulfillment of Ph. D. degree, Univ. of St. Andrews, Scotland. Ahmad, M. I., Sinclair, C. D. y Werrity, A. (1988). Log-logistic flood frequency analysis. J. Hydrol., 98, pp. 205-224. Chow, V. T. (1951). A general formula for hydrologic frequency analysis. Trans. Amer. Geophys. Union No. 32, pp. 231-237. Chow, V. T. (1964). Handbook of Applied Hydrology. McGraw-Hill, New York, NY. Colisión Nacional del Agua, CNA (2000). Información de 322 Estaciones Climatológicas de Referencia, 1893-1998). Información climatológica disponible en formato electrónico. Gumbel, E. J. (1941). The return period of flood flows. Ann. Math. Statist., 12(2), pp. 163-190. En el Anexo A se adjunta el registro de las lluvias mensuales de la estación climatológica Servicio Meteorológico Nacional, Tacubaya, D. F., donde se ilustra el proceso para obtener la muestra de lluvias máximas anuales. Gumbel, E. J. (1958). Statistics of extremes. Columbia University Press, New York, NY. Conclusiones Los resultados obtenidos al aplicar los modelos probabilı́sticos con los datos de la muestra de lluvias mensuales registradas en la estación del Servicio Meteorológico Nacional, han demostrado la eficiencia del nuevo esquema que permite estimar la frecuencia de valores máximos asociados con eventos hidrológicos. Houghton, J. C. (1978). Birth of a parent: The Wakeby distribution for modelling flood flows. Water Resources Res. 14(6), pp. 1105-1109. Hazen, A. (1914). Storage to be provided in impounding reservoirs for municipal water supply. Trans. ASCE, 77, Paper No. 1308, pp. 1547-1550. Instituto Mexicano de Tecnologı́a del Agua, IMTA (1999). Extractor Rápido de Información Climatológica, v. 2.0. Información climatológica disponible en formato electrónico. 60 Jenkinson, A. F. (1955). The frequency distribution of the annual maximum (or minimum) values of meteorological elements. Quart. J. Roy. Meteor. Soc., 81, pp. 158-171. Kite, G. W. (1977). Frequency and risk analysis in hydrology. Water Resources Publications, Fort Collins, CO, 224 p. ContactoS 66, 54–57 (2007)