Universidad Tecnológica de Panamá Departamento de Hidrología “Métodos de regionalización” Integrantes: María de Gracia 7-711-2379 Luis Rivera Yuritza Sosa 8-926-74 8-772-668 Manuela Vega 7-711-362 Profesor: Esteban Saénz Grupo: 1IB331 Fecha de entrega: 19/10/20 INTRODUCCIÓN El presente trabajo trata acerca de la metodología de regionalización, la cual es utilizada en hidrología para explorar al máximo la información hidrológica existente y permitir la transferencia de dicha información, de un punto a otro sin información suficiente, dentro de un área con comportamiento hidrológico semejante. Dentro de dicha metodología se encuentra la manera en la que se puede determinar regiones homogéneas, así como métodos de estimación entre otros aspectos. Como estudiantes de ingeniería se debe tener claro los conceptos para identificar y saber evaluar los aspectos hidrológicos. Ya que en el desarrollo de obras de ingenierías es necesario determinar los caudales de diseño, sin embargo, se presentan muchos casos en los cuales la información con la que se cuenta no es suficiente en calidad y/o en cantidad para la determinación de éstos. Frente a este problema esta es una de las metodologías que permiten mediante el análisis de las diferentes variables hidrológicas de la región, llegar a tener un mayor entendimiento del comportamiento estocástico de ciertas variables requeridas para entender el comportamiento del recurso hídrico en un sistema de estudio dado. MÉTODOS DE REGIONALIZACIÓN A- Principios de regionalización. El principio de regionalización se basa en la similitud espacial de algunas funciones, variables o parámetros que permitan la transferencia de información de un punto a otro de una región. Pero se debe destacar que ningún estudio de regionalización puede sustituir una adecuada red de monitoreo hidrológico. (APLICACIÓN DEL MÉTODO REGIONALIZACION PARA LA DETERMINACION DE CAUDALES, 2009) Un beneficio adicional del análisis regional de la información es su contribución al mejoramiento de una red de observaciones de datos hidroclimáticos, a medida que la metodología explora la información disponible e identifica vacíos. La regionalización hidrológica (Moreno Jiménez, 2006) puede ser realizar por medio de: Variables: Cuando una variable como la precipitación media, caudales medio, caudal mínimo, tiempo de concentración, entre otras, pueden ser determinadas en una región por medio de relaciones establecidas a través de datos puntuales existentes. Funciones: Cuando se puede estimar información hidrológica por medio de: o Parámetros de la función estadística: Cuando se considera que un tipo de distribución estadística se ajusta bien a los datos de una región o Qmax para diferentes tiempos de retorno. En la cual, por medio de información de los caudales máximos para diferentes periodos de retorno y su relación con características de las cuencas en análisis, se puede determinar el caudal máximo para diferentes periodos de retorno en otros puntos de la región. Este método se usa generalmente ante la falta de datos. o Por medio de curva de probabilidad adimensional: Cuando se determina la curva adimensional de probabilidad o curva regional en base a las relaciones de Q/Qm vs tiempo de retorno para la zona de estudio, con la cual se puede determinar las curvas de caudal vs tiempo de retorno para la zona a regionalizar. Este método es útil cuando se tienen series cortas. Parámetros: Los parámetros de una función o de un modelo matemático pueden ser determinados por la relación con características físicas de la cuenca. Por ejemplo: las tablas generadas por el Soil Conservation Service 10 M. Tucci, Carlos E; Regionalización de caudales. Brasil: Editorial de Universidades, 2002. 256 p. 27 para relacionar el parámetro CN con características del suelo, cobertura vegetal y uso del suelo. Indicadores regionales: Son definidos como los valores medios de las variables que permiten una rápida estimación de una variable hidrológica, para atender su comportamiento. Como, por ejemplo, el caudal específico medio y la relación entre el caudal mínimo y medio. B- Determinación de regiones homogéneas La desagregación de una gran región en subregiones similares permitirá, por ejemplo, disminuir los errores que se generan al transferir hidrológicos en general de una cuenca a otra. Cualquiera que sea el procedimiento empleado, se requiere siempre de una identificación previa de las variables de la región en estudio. Para formar grupos de series o cuencas hidrológicamente homogéneas se mencionan tres consideraciones: La primera se refiere a seleccionar un índice de proximidad. Un índice de proximidad representa en forma matemática la semejanza o desigualdad entre dos configuraciones, es decir, entre dos datos o puntos. Su aplicación en hidrología consiste en obtener dichos índices a partir de configuraciones específicas, formadas por características hidrológicas medibles y continuas en una proporción de escala. El índice de proximidad más común es el índice métrico de Minkowski, el cual mide no semejanzas. La segunda consideración se refiere a seleccionar una regla de agregación. En el campo de la hidrología se recomienda como algoritmo de agrupación el de Ward. Esta regla de agregación consiste en utilizar un análisis de varianza para evaluar cada una de las distancias entre los elementos. Para dividir un área de estudio en subregiones homogéneas es necesario considerar que tendrán un comportamiento similar; de esta manera, los datos requeridos serán inferidos con gran precisión, ya que las ecuaciones de regresión, normalmente empleadas en la transferencia de información hidrológica, se basan en las características de la cuenca. La mayor parte de las veces se emplea la técnica de ubicación geográfica, que se basa simplemente en trazar radios entre 70 y 80 km en cada sitio (estación) y considerar como cuencas homogéneas a las estaciones que se ubiquen dentro de estos círculos. La tercera consideración se refiere a la representación de la agregación. Es de gran importancia representar los resultados de la agrupación de regiones homogéneas. Es normal utilizar diversas técnicas gráficas como los diagramas de árbol o la clasificación jerárquica. Un buen método de representación debe tomar en cuenta la naturaleza de las distancias. Por ejemplo, un diagrama jerárquico (dendrograma) permite describir de manera explícita la estructura final de la clasificación obtenida. Una buena representación gráfica de regiones homogéneas debe incluir las distancias de agregación. Además del procedimiento mencionado, en la regionalización hidrología se pueden emplear métodos estadísticos que pretenden eliminar las posibles diferencias que brindan características heterogéneas. Mediante pruebas estadísticas, se verifica si los valores transformados pueden considerarse de una misma población o descartar lo anterior por ser una región heterogénea. Prueba de Fisher. En hidrología, la prueba de Fisher es de las más recurrentes para verificar la homogeneidad de una población. La distribución F se utiliza para probar la hipótesis de que la varianza de una muestra es igual a la de otra muestra y con esto no existirían elementos para rechazar la hipótesis de homogeneidad. Así, la prueba es útil para notar la variación de las muestras incluidas en una población y verificar si las muestras transformadas pertenecen a la misma población. Las distribuciones F no son simétricas con respecto a su media y en general tienen un sesgo positivo. En consecuencia, para ubicar la región de rechazo, se pueden simplificar los cálculos considerando que dicha región se ubica en la cola derecha de la función. Prueba de los números aleatorios. La generación de números aleatorios es el proceso mediante el cual se genera una muestra tan larga como se requiera siguiendo una distribución de probabilidad determinada. Estas series de datos son de gran ayuda para la caracterización de fenómenos complejos. En Hidrología, este método está enfocado hacia las series de volúmenes de escurrimientos y precipitaciones. Con esta prueba, se verificará la viabilidad de que la muestra pertenezca a la población o se descartará definitivamente. Esquemáticamente se representa este proceso en la Figura: C- Métodos de Estimación La fase más importante en la utilización de información regional es la de definir las estaciones de precipitación o caudal que se consideran similares entre sí, y que puedan ser agrupadas según el grado de heterogeneidad que se quiera asumir para tener un beneficio en el tratamiento conjunto de la información. Aunque no existe un procedimiento que asegure correctamente la definición de una región para el análisis de precipitación o caudal. El objetivo de los métodos estadísticos regionales es permitir establecer regiones homogéneas para la estimación de caudal o lluvia en puntos sin medición, así como permitir un tratamiento más robusto con el conjunto de estaciones que se consideren homogéneas. Estos métodos requieren tres fases en su aplicación: Identificar la región, establecer características conocidas de las estaciones (coordenadas, altitud, edafología, climatología, etc) y los parámetros o estadísticos a estimar. Ferrer (1996) cita que estas condiciones definen tres tipos de métodos para la delimitación de regiones: el geográfico, el estadístico y el de regiones de características específicas. C.1) El método geográfico: consiste en agrupar las estaciones en función de sus coordenadas, frecuentemente, coincidiendo con divisiones administrativas. Tiene la ventaja de permitir asignar un punto sin registro pluviométrico o una cuenca sin datos de caudal. Sin embargo, puede plantear problemas con la homogeneidad de la región. Debido a la relativa continuidad espacial de las lluvias, es más coherente definir regiones geográficas en un análisis de lluvias que en uno de caudal, porque en este último, las cuencas vecinas, pueden presentar entre otras, características edafológicas, geológicas, o de cobertura vegetal diferentes. C.2) El método estadístico: permite clasificar las estaciones según su comportamiento estadístico, para definir los grupos homogéneos. A diferencia del anterior, emplea algoritmos automáticos de análisis discriminante, factorial o de cluster. Algunos métodos estadísticos son: Cluster Jerarquizado: Sus algoritmos agrupan estaciones progresivamente, clasificándolas en diferentes grupos, hasta minimizar la suma total del cuadrado de las distancias de cada una al centroide de cada grupo en diferentes etapas. Esto conduce normalmente, a una o dos regiones importantes con pequeños grupos en la periferia. Así lo mencionan Mosley (1981) y Acreman y Sinclair (1986). El método ofrece mejores resultados en lluvias. desventajas del método: 1- definición arbitraria del número de regiones a obtener, por la falta de fronteras claras. Esto se resuelve tratando de obtener regiones homogéneas aplicando test estadísticos u obteniendo una representación geográfica coherente de las mismas. 2- dificultad para asignar un punto sin registros de determinada región en un conjunto de regiones previamente definidas porque no se conocen los valores estadísticos empleados como discriminantes en la clasificación. Esto se resuelve en el caso de lluvias, si la clasificación estadística tiene una adecuada correspondencia geográfica, mientras que en el caso de caudal, se resuelve si se encuentran relaciones entre las características estadísticas discriminantes y determinadas características específicas de las cuencas: fisiográficas, meteorológicas, etc. 3- Otro inconveniente es que emplea estadísticos muestrales que tienen asociados una elevada varianza. En este sentido, las agrupaciones realizadas pueden amplificar artificialmente unas diferencias entre regiones que en gran parte pueden deberse a un simple efecto aleatorio. Análisis Discriminante: Este método permite asignar una estación a un grupo definido a priori en función de una serie de características del mismo. La base de dicho análisis consiste en establecer una función discriminante que permita clasificar las variables en los diferentes grupos. Hay tantas funciones discriminantes como grupos menos uno (k – 1) y para que sean óptimas han de proporcionar una regla de clasificación que minimice la probabilidad de cometer errores. Obtenidas las cargas discriminantes, se obtiene una clasificación de las variables basada en el teorema de Bayes, y la probabilidad que una estación con una puntuación discriminante determinada pertenezca a uno u otro grupo se estima a través de: P(Gi / D) Siendo: P( D / Gi) P(Gi) P( D / Gi) P(Gi) P (Gi): Probabilidad previa de que una estación pertenezca a un grupo determinado de la muestra. P(D/Gi): Probabilidad condicional de obtener determinada puntuación discriminante bajo el supuesto que la misma pertenezca a otro grupo. P(Gi/D): Probabilidad posterior, que se calcula con el teorema de Bayes, permitiendo asignar a cada sujeto al grupo en el cual su probabilidad posterior es mayor. La discriminación entre los k grupos se realiza mediante el cálculo de las funciones discriminantes. C.3) método de características específicas: es muy empleado en análisis de caudal y menos en lluvia, dada la necesidad de estimar caudal en cuencas sin aforo cuando sólo se dispone de las características fisiográficas, edafológicas y meteorológicas. Asumiendo grupos previos con criterios estadísticos, el análisis discriminante asume que las características específicas seleccionadas siguen una distribución normal adimensional y que su matriz de covarianzas es común para todos. Bajo estas hipótesis se aplica el teorema de Bayes para obtener la probabilidad de que una estación con unas características específicas dadas pertenezca a un grupo preexistente, asignando finalmente la estación al punto con mayor probabilidad de pertenencia. En este método se emplean unas características específicas que luego clasifican aplicando análisis factorial, cluster o discriminante. D) Combinación de Información Disponible En un proyecto de regionalización, la estimación de la variable hidrológica en un sitio con pocas o ninguna medición siempre está sujeta a incertidumbre. Esta incertidumbre puede residir en la elección de la región a la que pertenece el sitio estudiado o en la elección del modelo utilizado para estimar la variable considerada (por ejemplo, modelo empírico, de frecuencia regional o de regresión múltiple). Si se dispone de varios años de mediciones para el sitio, la estimación puede basarse en un método regional o únicamente en datos observados dependiendo de las opciones de modelado y los métodos de estimación seleccionados, por lo tanto, son posibles diferentes estimaciones de la variable de interés. Entre los diferentes métodos que utiliza parte o toda la información disponible, el método Bayesiano es ampliamente utilizado. En lugar de utilizar una única estimación y excluir todas las demás consideradas a priori menos probables, este método puede combinar las diferentes estimaciones posibles de la variable de interés, teniendo en cuenta las incertidumbres asociadas. El teorema de Bayes, tiene su base teórica estadística, en la definición matemática de probabilidad condicional. Así, el teorema especifica la relación entre la probabilidad de dos entidades o eventos y sus respectivas probabilidades condicionales. En lo práctico, el teorema permite actualizar las probabilidades de eventos no observados, dados otros eventos relacionados que si han sido observados. Es decir, el teorema de Bayes es un algoritmo de actualización, que nos proporciona los datos posteriores de parámetros, mediante la combinación de dos fuentes de información sobre dichos parámetros: La distribución de probabilidad a priori de los parámetros (en adelante prior) y los datos observados. Por lo tanto, el teorema Bayes resumen en los datos posterior todo el conocimiento que se tiene sobre los parámetros, y no solo el originado por las observaciones. Enfoque Bayesiano El marco Bayesiano utiliza una distribución de probabilidad para describir lo que se sabe sobre una cantidad de interés, en nuestro caso el interés se encuentra en la implementación de la metodología de regionalización. Consiste en utilizar estimaciones de diferentes modelos para actualizar una distribución anterior de la variable de interés. La distribución previa se puede interpretar como el estado del conocimiento antes de que se utilice la información del modelo. Puede ser poco informativo si se reflexiona sobre este conocimiento es nulo. Si se dispone de varios modelos de estimación, esta distribución se actualiza de forma secuencial utilizando sucesivamente la información proporcionada por los diferentes modelos. La estimación bayesiana de la variable de interés es, por lo tanto, una combinación de las estimaciones obtenidas respectivamente sobre la base de la distribución previa y de diversos modelos. El procesador Bayesiano asociado con este enfoque calcula no solo el valor esperado de la variable, sino también una estimación de la distribución y la varianza posteriores. La varianza posterior es siempre menor que la varianza anterior, el factor de reducción de la varianza depende del desempeño de cada uno de los individuales modelos (desempeño tomado en cuenta por la función de verosimilitud) y la interdependencia condicional verdadero valor de la variable de interés (es decir, sobre la correlación entre los errores de los modelos de estimación). La ausencia de independencia condicional es automáticamente penalizada por el procesador bayesiano. En general, la probabilidad de que ocurra este problema aumenta con el número de modelos considerados (porque no hay un número infinito de modelos independientes diferentes). Si la varianza posterior no disminuye significativamente cuando se agrega un modelo, el proceso de actualización bayesiano se puede considerar agotado y en una nueva actualización no serviría de nada. El enfoque bayesiano es particularmente útil cuando los modelos son complementarios es alimentado por diferente información, como la informacion hidrométrica local para análisis de frecuencia, información meteorológica para modelos de lluvia-escorrentía e información sobre la relación entre las inundaciones y las características fisiográficas de las cuencas hidrográficas para modelos regionales. El intercambio de información regional (Fill y Stedinger, 1998), información histórica (Parent y Bemier, 2003) o, cuando está disponible, información del sitio es a menudo de interés porque generalmente da como resultado una estimación más robusta de la variable considerada (Kuczera, 1982b). Además, este enfoque tiene en cuenta explícitamente cualquier heterogeneidad en la región considerada (Rasmussen et al., 1994). Se han realizado muchos estudios utilizando este enfoque. Se pueden encontrar varios ejemplos en Kuczera (1982a, b, 1983), Madsen y Rosbjerg (1997), Fill y Stedinger (1998), Kuczera (1999) o Parent y Bernier (2003). Wood y Rodríguez-Iturbe (1975b) han utilizado, por ejemplo, el enfoque bayesiano para producir una combinación lineal de las distribuciones de descargas de crecidas obtenidas sobre la base de diferentes modelos de frecuencia. La ponderación del modelo puede variar según la aplicación de campo considerada. El enfoque bayesiano propuesto por Niggli y Musy (2005) para la estimación de descargas de inundaciones toma en consideración, por ejemplo, el hecho de que el método racional es a menudo mejor que el método regional de inundación índice para pequeñas cuencas de drenaje. En conclusión, el enfoque bayesiano tiene la ventaja particular de generalizar los diferentes métodos de combinación propuestos en la literatura. Por ejemplo, la media aritmética simple de las estimaciones del modelo, propuesta por ejemplo por Weingartner y Manser (1997), se puede obtener considerando que: 1) Todos los modelos son imparciales 2) Sus estimaciones son condicionalmente independientes del valor verdadero de la variable de interés (en otras palabras, los errores de los modelos de estimación de crecidas pueden estar inter-correlacionados) 3) La varianza de los errores de los modelos 1, 2, .., n es la misma para todos 4) La varianza previa es infinita. Beneficios del Enfoque Bayesiano: Combina la información priori de un fenómeno, con la verosimilitud de este, para producir la distribución a posteriori. Calcula intervalos de credibilidad Útil para analizar big data: integra información en distintos formatos. Teorema Bayesiano E) Ejemplo 1. Se puede tener una red de estaciones hidrométricas a lo largo de una región, pero esta red difícilmente cubre todos los puntos para una adecuada evaluación del recurso hídrico, es decir, que se pueden presentar algunas lagunas temporales o espaciales, que deberán ser predichas en base a metodologías entre las cuales destaca la regionalización. La metodología de regionalización es utilizada en hidrología para explorar al máximo la información hidrológica existente y permitir la transferencia de dicho. CONCLUSIONES 1. La regionalización no solo permite conocer el comportamiento hidrológico en un punto determinado de una región, por medio de la transferencia de información de otro punto de la misma región, sino que además brinda información respecto al número de estaciones que se tiene en la región o de la información almacenada, respecto a si es suficiente o no. 2. Los métodos de estimación empleados en los métodos de regionalización, se conforman de tres categorías, dentro de ellas está el estadístico (cluster jerarquizado) que es el más empleado por los profesionales que desean saber datos de una cuenca que carece de ellos. 3. El método geográfico tiene mejores resultados para lluvia que para caudal, esto debido a que una lluvia puede darse de manera espacial en varias porciones de una región, en cambio el caudal puede influenciarse por características geológicas, edafológicas… REFERENCIAS BIBLIOGRÁFICAS Aparicio y Gutiérrez. (Marzo, 2020). Las Seis reglas de la regionalización hidrológica. AquaLAC, 12, 81-89. A. Erazo. (2004). Regionalización de caudales máximos y medios. 2020, de SNT sitio web: http://www.snet.gob.sv/hidrologia/caudales.pdf https://repository.ucatolica.edu.co/bitstream/10983/23861/1/1.%20TRABAJO%20DE%20G RADO.pdf https://pirhua.udep.edu.pe/bitstream/handle/11042/1858/MAS_ICIH_001.pdf?sequence=3 &isAllowed=y