Informe Final PR_FSE_2009_ 1_31 Anexo I Selección de Indicadores a aplicar a series sintéticas Énfasis en propiedades de memoria larga Los modelos de optimización usados para despacho y planificación energética requieren de un modelo que represente el universo posible de caudales de aporte a las represas que describen la incertidumbre que enfrenta el sistema. Cualquiera sea las características del modelo, es deseable que el mismo refleje propiedades estadísticas clave de la serie histórica de caudales en la cuales será entrenado. Es necesario entonces definir indicadores de dichas propiedades estadísticas que puedan ser usados para evaluar los modelos que hoy se usan, modificaciones de los mismos incorporando información climática o alternativas que se puedan plantear. El trabajo de selección de indicadores se realizó en base al intercambio entre todo el equipo de trabajo, en particular aquellos con experiencia en el manejo de los modelos de optimización y los procesos estocásticos usados para sintetizar series de aportes. Se definieron 3 indicadores de creciente complejidad: un escalar (coeficiente de Hurst), una función de una variable (la función de autocorrelación) y una función de dos variables (la relación intensidad-duración-frecuencia de eventos, en particular sequías). Índice de Hurst En la búsqueda de alguna familia de procesos estocásticos para modelar la serie se concluyó que el mismo debe ser de "memoria larga". Esencialmente un proceso de memoria larga, significa que los términos de cada serie dependen de buena parte de sus términos anteriores. Un parámetro clave útil para determinar si un proceso es de memoria larga es el parámetro de Hurst; si el coeficiente de Hurst del proceso es mayor que 1/2, se trata de un proceso de memoria larga, en caso contrario de memoria corta. En la literatura actual existen varios métodos distintos para estimar el coeficiente de Hurst, se probaron cuatro de ellos: el más popular es el método R/S, con el que se obtuvo en este caso una estimación de 0.8366. Según el método de la varianza agregada, en tres situaciones distintas, se obtuvieron estimaciones de 0.686; 0.6832 y 0.6869, según el método de Higuchi también en tres situaciones distintas se obtuvo 0.9519; 0.9482 y 0.9443, mientras que según el método del periodograma se obtuvo una estimación de 0.8459. Las diferencias significativas que existen entre estas estimaciones, nos hablan a las claras de la dificultad de tratar con una serie de tiempo de estas características, por otro lado hemos constatado que muy comúnmente en la literatura de las series de tiempo hidrológicas aparecen dichas diferencias en la estimación del coeficiente de Hurst según los métodos aquí aplicados. En cualquier caso, estas estimaciones nos permiten concluir que lo adecuado sería buscar un modelo de memoria larga, ya que en todos los casos, la estimación del coeficiente de Hurst, supera largamente el valor 1/2. Creemos que un modelo que nos podría dar buenos resultados en este caso es un modelo FARIMA, dado que los Informe Final PR_FSE_2009_ 1_31 Anexo I mismos tienen la importante propiedad de tener en consideración tanto la memoria larga como la memoria corta (que obviamente influye y mucho en la serie de tiempo estudiada). Figura 1. Estimación del índice de Hurst para la serie de aportes complexitos según métodos R/S Función de autocorrelación La función de autocorrelación (correlación de la serie consigo misma en función de un desplazamiento) es una medida clásica para detectar periodicidades en una serie y también procesos de memoria larga. En el caso de las series de aportes, existe una periodicidad dominante que es la dada por el ciclo anual. Si la función de correlación es calculada sobre las series brutas (sin removerle ciclo anual) el mismo dominará los resultados. Será de interés aplicar los indicadores a series sintetizadas por un proceso estocástico. Una dificultad radica en que la serie histórica es una única realización que se debe evaluar si cae dentro de la dispersión de series sintéticas. Es así que para presentar resultados se incluye no sólo la serie histórica de aportes sino también 100 series simuladas por el CEGH (Correlación es Espacio Gaussiano con Histograma), sintetizador de series del SimSEE (Simulador de Sistemas de Energía Eléctrica). La idea no es aún evaluar el CEGH, sino presentar los indicadores aplicados a la serie histórica en el contexto de una pluma de simulaciones de un sintetizador. Se presentan a continuación, a modo de ejemplo, los resultados para 100 años de la serie de aportes de Salto Grande. Informe Final PR_FSE_2009_ 1_31 Anexo I Figura 2. Función de autocorrelación de la serie bruta de aportes de Salto Grande (rojo) y de 100 series simuladas por el CEGH (se indican la mediana, los cuartiles y los percentiles 10 y 90) pasadas a espacio real. Para referencia se incluye (en verde) la autocorrelación de lag una semana elevada al número de semanas, representando la función de autocorrelación de un proceso autoregresivo de orden 1. Existen diversos abordajes para remover el ciclo anual (desestacionalizar) la serie histórica. Si se quiere que toda la distribución de aportes en cada semana sean idénticas (no solo la media o la desviación estándar), un método posible es llevar todas las distribuciones a normales. Eso es exactamente lo que hace CEGH, aunque el método es extensivo a cualquier simulador que no trabaje en espacio gaussiano. Dichas transformación consiste en funciones no lineales (una por semana) que deforman la amplitud y llevan la distribución observada a normal. Se aplicó dicho procedimiento a la serie observada en Salto Grande (la misma de la figura anterior) y se compara la función de autocorrelación con las mimas 100 simulaciones con el CEGH, ahora sin retornar las series al espacio real. Figura 3. Función de autocorrelación de la serie desestacionalizada de aportes de Salto Grande (rojo) y de 100 series simuladas por el CEGH (se indican la mediana, los cuartiles y los percentiles 10 y 90). Para referencia se incluye (en verde) la autocorrelación de lag una semana elevada al número de semanas, representando la función de autocorrelación de un proceso autoregresivo de orden 1. Informe Final PR_FSE_2009_ 1_31 Anexo I Como es de esperar, desaparece las señales asociadas al ciclo anual. Se detecta una caída de la correlación más lenta que en un proceso autoregresivo de orden 1 (y que el CEGH) en particular para antelaciones entre dos y ocho meses aproximadamente. Esta es una limitante del modelo que es resaltada por este indicador y que posiblemente esté asociada a la ausencia de información sobre el fenómeno de El Niño, el cual tiene persistencias en dichas escalas de tiempo. En el trabajo futuro se podrá evaluar si la incorporación de información asociada a El Niño a los modelos corrige este aspecto. Curvas de Intensidad-Duración-Frecuencia de Sequías Surge muy claramente de los operadores del sistema la importancia de que los modelos representen adecuadamente la frecuencia y profundidad de los períodos de bajos aportes. Se acordó entonces una forma de representar este espacio de ProfundidadDuración-Frecuencia de sequías en gráficas que presentan intensidad (normalizada por la mediana para dicha duración) en función de la duración de los eventos con frecuencia dada (por ejemplo por su percentil). Figura 4. Intensidad (como fracción de la mediana de los eventos de la misma duración) en función de la duración para eventos de frecuencia dada (mínimo histórico, 5, 10 y 25 percentil). La línea gruesa corresponde al registro histórico y los sombreados al intervalo intercuartil y 10yil-90til de las series simuladas, respectivamente. Informe Final PR_FSE_2009_ 1_31 Anexo I Nuevamente, se presentan los resultados de la serie histórica de Salto Grande junto al de 100 series simuladas por el CEGH. Se muestran solo los resultados para la mitad más seca de eventos por ser los de mayor interés. Salvo para el mínimo histórico se verifica que la realización observada transcurre dentro de la dispersión simulada. De nuevo en los períodos de algunos meses se observa, sin embargo, que el registro histórico permanece para un amplio intervalo de duraciones por debajo del percentil 10 de las simulaciones. Para ver en más detalle estos aspectos se pueden realizar cortes a la gráfica anterior para una duración del evento especificada, lo cual conduce a las tradicionales curvas de probabilidad de excedencia de caudales. Explorando diferentes duraciones se obtiene una descripción muy completa del espacio Profundidad-Duración-Frecuencia de los eventos de sequía. A continuación se muestra un caso particular para duraciones de un año (52 semanas). En la misma se observa que, para dicha duración, la curva de excedencia del registro histórico es muy próxima a la mediana de las simulaciones excepto para los eventos extremos (2% más secos y 4% más húmedos, aproximadamente). En dichas “colas”, los aportes observados se escapan a la dispersión simulada siempre en el sentido de acentuar la profundidad del evento, tantos en los casos húmedos como secos. Figura 5. Probabilidad de excedencia de aportes para períodos móviles de 52 semanas. La línea roja corresponde al registro histórico, la amarilla a la mediana de las 100 simulaciones y los sombreados al intervalo intercuartil y 10yil-90til de las series simuladas, respectivamente. Se incluyen zooms de las colas de la distribución.