Selección de Indicadores a aplicar a series sintéticas Énfasis en

Anuncio
Informe Final PR_FSE_2009_ 1_31
Anexo I
Selección de Indicadores a aplicar a series sintéticas
Énfasis en propiedades de memoria larga
Los modelos de optimización usados para despacho y planificación energética
requieren de un modelo que represente el universo posible de caudales de aporte a las
represas que describen la incertidumbre que enfrenta el sistema. Cualquiera sea las
características del modelo, es deseable que el mismo refleje propiedades estadísticas
clave de la serie histórica de caudales en la cuales será entrenado.
Es necesario entonces definir indicadores de dichas propiedades estadísticas que
puedan ser usados para evaluar los modelos que hoy se usan, modificaciones de los
mismos incorporando información climática o alternativas que se puedan plantear. El
trabajo de selección de indicadores se realizó en base al intercambio entre todo el
equipo de trabajo, en particular aquellos con experiencia en el manejo de los modelos
de optimización y los procesos estocásticos usados para sintetizar series de aportes.
Se definieron 3 indicadores de creciente complejidad: un escalar (coeficiente de Hurst),
una función de una variable (la función de autocorrelación) y una función de dos
variables (la relación intensidad-duración-frecuencia de eventos, en particular sequías).
Índice de Hurst
En la búsqueda de alguna familia de procesos estocásticos para modelar la serie se
concluyó que el mismo debe ser de "memoria larga". Esencialmente un proceso de
memoria larga, significa que los términos de cada serie dependen de buena parte de
sus términos anteriores. Un parámetro clave útil para determinar si un proceso es de
memoria larga es el parámetro de Hurst; si el coeficiente de Hurst del proceso es mayor
que 1/2, se trata de un proceso de memoria larga, en caso contrario de memoria corta.
En la literatura actual existen varios métodos distintos para estimar el coeficiente de
Hurst, se probaron cuatro de ellos: el más popular es el método R/S, con el que se
obtuvo en este caso una estimación de 0.8366.
Según el método de la varianza agregada, en tres situaciones distintas, se obtuvieron
estimaciones de 0.686; 0.6832 y 0.6869, según el método de Higuchi también en tres
situaciones distintas se obtuvo 0.9519; 0.9482 y 0.9443, mientras que según el método
del periodograma se obtuvo una estimación de 0.8459. Las diferencias significativas
que existen entre estas estimaciones, nos hablan a las claras de la dificultad de tratar
con una serie de tiempo de estas características, por otro lado hemos constatado que
muy comúnmente en la literatura de las series de tiempo hidrológicas aparecen dichas
diferencias en la estimación del coeficiente de Hurst según los métodos aquí aplicados.
En cualquier caso, estas estimaciones nos permiten concluir que lo adecuado sería
buscar un modelo de memoria larga, ya que en todos los casos, la estimación del
coeficiente de Hurst, supera largamente el valor 1/2. Creemos que un modelo que nos
podría dar buenos resultados en este caso es un modelo FARIMA, dado que los
Informe Final PR_FSE_2009_ 1_31
Anexo I
mismos tienen la importante propiedad de tener en consideración tanto la memoria
larga como la memoria corta (que obviamente influye y mucho en la serie de tiempo
estudiada).
Figura 1. Estimación del índice de Hurst para la serie de aportes complexitos según métodos R/S
Función de autocorrelación
La función de autocorrelación (correlación de la serie consigo misma en función de un
desplazamiento) es una medida clásica para detectar periodicidades en una serie y
también procesos de memoria larga. En el caso de las series de aportes, existe una
periodicidad dominante que es la dada por el ciclo anual. Si la función de correlación es
calculada sobre las series brutas (sin removerle ciclo anual) el mismo dominará los
resultados.
Será de interés aplicar los indicadores a series sintetizadas por un proceso estocástico.
Una dificultad radica en que la serie histórica es una única realización que se debe
evaluar si cae dentro de la dispersión de series sintéticas. Es así que para presentar
resultados se incluye no sólo la serie histórica de aportes sino también 100 series
simuladas por el CEGH (Correlación es Espacio Gaussiano con Histograma),
sintetizador de series del SimSEE (Simulador de Sistemas de Energía Eléctrica). La
idea no es aún evaluar el CEGH, sino presentar los indicadores aplicados a la serie
histórica en el contexto de una pluma de simulaciones de un sintetizador. Se presentan
a continuación, a modo de ejemplo, los resultados para 100 años de la serie de aportes
de Salto Grande.
Informe Final PR_FSE_2009_ 1_31
Anexo I
Figura 2. Función de autocorrelación de la serie bruta de aportes de Salto Grande (rojo) y de 100 series
simuladas por el CEGH (se indican la mediana, los cuartiles y los percentiles 10 y 90) pasadas a espacio
real. Para referencia se incluye (en verde) la autocorrelación de lag una semana elevada al número de
semanas, representando la función de autocorrelación de un proceso autoregresivo de orden 1.
Existen diversos abordajes para remover el ciclo anual (desestacionalizar) la serie
histórica. Si se quiere que toda la distribución de aportes en cada semana sean
idénticas (no solo la media o la desviación estándar), un método posible es llevar todas
las distribuciones a normales. Eso es exactamente lo que hace CEGH, aunque el
método es extensivo a cualquier simulador que no trabaje en espacio gaussiano.
Dichas transformación consiste en funciones no lineales (una por semana) que
deforman la amplitud y llevan la distribución observada a normal. Se aplicó dicho
procedimiento a la serie observada en Salto Grande (la misma de la figura anterior) y se
compara la función de autocorrelación con las mimas 100 simulaciones con el CEGH,
ahora sin retornar las series al espacio real.
Figura 3. Función de autocorrelación de la serie desestacionalizada de aportes de Salto Grande (rojo) y
de 100 series simuladas por el CEGH (se indican la mediana, los cuartiles y los percentiles 10 y 90).
Para referencia se incluye (en verde) la autocorrelación de lag una semana elevada al número de
semanas, representando la función de autocorrelación de un proceso autoregresivo de orden 1.
Informe Final PR_FSE_2009_ 1_31
Anexo I
Como es de esperar, desaparece las señales asociadas al ciclo anual. Se detecta una
caída de la correlación más lenta que en un proceso autoregresivo de orden 1 (y que el
CEGH) en particular para antelaciones entre dos y ocho meses aproximadamente. Esta
es una limitante del modelo que es resaltada por este indicador y que posiblemente
esté asociada a la ausencia de información sobre el fenómeno de El Niño, el cual tiene
persistencias en dichas escalas de tiempo. En el trabajo futuro se podrá evaluar si la
incorporación de información asociada a El Niño a los modelos corrige este aspecto.
Curvas de Intensidad-Duración-Frecuencia de Sequías
Surge muy claramente de los operadores del sistema la importancia de que los modelos
representen adecuadamente la frecuencia y profundidad de los períodos de bajos
aportes. Se acordó entonces una forma de representar este espacio de ProfundidadDuración-Frecuencia de sequías en gráficas que presentan intensidad (normalizada por
la mediana para dicha duración) en función de la duración de los eventos con
frecuencia dada (por ejemplo por su percentil).
Figura 4. Intensidad (como fracción de la mediana de los eventos de la misma duración) en función de la
duración para eventos de frecuencia dada (mínimo histórico, 5, 10 y 25 percentil). La línea gruesa
corresponde al registro histórico y los sombreados al intervalo intercuartil y 10yil-90til de las series
simuladas, respectivamente.
Informe Final PR_FSE_2009_ 1_31
Anexo I
Nuevamente, se presentan los resultados de la serie histórica de Salto Grande junto al
de 100 series simuladas por el CEGH. Se muestran solo los resultados para la mitad
más seca de eventos por ser los de mayor interés. Salvo para el mínimo histórico se
verifica que la realización observada transcurre dentro de la dispersión simulada. De
nuevo en los períodos de algunos meses se observa, sin embargo, que el registro
histórico permanece para un amplio intervalo de duraciones por debajo del percentil 10
de las simulaciones.
Para ver en más detalle estos aspectos se pueden realizar cortes a la gráfica anterior
para una duración del evento especificada, lo cual conduce a las tradicionales curvas
de probabilidad de excedencia de caudales. Explorando diferentes duraciones se
obtiene una descripción muy completa del espacio Profundidad-Duración-Frecuencia de
los eventos de sequía.
A continuación se muestra un caso particular para duraciones de un año (52 semanas).
En la misma se observa que, para dicha duración, la curva de excedencia del registro
histórico es muy próxima a la mediana de las simulaciones excepto para los eventos
extremos (2% más secos y 4% más húmedos, aproximadamente). En dichas “colas”,
los aportes observados se escapan a la dispersión simulada siempre en el sentido de
acentuar la profundidad del evento, tantos en los casos húmedos como secos.
Figura 5. Probabilidad de excedencia de aportes para períodos móviles de 52 semanas. La línea roja
corresponde al registro histórico, la amarilla a la mediana de las 100 simulaciones y los sombreados al
intervalo intercuartil y 10yil-90til de las series simuladas, respectivamente. Se incluyen zooms de las
colas de la distribución.
Descargar