ESTACIONALIDAD EN DATOS HORARIOS. LA DEMANDA DE ENERGÍA ELÉCTRICA EN ESPAÑA MARTÍN RODRÍGUEZ, Gloria gmartinr@ull.es CÁCERES HERNÁNDEZ, José Juan jcaceres@ull.es Departamento de Economía de las Instituciones, Estadística Económica y Econometría Universidad de La Laguna RESUMEN En este trabajo se proponen procedimientos apropiados para modelar los movimientos periódicos simultáneos presentes en datos horarios. Se recurre a los modelos estructurales como aproximación adecuada para captar las inestabilidades que suelen observarse en series de alta frecuencia. Las funciones splines se incorporan en el modelo con objeto de proporcionar formulaciones de las variaciones estacionales que, además de ser más parsimoniosas que las formulaciones convencionales, ofrecen la posibilidad de tratar el patrón estacional anual en presencia de años bisiestos. Para ilustrar su utilidad, la metodología propuesta se ha aplicado a una serie horaria de demanda de energía eléctrica en España. Palabras clave: datos horarios, modelos estructurales, splines, demanda eléctrica. 1. Introducción Cada vez se acepta con mayor unanimidad entre los economistas que la estacionalidad es responsable de una parte importante de la variabilidad mostrada por una serie temporal económica y, por lo tanto, no debe ser ignorada en los modelos para el análisis económico. De ahí que hayan proliferado en los últimos años nuevos modelos de la estacionalidad y, sobre todo, se haya producido un cambio de orientación, prestándose mayor atención al objetivo de especificar la estacionalidad, frente al objetivo de eliminarla para evitar que contamine a otros componentes. En cualquier caso, no existe un acuerdo unánime sobre el concepto de estacionalidad ni sobre cómo debe ser tratada en los trabajos empíricos y teóricos. Y en el caso particular de datos de muy alta frecuencia cabe pensar en la necesidad de replantear algunas nociones. Es evidente que una agregación temporal excesiva puede impedir que se aprecien determinados comportamientos o respuestas dinámicas. Y salvo que el objetivo del análisis no vaya más allá de la descripción de tendencias generales en el largo plazo, la elección de la frecuencia con la que se observan los datos es un elemento determinante del éxito del estudio. En este sentido, el uso más extendido de series temporales con mayor frecuencia de observación en la literatura estadísticoeconométrica es, sin duda, una medida del progreso de la economía aplicada. Sin embargo, el estudio de series semanales, diarias u horarias introduce un elemento de complejidad cuyo tratamiento requiere nuevos enfoques metodológicos. En series de alta frecuencia suelen coexistir fluctuaciones de distinto periodo que deben ser tenidas en cuenta para especificar correctamente la estacionalidad. Del mismo modo que la percepción de la tendencia en series económicas puede alterarse si se ignora la presencia de la fluctuación cíclica, esta misma variación puede incidir, a su vez, en la identificación de la variación estacional; y más factible aún resulta la incorrecta evaluación de la magnitud de una fluctuación estacional si otras fluctuaciones de periodo distinto no son especificadas explícitamente. Esta circunstancia obliga a recurrir a una especificación que permita la estimación simultánea de todas las variaciones estacionales presentes, que pueden introducirse como determinísticas o estocásticas. En este sentido, las formulaciones convencionales pueden combinarse con las funciones splines, que suponen, en general, un ahorro computacional significativo y pueden, de hecho, ser la única vía posible de estimación. 2 En el ámbito del análisis de series temporales, las splines aproximan el comportamiento de otras funciones en periodos de tiempo dados. Aunque las funciones splines son una herramienta tradicional1, muchos de los desarrollos teóricos deben ser adaptados cuando la magnitud que se intenta aproximar es cualquiera de las variaciones periódicas de una serie temporal. El objetivo de este trabajo es proponer un procedimiento específico, que se desarrolla en la sección segunda, para estimar la variación estacional anual en series temporales horarias, caracterizadas por la inconstancia del periodo en el que se completa dicha fluctuación en presencia de años bisiestos. En la tercera sección, el procedimiento desarrollado se aplica a una serie horaria de demanda de energía eléctrica en España. Finalmente, se presentan las principales conclusiones. 2. Funciones splines y variación estacional en datos horarios En una serie horaria, la variación de periodo anual, aunque se asuma la estabilidad de ésta a lo largo de los años, difícilmente podrá ser estimada a través de un sencillo modelo de variables cualitativas. Ahora bien, si el patrón estacional de período anual se ajusta a una curva relativamente suave, dicho patrón puede ser descrito de forma parsimoniosa mediante las denominadas funciones splines, que determinan la variación estacional registrada en una observación determinada de la serie como función de la estación a la que pertenece dicha observación. Otro aspecto interesante cuando se trabaja con datos horarios es la heterogeneidad del patrón estacional en presencia de años bisiestos, puesto que la longitud del periodo en que se completa la variación anual no permanece constante. Sin embargo, las funciones splines permiten abordar estas situaciones particulares dado que constituyen una herramienta más flexible que otras formulaciones. A continuación se propone un método para tratar esta heterogeneidad. La variación estacional anual se recoge a través de una función spline cúbica periódica obtenida a partir de la optimización de una función relativa al error cometido en el ajuste, sin que se exija el paso por determinados puntos2. Debe tenerse en cuenta que esta fluctuación se completa en un período de 8760 horas para años no bisiestos y 8784 1 Véase Poirier (1973, 1976), De Boor (1978), Marsh (1983, 1986), Marsh et al. (1990) y Monahan (2001). 2 La propuesta realizada en este trabajo se sitúa en la línea original de Poirier (1973, 1976), frente a la propuesta de Koopman (1992) y Harvey et al. (1997), en la que la función spline es forzada a pasar por ciertos puntos o nodos. 3 para años bisiestos. Entonces, una vez formulada una spline que aproxime el patrón estacional en un año no bisiesto, puede obtenerse una aproximación del patrón estacional en un año bisiesto mediante la imposición de adecuadas condiciones de continuidad. 2.1. Procedimiento para estimar la variación anual en años no bisiestos Suponga que los valores y t de la serie observada han sido adecuadamente filtrados para eliminar la variación tendencial y las variaciones estacionales diferentes de la anual. Sea tanual la variación estacional anual en el instante t. Para recoger la variación anual en un año no bisiesto por medio de una spline cúbica periódica, puede asumirse, como hipótesis preliminar, que la estacionalidad es determinística3; es decir, t anual h anual h si la observación en el instante t corresponde a la hora h a del año, a 1, ..., 8760 a . Una vez que se han eliminado las observaciones horarias correspondientes al 29 de febrero de cada año bisiesto, una estimación preliminar del patrón estacional puede obtenerse mediante el cálculo de medias por hora para cada una de las 8760 horas del año. Sea ˆ1anual ,h a a h 1 ,..., 8760 el conjunto de medias por hora corregidas de forma que la suma de los efectos estacionales correspondientes a las 8760 horas del año sea nula. Entonces, ˆ anual 1,t ˆ anual 1, h a a h 1 ,.., 8760 (1) si la observación en el instante t corresponde a la hora h a . Para recoger el componente ˆ1, h anual a , h a 1, ..., 8760 , puede emplearse una spline cúbica periódica g a ( h a ) , definida como g ( h ) g i ( h ) g i,0 g i,1 h g i,2 h a a a a a 2 g i,3 h a 3 , h ia1 h a h ia , i 1, ..., k , (2) con h 0a 1 y h ka 8 760 . Esta spline debe satisfacer las condiciones de continuidad tradicionales. Sin embargo, el carácter periódico se asegura mediante la imposición de condiciones adicionales. El conjunto final de restricciones es: 3 El supuesto de comportamiento determinístico se introduce con objeto de simplificar la exposición del procedimiento. Un patrón estacional que evolucione en el tiempo puede recogerse, sin abandonar la aproximación desarrollada, utilizando una spline estocástica. 4 a) continuidad de la función, g a , g i , 0 g i ,1 h i g i , 2 h i a a 2 g i , 3 h i a g i 1 , 0 g i 1 ,1 h i g i 1 , 2 h i 3 a a g i 1 , 3 h i ; (3b) 2 a 3 , (3a) para i 1,..., k 1 , y g k , 0 g k ,1 h k 1 g k , 2 h k 1 g k , 3 h k 1 g 1 , 0 g 1 ,1 h 0 g 1 , 2 h 0 a 2 a 3 a a a g 1 , 3 h 0 2 a 3 b) continuidad de la primera derivada, g a , g i ,1 2 g i , 2 h i 3 g i , 3 h i a a g i 1 ,1 2 g i 1 , 2 h i 3 g i 1 , 3 h i 2 a a 2 , (3c) para i 1,..., k 1 , y g k ,1 2 g k , 2 h k 1 3 g k , 3 h k 1 a a 2 ; a 2 g 1 ,1 2 g 1 , 2 h 0 3 g 1 , 3 h 0 a (3d) c) continuidad de la segunda derivada, 2 g a , 2 g i , 2 6 g i , 3 hi 2 g i 1, 2 6 g i 1, 3 hi a a , (3e) para i 1,..., k 1 , y 2 g k , 2 6 g k , 3 h k 1 2 g 1, 2 6 g 1, 3 h0 a a . (3f) Una vez que se ha especificado la spline en cada intervalo y se asume que los puntos de ruptura hia , i 1,..., k 1 , son conocidos, el siguiente paso consiste en determinar los parámetros g i,0 , g i,1 , g i,2 y g i,3 , i 1, ..., k . Dado que el número de parámetros desconocidos, 4k, es mayor que el número de condiciones impuestas, 3k, los parámetros del vector G 3kx1 = ( g 1,1 , g 1,2 , g 1,3 , ..., g k,1 , g k,2 , g k,3 ) ' pueden expresarse como función de los parámetros del vector G kx* 1 ( g 1, 0 , g 2 , 0 , ..., g k , 0 ) ' . Es decir, g r g 1, 0 r ,1 g 2 , 0 r , 2 ... g k 1, 0 r , k 1 g k , 0 r , k , (4) para r 1, ...,3k , siendo g 1 g 1,1 , g 2 g 1, 2 , g 3 g 1, 3 , ..., g 3 k 2 g k ,1 , g 3 k 1 g k , 2 y g 3 k g k ,3 a hi y donde los parámetros son funciones apropiadas de los puntos de ruptura , i 0 ,..., k . Así, g (h ) g 1, 0 X 1, h a g 2 , 0 X 2 , h a ... g k 1, 0 X k 1, h a g k , 0 X k , h a , a a a a a 5 a (5) donde los regresores , i 1, ..., k , están definidos como funciones apropiadas de los a X i ,h a puntos de ruptura y de la hora ˆ h anual estacional, ˆ1, h anual a , a puede h a del año. Entonces, otra estimación del patrón obtenerse mediante la estimación del modelo g ( h ) h a , donde h a es un término de perturbación asociado al ajuste; es a a decir, ˆ hanual gˆ a ( h a ) , h a 1,..., 8760 . Los puntos de ruptura hia , i 1,..., k 1 , se eligen a de forma que se minimice la suma de cuadrados de los residuos. 2.2 Procedimiento para estimar la variación anual en años bisiestos La spline anterior recoge la variación estacional anual para años no bisiestos, pero para modelar esta fluctuación en años bisiestos, es preciso especificar otra spline g ab definida como g a ( h ab ) , 29 F ab ab ab g (h ) g (h ) , g a ( h ab 24 ) , h ab 1,..., 1416 h ab 1417 ,..., 1440 h ab 1441 ,..., 8784 (6) donde g a es la spline definida para un año no bisiesto y g 29 F es una función polinomial, que recoge la variación estacional anual en las horas correspondientes al 29 de febrero, definida como g 29 F (h ) g0 ab g1 29 F 29 F h ab g2 29 F h ab 2 g3 29 F h ab 3 , h1ab h ab h2ab , (7) donde h1ab 1417 y h2ab 1440 . La continuidad de la spline, g ab , y su primera derivada, g ab , puede asegurarse mediante la imposición de las restricciones 29 F g1 (h 1 1 ) g 2 (h 1 1 ) 2 g3 (h 1 1 ) g (h 1 1 ) , (8a) 29 F g1 (h 2 1 ) g 2 (h 2 1 ) 2 g3 (h 2 1 ) g (h 1 ) , (8b) g0 g0 29 F 29 F ab 29 F ab 29 F ab ab 29 F 2g2 h ab 1 1 3g3 29 F 2g2 h ab 2 1 3g3 g1 29 F 29 F 29 F 29 F 29 F h ab 1 1 h ab 2 1 ab 3 ab a 3 a 2 g a h 2 g a h . ab 1 1 ab ab (8c) y g1 29 F 6 ab 1 (8d) Si las observaciones correspondientes al 29 de febrero se localizan en el tramo l-ésimo de la spline definida para un año no bisiesto, las restricciones anteriores pueden escribirse en G 4 x1 g 0 29 F 29 F términos 29 F , g1 29 F 29 F , g2 , g3 H matriciales como H 29 F G 29 F R 29 F , donde , 29 F 4x4 1 1 0 0 h h h 1 h 1 2 h 1 2 h 1 1 1 (9) ... 1, l g l , 0 ... 1, k g k , 0 ... 2 , l g l , 0 ... 2 , k g k , 0 , ... 3 , l g l , 0 ... 3 , k g k , 0 ... 4 , l g l , 0 ... 4 , k g k , 0 (10) ab 1 1 ab 1 ab 2 ab 2 1 h h 1 3 h 1 3 h 1 ab 1 ab 1 2 ab 1 2 ab 2 ab 1 ab 2 1 3 3 2 2 y 29 F R 4 x1 r129 F 1,1 g 1, 0 29 F 2 ,1 g 1, 0 r2 29 F r 3 ,1 g 1, 0 3 29 F r4 4 ,1 g 1, 0 donde los parámetros m,1 ,..., , m, k , m 1,..., 4 , están definidos como funciones apropiadas de los parámetros 3 l 2 ,l ,..., 3 l 2 , k , 3 l 1, l ,..., 3 l 1, k , 3 l , l ,..., 3 l , k . Entonces, G 29 F H 29 F -1 R 29 F (11) donde H 29 F 1 4x4 1 ,1 2 ,1 3 ,1 4 ,1 1, 2 1, 3 2,2 2 ,3 3,2 3,3 4,2 4 ,3 1, 4 3,4 4,4 2,4 (12) de forma que g 29 F h g ab X 1, h ab ... g l , 0 X l , h ab ... g k , 0 X k , h ab , h1 h 29 F 1, 0 29 F 29 F ab ab h2 , ab (13) donde los regresores X i29,h F , i 1,..., k , están definidos como funciones apropiadas de ab los parámetros de la matriz R 29 F , los parámetros de la matriz H 29 F 1 h ab del año. 7 y la hora Entonces, otra aproximación de la variación de periodo anual, 2anual , puede ,t a a g ( h ) , si la observación en el instante t corresponde a la hora definirse como 2anual ,t h a ab ab g ( h ) , si la observación en el instante t de un año no bisiesto, o 2anual ,t corresponde a la hora h ab de un año bisiesto. Es decir, 2 ,t anual g 1, 0 X 1, t anual ... g k , 0 X k , t anual , (14) donde las variables X ianual , i 1,..., k , están definidas como se indica a continuación. Si ,t la observación en el instante t corresponde a la hora h a de un año no bisiesto, h 1,..., 8760 , X i , t anual a h ab X i , h a . Si la observación en el instante t corresponde a la hora a de un año bisiesto, h ab 1,..., 8784 , X anual i ,t X a ab , i,h 29 F X i,h a b , X a , i , h a b 24 h ab 1 ,..., 1416 h ab 1417 ,..., 1440 h ab 1441 ,..., 8784 (15) Ahora, puede obtenerse una estimación de 2anual mediante el ajuste mínimo ,t cuadrático del modelo de regresión ˆ1 , t anual g 1, 0 X 1, t anual ... g k , 0 X k , t anual t , (16) donde ˆ1anual se define como sigue. Si la observación en el instante t corresponde a la ,t anual hora h a de un año no bisiesto, h a 1,..., 8760 , ˆ1anual ˆ1, h . Si la observación en el ,t a instante t corresponde a la hora h ab de un año bisiesto, h ab 1,..., 8784 , ˆ anual 1, t donde ˆ1anual ,h a a h 1 ,..., 8760 ˆ anual ab 1, h 29 F ˆ1, h a b ˆ anual 1, h a b 24 , , , h ab 1 ,..., 1416 h ab 1417 ,..., 1440 h ab 1441 ,..., 8784 (17) es la serie definida en la ecuación (1) y ˆ129,h F ab h ab 1417 ,..., 1440 son las medias horarias correspondientes a cada una de las 24 horas de los días 29 de febrero de los años bisiestos de la muestra4. Finalmente, puede obtenerse una tercera aproximación 4 Nótese que en un año bisiesto, las estimaciones de la variación estacional de periodo anual deben ser corregidas de modo que la suma de los efectos estacionales en las 8784 horas del año sea nula. 8 de la variación estacional de periodo anual, 3anual , incorporando los regresores X ianual en ,t ,t un modelo de series temporales junto a los demás componentes de la serie. 3. Demanda horaria de energía eléctrica en España A continuación, el procedimiento desarrollado en la sección anterior se emplea para modelar los efectos estacionales de la serie horaria de demanda de energía eléctrica en España (medida en mega-watios) desde la hora 1 del jueves 1 de enero de 1998 hasta la hora 24 del lunes 31 de diciembre de 20015. Como consecuencia del cambio de hora que se efectúa cada año, la fuente original de datos proporcionaba 23 observaciones horarias correspondientes a los días 29 de marzo de 1998, 28 de marzo de 1999, 26 de marzo de 2000 y 25 de marzo de 2001, y veinticinco observaciones horarias correspondientes al 25 de octubre de 1998, 31 de octubre de 1999, 29 de octubre de 2000 y 28 de octubre de 2001. Para evitar la heterogeneidad causada por este cambio de hora, los datos disponibles han sido asignados a las horas correspondientes como si dicho cambio no hubiera tenido lugar. Es decir, cuando el cambio se produce en marzo, las 23 observaciones correspondientes al día del cambio y la primera observación del día siguiente se han considerado como las 24 observaciones correspondientes al día del cambio. Cuando el cambio tiene lugar en octubre, la primera observación correspondiente al día del cambio se considera la última observación correspondiente al día previo y, de ese modo, sólo las siguientes 24 observaciones correspondientes al día del cambio se han asignado finalmente a ese día. De esta forma, se obtiene una serie con 24 observaciones en cada día del periodo estudiado. La serie resultante se denota por y t t 1,..., 35064 . El gráfico 1 muestra la existencia de inestabilidades en el comportamiento de esta serie horaria. Se observa una débil tendencia de crecimiento, aunque este movimiento en el largo plazo está oscurecido por un importante componente estacional. Una especificación adecuada de este componente debe tener en cuenta la existencia de variaciones estacionales simultáneas con distinto periodo: anual, semanal y diario. De manera que la demanda horaria de energía eléctrica podría ser expresada como yt f ( t , t diaria , t semanal , t anual , t ) , donde t representa el componente tendencial, 5 Los datos utilizados corresponden a la información pública proporcionada por el Operador del Mercado de Electricidad (OMEL) y disponible en http:/www.omel.com. 9 t diaria , tsemanal y tanual recogen las variaciones estacionales diaria, semanal y anual, respectivamente, y t refleja movimientos no sistemáticos. Con objeto de obtener alguna indicación preliminar de la presencia de las variaciones anual, semanal y diaria, se ha eliminado el componente de largo plazo, estimado por medio del modelo yt t vt . (18) A partir de los residuos del modelo anterior, vˆ t t 1,..., 35064 , se han calculado medias móviles de periodo 168, mm (168 ) t t 85 ,..., 34980 , de modo que se amortigüen las variaciones de periodo 24 y 168 (variaciones diaria y semanal, respectivamente). Estas medias móviles permiten observar año tras año un patrón estacional regular. El patrón estacional anual se aprecia con claridad en el gráfico 2, que muestra las medias por hora en cada una de las 8760 horas del año, ˆ1anual ,h a a h 1 ,..., 8760 , calculadas a partir de la serie mm (168 ) t y apropiadamente corregidas. Una vez obtenida una primera aproximación de la variación de periodo anual (véase más adelante), la serie v̂ t ha sido filtrada con objeto de eliminar dicha fluctuación y, a partir de la serie resultante, se han calculado medias móviles de periodo 24, mm ( 24 ) t t 25 ,..., 35040 . Una aproximación de la variación de periodo semanal puede obtenerse a partir de estas medias móviles mediante el cálculo de medias corregidas correspondientes a cada hora de las semana, ˆ1semanal ,h s s h 1 ,..., 168 (gráfico 3). Finalmente, a partir de la serie v̂ t filtrada con objeto de eliminar las fluctuaciones de periodo anual y semanal (véase más adelante), puede obtenerse una aproximación de la variación diaria mediante el cálculo de medias corregidas correspondientes a cada hora del día, ˆ1diaria ,h d h d 1 ,..., 24 (gráfico 4). A modo de hipótesis preliminar, puede asumirse que las principales características de la serie temporal mostrada en el gráfico 1 son un componente tendencial de naturaleza estocástica y un componente estacional que puede describirse apropiadamente por medio de tres variaciones periódicas simultáneas. Además, el cambio de hora tiene un impacto sobre la demanda. De hecho, ésta es la hipótesis que 10 justifica que dicho cambio se produzca y tal impacto ha sido tenido en cuenta en la especificación del modelo, definido como yt t t diaria t semanal t anual C t t , (19) donde 1, Ct 0 , 2091 t 7130 10827 t 16034 si 19563 t 24770 28299 t 33506 en otros casos (20) dado que se asume que el cambio de hora tiene lugar a las 2:00 o 3:00 horas. Desde un punto de vista clásico, la tendencia y el componente estacional se formulan como funciones determinísticas del tiempo. Sin embargo, la estabilidad del componente tendencial parece un supuesto poco realista en el caso bajo estudio. Además, aunque las medias por hora del año, la semana o el día (gráficos 2 a 4) indican el comportamiento estacional promedio, es difícil admitir que se trata de un comportamiento fijo. En este trabajo, se recurre a los modelos estructurales como herramienta capaz de capturar las inestabilidades de los diferentes componentes de la serie. El objetivo de esta aproximación es, precisamente, describir el comportamiento de dichos componentes, cada uno de los cuales posee una formulación estocástica explícita que permite su interpretación directa (véase Harvey, 1989, Koopman, 1992, y Durbin y Koopman, 2001). Por otro lado, la frecuencia horaria con que se registran los datos aconseja utilizar formulaciones parsimoniosas del patrón estacional. En este sentido, las variaciones estacionales de periodo más largo —anual y semanal—han sido modeladas mediante funciones splines, incorporadas en el modelo estructural bajo el supuesto de que dichas variaciones no evolucionan en el tiempo6. 6 El hecho de que sólo se disponga de datos correspondientes a 4 años impide contrastar cambios lentos en la variación estacional anual. Si, a partir de la serie mm ( 24 ) t , se construye una colección de 168 series, una correspondiente a cada hora de la semana, la evolución de éstas proporciona cierta evidencia de comportamiento estocástico de los efectos estacionales semanales. En el mismo sentido, si se elimina la tendencia y las variaciones estacionales anual y semanal y, a partir de la serie resultante, se construyen 24 series, una para cada hora del día, la evolución de estas series muestra con bastante claridad la naturaleza estocástica de los efectos estacionales a lo largo del día. Además, existen razones para obtener esta conclusión. Por ejemplo, se espera que el máximo dentro del día ocurra una hora antes en invierno. 11 Así, el modelo dado por la ecuación (19) podría ser formulado como un modelo estructural en el que la variación de periodo diario se modela a través de un conjunto de términos trigonométricos como sigue 12 diaria γt j,t j 1 donde j,t γ j,t cos λ j * j,t sen λ j γ , con γ sen λ j γ j,t 1 ω j,t * * cos λ j γ j,t 1 ω j,t , j 1,...,12 , (21) y *j,t son procesos ruido blanco de media nula incorrelados mutuamente con varianza común 2 , j 1,...,12 , y λ j 2πj/ 24 , j 1,...,12 , son las frecuencias correspondientes a los componentes cíclicos asociados a esta variación estacional. Los efectos estacionales de periodo semanal y anual se recogen mediante splines cúbicas periódicas7. Se asume, finalmente, que las perturbaciones de los diferentes componentes estocásticos están mutuamente incorreladas. Para formular las splines, es necesario obtener aproximaciones iniciales de las dos fluctuaciones periódicas que se pretende modelar. Con respecto a la variación de periodo anual, el procedimiento desarrollado en la sección segunda conduce a especificar una spline de trece tramos. Teniendo en cuenta que las localizaciones de los puntos de ruptura son: h1a 323 , h2a 468 , h3a 3292 , h4a 5354 , h5a 5403 , h6 5536 a , h7a 7476 , h8a 8135 , h9a 8145 , h10a 8255 , h11a 8525 y h12a 8535 8, la spline anual puede expresarse en términos de los regresores X ianual , definidos como en ,t la ecuación (14), es decir, 3,t anual g 1, 0 X 1, t anual ... g k , 0 X 13 , t anual , (22) e incorporarse en el modelo estructural (ecuación (19)) a través de los regresores X ianual , ,t i 2 ,...,13 , junto al resto de componentes9. Teniendo en cuenta que podría no ser factible manejar variaciones estacionales estocásticas simultáneas, se asume, a priori, que las variaciones semanal y anual son fijas. 7 Una aproximación alternativa consiste en convertir la serie horaria en 24 series, una para cada hora del día (véase Ramanathan et al., 1997). Sin embargo, este procedimiento no aporta una formulación parsimoniosa de la demanda horaria de energía eléctrica. 8 La spline especificada debe ser el resultado de un equilibrio entre el grado de ajuste y alisado que se desea conseguir. Así, el número de nodos debe ser tal que se capturen los principales cambios de curvatura de la función aproximada por la spline (véase De Boor, 1978:303-304). Una vez determinado el número, la localización de los puntos de ruptura se determina mediante un costoso procedimiento iterativo dirigido a minimizar la suma de cuadrados de los residuos derivados del ajuste. 9 Uno de los regresores que define la spline debe ser eliminado con objeto de evitar problemas de multicolinealidad. 12 Antes de estimar dicho modelo estructural, debe formularse la spline semanal. Para ello, debe eliminarse la variación estacional anual. En este sentido, puede obtenerse una aproximación de 2anual , como se indica en la ecuación (16), estimando el ,t modelo ˆ1 , t anual g 1, 0 X 1, t anual ... g k , 0 X 13 , t anual t , (23) donde ˆ1anual está definido en las ecuaciones (1) y (17), siendo ˆ129,h F ,t ab h ab 1417 ,..., 1440 los valores de la serie v̂ t (véase ecuación (18)) en cada una de las 24 horas del 29 de febrero de 2000, corregidos por el mismo factor de corrección aplicado a la serie de medias definida en la ecuación (1) con objeto de que la suma de los efectos estacionales fuese nula. A partir de la serie ˆ 2anual t 1,..., 35064 , puede obtenerse una primera aproximación ,t de tsemanal mediante lo siguientes pasos: 1) obtener la serie vˆt ˆ 2anual t 1,..., 35064 ; 2) a ,t partir de la serie obtenida en el paso anterior, calcular la serie de medias móviles de periodo 24, mm ( 24 ) t ; 3) calcular medias por hora de la semana de la serie anterior; 4) obtener nuevas medias por hora de la semana corregidas de forma que la suma de los efectos estacionales a lo largo de la semana sea nula. La serie resultante se denotará por ˆ semanal 1, h s , de modo que ˆ semanal 1, t ˆ semanal 1, h s s h 1 ,.., 168 , si la observación en el instante t corresponde a la hora h s de la semana. Siguiendo el procedimiento descrito en la sección 2.1, el componente ˆ1semanal se ha modelado como ,h s 2 ,t semanal g 1, 0 X 1, t s semanal ... g 6 , 0 X 6 , t s semanal , (24) donde X isemanal , i 1, 2 , ..., 6 , son los regresores que definen una spline periódica cúbica ,t de 6 tramos con puntos de ruptura h1s 2 , h2s 31 , h3s 131 , h4s 133 y h5s 134 . La aproximación final de tsemanal , 3semanal , puede estimarse incorporando los regresores ,t semanal X i ,t , i 2 , ..., 6 , en el modelo estructural (ecuación (19)). Una vez formuladas las splines anual y semanal, el modelo estructural que parece apropiado es 13 yt t t diaria g 2 ,0 X 2 ,t ... g 13 , 0 X 13 , t g 2,0 X 2,t ... g 6 , 0 X 6 , t anual s semanal anual s C t t semanal (25) Los resultados de la estimación máximo verosímil de este modelo indican que el patrón estacional diario es de carácter estocástico, mientras que el término de pendiente es fijo. Si se incluye un componente de pendiente determinístico, el test de significación de este componente en el vector de estado final sugiere que el componente de nivel debería ser modelado como un camino aleatorio sin deriva. La bondad de ajuste del modelo es relativamente elevada, pero, debido a la presencia de observaciones anómalas, se han introducido variables de intervención en el componente de nivel, que se formula como t t 1 d h I d h d t , t ~NID(0, 2 d h d ), (26) d donde I d h es igual a uno si la observación corresponde a la hora h d del día d de la d muestra y es igual a cero en otro caso10. Los resultados de la estimación se muestran en la tabla 1 y en los gráficos 2 a 4. Las estimaciones de los hiperparámetros indican el grado en que el nivel de la serie y el patrón estacional diario cambian con el tiempo. Nótese que la varianza del componente irregular es aproximadamente nula; sin embargo, se observan claramente comportamientos no sistemáticos que, de hecho, están siendo recogidos por otros componentes estocásticos, sobre todo por el componente de nivel, cuyo término de perturbación posee la varianza más alta. A pesar de la no significación estadística de algunos de los parámetros que definen la spline anual, se ha decidido que los regresores correspondientes deben permanecer en el modelo puesto que capturan un comportamiento estacional muy relevante desde un punto de vista económico11. Nótese que la naturaleza de los efectos 10 Sólo se han utilizado variables de intervención cuando la magnitud de las anomalías es demasiado grande. Este criterio resulta útil para datos de alta frecuencia debido a que el número de observaciones anómalas suele ser alto. 11 El test F de significación conjunta de los efectos estacionales anuales, F12, 35036 = 0.64969, sugiere la no relevancia estadística del conjunto de regresores X 2y, t ,..., X 13y , t . Sin embargo, en un modelo estructural de series temporales, este test F está sesgado hacia el no rechazo de la hipótesis nula debido a la naturaleza estocástica de algunos componentes. Cuando la spline anual se elimina del modelo, esta variación estacional podría ser capturada aproximadamente por medio de un nivel estocástico. En cualquier caso, incluir regresores estadísticamente irrelevantes podría causar pérdida de eficiencia. Sin embargo, cuando se estima el modelo sin spline, los efectos sobre las estimaciones del resto de parámetros no parecen significativos. 14 estacionales anuales depende sobre todo de factores climatológicos, tales como la temperatura. La demanda de energía eléctrica aumenta cuando las temperaturas son frías debido al uso de calefacción. Un periodo con temperaturas muy altas también produce un incremento de la demanda debido al uso de aire acondicionado. Por supuesto, otras muchas características también influyen en la demanda de energía eléctrica, por ejemplo, otras condiciones meteorológicas. En este sentido, el clima moderado de España podría explicar la débil relevancia estadística del patrón estacional anual. Por otro lado, el signo negativo de la estimación del parámetro indica un ahorro de energía como consecuencia del cambio de hora. Sin embargo, esta conclusión debe ser tomada con cautela puesto que este efecto podría estar relacionado con el patrón estacional anual. Téngase en cuenta que entre marzo y octubre, período en el que se localiza el cambio, las temperaturas más moderadas podrían causar una reducción de la demanda. Dos de los parámetros d h (366-1 y 731-1) corresponden a la primera hora de d los años 1999 (viernes) y 2000 (sábado), y las celebraciones del año nuevo pueden explicar el incremento de la demanda. En cambio, a las 9 de la mañana del primer día de 2001 (lunes) se registra un descenso de la demanda con respecto a los niveles esperados a principios de la semana y de la jornada laboral. El resto de observaciones anómalas introducidas se localizaron a las 9 de la mañana del domingo 14 de febrero de 1999 y a primera hora de los lunes 15 y 22 de enero de 2001. En estos tres casos, el nivel de demanda fue inferior al esperado. Las estimaciones de los efectos estacionales anual y semanal, ˆ3anual y ˆ3semanal , se ,h ,h a s obtuvieron a partir de las estimaciones de los coeficientes de los regresores anual X 2 ,t anual ,..., X 13 ,t semanal ,..., X 6 ,t , en el primer caso, y X 2semanal , en el caso semanal12. El efecto ,t estacional de periodo anual representa menos del 15.6250% del valor de la serie original en cualquier instante del tiempo de la muestra. En términos medios a lo largo de la muestra, este porcentaje es del 5.1922%. En el caso semanal, estos dos porcentajes son 12 El término independiente de cada una de las splines ha sido calculado de forma que las medias de las fluctuaciones estacionales de periodo anual y semanal estimadas fuesen nulas. La estimación del componente de nivel también se ha corregido con el fin de que dichos términos independientes no quedasen recogidos simultáneamente en los componentes tendencial y estacional. Dicha estimación en el último instante de la muestra fue ˆ T 19585 .126 . 15 del 29.8470% y del 7.3694%, respectivamente. De acuerdo con estas cifras, el efecto estacional de periodo semanal parece más relevante que el anual. El gráfico 2 muestra el patrón estacional anual para un año no bisiesto. Se observa una primera fase de crecimiento que finaliza a mediados de enero, seguida de otra de descenso suave que continua hasta finales de abril. Entonces, se produce un moderado crecimiento hasta finales de julio y un posterior y abrupto descenso que conduce a niveles mínimos a mediados de agosto. Después del verano, se inicia un período inestable: crecimiento en septiembre, descenso hasta mediados de octubre, máximos locales a finales de noviembre y mediados de diciembre y mínimos locales a comienzos y finales de diciembre, coincidiendo con las fiestas navideñas. El gráfico 3 presenta un patrón semanal típico para el consumo de energía eléctrica. Los mínimos corresponden al fin de semana y la demanda es también más baja los lunes por la mañana y en la tarde-noche de los viernes que en el resto de la semana. Las estimaciones del componente estacional de periodo diario el 31 de diciembre de 2001 muestran un patrón similar a las medias por hora del día representadas en el gráfico 413. Las diferencias pueden explicarse por la naturaleza estocástica de este componente en el modelo finalmente especificado. Este carácter estocástico se observa más claramente si se representa su evolución para cada una de las 24 horas del día a lo largo de la muestra. El gráfico 4 muestra también los valores mínimos y máximos del componente estacional diario correspondientes a cada una de las horas del día. Los niveles mínimos corresponden a la madrugada. El crecimiento iniciado al amanecer finaliza alrededor de mediodía. Luego, la demanda permanece aproximadamente al mismo nivel hasta las primeras horas de la tarde y un nuevo crecimiento conduce a un máximo registrado al final de la tarde, cuando coinciden los usos industriales y domésticos. El efecto estacional de periodo diario llega a representar el 31.8603% del nivel de la serie. En términos medios a lo largo de la muestra, este porcentaje es del 9.3845%. Si se evalúa el efecto estacional conjunto, es decir, como resultado de la agregación de las variaciones anual, semanal y diaria, este último porcentaje asciende al 12.5665%. 13 El valor del estadístico de significación conjunta de los efectos estacionales diarios indica que son 2 1965 . 26 ). estadísticamente significativos ( 23 16 4. Conclusiones En este trabajo se ha mostrado que los modelos estructurales de series temporales resultan apropiados para tratar las inestabilidades que caracterizan, por lo general, a las series horarias. Además, el estudio de series de este tipo puede revelar la existencia de importantes fluctuaciones periódicas de alta frecuencia, lo que representa un obstáculo para la predicción en el corto plazo. De ahí la conveniencia de analizar cada variación estacional —anual, semanal y diaria— y, así, identificar tanto los puntos álgidos de la serie como los momentos en que ésta toma valores más bajos dentro del día, la semana o el año. Modelar este patrón estacional es una tarea cuya complejidad analítica y computacional procede, no sólo del número de fluctuaciones superpuestas de distinto periodo, sino, especialmente, del gran número de parámetros que precisa una formulación habitual que pretenda captar estas variaciones, ya sea a través de variables cualitativas o términos trigonométricos. En este sentido, puede recurrirse a las funciones splines para recoger las fluctuaciones cuyo periodo se completa en un número más elevado de observaciones. En particular, se ha desarrollado un procedimiento capaz de resolver el problema de heterogeneidad del patrón estacional causado por la presencia de años bisiestos. Finalmente, la estimación conjunta de fluctuaciones periódicas exige la especificación adecuada del modelo. Para ello, conviene aislar cada una de estas fluctuaciones y las funciones splines pueden ser un instrumento útil para obtener, cuando menos, aproximaciones iniciales de estos comportamientos. Algunas de las limitaciones de la aplicación podrían ser superadas si se dispusiera de un periodo de observación más largo que permitiera comprobar el carácter estocástico de la fluctuación estacional de periodo anual. Sin embargo, desde el punto de vista práctico la posibilidad que ofrecen los datos, incluso para el caso semanal, no puede materializarse sin superar previamente las limitaciones de los programas informáticos estándar, que impiden la estimación de formulaciones estocásticas convencionales para recoger variaciones estacionales de periodo muy largo y que, ni siquiera contemplan la estimación de dos o más fluctuaciones estacionales estocásticas sea cual sea el periodo asociado a ellas. En este sentido, y aunque cambios en el diseño de los programas pueden ser suficientes para considerar conjuntamente varias fluctuaciones estacionales, la implementación de funciones splines estocásticas constituiría, sin duda, una alternativa computacionalmente eficiente. 17 Bibliografía 1. De Boor, C. (1978): A Practical Guide to Splines, Springer-Verlag. 2. Durbin, J. y S.J. Koopman (2001): Time Series Analysis by State Space Models, Oxford University Press. 3. Harvey, A.C. (1989): Forecasting, Structural Time Series and the Kalman Filter, Cambridge University Press. 4. Harvey, A.C., S.J. Koopman y M. Riani (1997): “The modelling and seasonal adjustment of weekly observations”. Journal of Business and Economic Statistics,15(3), pp. 354-368. 5. Koopman, S.J. (1992): Diagnostic Checking and Intra-Daily Effects in Time Series Models, Tinbergen Institute Research Series 27. 6. Marsh, L. (1983): “On estimating spline regression”. Proceedings of SAS User’s Group International, 8, pp. 723-728. 7. Marsh, L. (1986): “Estimating the number and location of knots in spline regression”. Journal of Applied Business Research, 3, pp. 60-70. 8. Marsh, L., M. Maudgal y J. Raman (1990): “Alternative methods of estimating piecewise linear and higher order regression models”. Proceedings of SAS User’s Group International, 15, pp. 523-527. 9. Monahan, J. (2001): Numerical Methods of Statistics. Cambridge University Press. 10. Poirier, D.J. (1973): “Piecewise regression using cubic splines”. Journal of the American Statistical Association, 68, pp. 515-524. 11. Poirier, D.J. (1976): The Econometrics of Structural Change with Special Emphasis on Spline Functions, North-Holland. 12. Ramanathan, R., R. Engle, C.W.J. Granger, F. Vahid-Araghi y C. Brace (1997): “Short-run forecasts of electricity loads and peaks”. International Journal of Forecasting, 13(2), pp. 161-174. Tabla 1. Resultados de la estimación del modelo Hiperparámetros(a) 2 ˆ 0.0000 (0.0000) ˆ 2 159200 (1.0000) Otros parámetros 18 2 ˆ 9.5941 (0.0001) ĝ 2 , 0 ĝ 3 , 0 ĝ 4 , 0 ĝ 5 , 0 ĝ 6 , 0 ĝ 7 , 0 -6945.3(b) (b) 2952.6 65946(b) 3(b) -10119x10 42906x103(b) 3(b) -1010.9x10 14768x103(b) s gˆ 2 , 0 -107.58 ˆ366 1 1954.5 ĝ 9 , 0 -11517x10 6 s gˆ 3 , 0 6267.6 ˆ410 9 -2217.0 ĝ 10 , 0 1228.2x106(b) s gˆ 4 , 0 678.14x103 ˆ731 1 2378.9 3(b) s gˆ 5 , 0 47335x10 3 ˆ1097 9 -1885.2 -1888.6x106(b) s gˆ 6 , 0 -1159.5x103 ˆ1111 1 -2444.9 -306.89 ˆ1118 1 -2695.6 ĝ 8 , 0 ĝ 11 , 0 ĝ 12 , 0 ĝ 13 , 0 -72693x10 -16133x10 3(b) ˆ Componente estacional diario (estimaciones del lunes 31 de diciembre de 2001) 1 2 3 4 5 6 -250.4685 -1945.8747 -2887.2017 -3173.2476 -3370.9385 -3396.2862 7 8 9 10 11 12 -2800.8991 -2202.6243 -1153.5518 35.0769 1490.3795 1780.0914 (a) 13 14 15 16 17 18 1682.0284 1173.9980 308.9819 -10.0428 -29.5138 683.0407 19 20 21 22 23 24 3033.6346 3422.2234 3049.6872 2261.2590 1073.3487 1225.7441 Entre paréntesis se muestran los q-ratios, es decir, los cocientes entre las varianzas de los términos de perturbación de cada componente y la mayor de ellas. (b) Parámetros no significativos con un nivel de significación del 10%. 19 Gráfico 1. Demanda horaria de energía eléctrica en España, y t 30000 27500 25000 22500 20000 17500 15000 12500 0 8760 17520 26280 Gráfico 2. Patrón estacional de periodo anual, ˆ 1anual y ˆ3anual ,h ,h a a 35040 3000 2000 1000 0 1 479 957 1435 1913 2391 2869 3347 3825 4303 4781 5259 5737 6215 6693 7171 7649 8127 8605 -1000 -2000 -3000 ****** ˆ anual 1, h a ____________ ˆ anual 3, h a 20 Gráfico 3. Patrón estacional de periodo semanal, ˆ1semanal y ˆ3semanal ,h ,h s s 2000 1000 0 1 9 17 25 33 41 49 57 65 73 81 89 97 105 113 121 129 137 145 153 161 -1000 -2000 -3000 -4000 ****** ˆ semanal 1, h s ____________ ˆ semanal 3 ,h s Gráfico 4. Patrón estacional diario: medias por hora del día, ˆ1diaria , y variación ,h d estacional estocástica diaria, ˆtdiaria (medias, mín, máx.) 5000 4000 3000 2000 1000 0 -1000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 -2000 -3000 -4000 -5000 ****** medias por hora del día ______ ˆt diaria (medias) ____________ ˆtdiaria (mín., máx.) 21