Martin y Caceres

Anuncio
ESTACIONALIDAD EN DATOS HORARIOS. LA
DEMANDA DE ENERGÍA ELÉCTRICA EN ESPAÑA
MARTÍN RODRÍGUEZ, Gloria
[email protected]
CÁCERES HERNÁNDEZ, José Juan
[email protected]
Departamento de Economía de las Instituciones, Estadística Económica y
Econometría
Universidad de La Laguna
RESUMEN
En este trabajo se proponen procedimientos apropiados para modelar los
movimientos periódicos simultáneos presentes en datos horarios. Se recurre a los
modelos estructurales como aproximación adecuada para captar las inestabilidades que
suelen observarse en series de alta frecuencia. Las funciones splines se incorporan en el
modelo con objeto de proporcionar formulaciones de las variaciones estacionales que,
además de ser más parsimoniosas que las formulaciones convencionales, ofrecen la
posibilidad de tratar el patrón estacional anual en presencia de años bisiestos. Para
ilustrar su utilidad, la metodología propuesta se ha aplicado a una serie horaria de
demanda de energía eléctrica en España.
Palabras clave: datos horarios, modelos estructurales, splines, demanda eléctrica.
1. Introducción
Cada vez se acepta con mayor unanimidad entre los economistas que la
estacionalidad es responsable de una parte importante de la variabilidad mostrada por
una serie temporal económica y, por lo tanto, no debe ser ignorada en los modelos para
el análisis económico. De ahí que hayan proliferado en los últimos años nuevos
modelos de la estacionalidad y, sobre todo, se haya producido un cambio de orientación,
prestándose mayor atención al objetivo de especificar la estacionalidad, frente al
objetivo de eliminarla para evitar que contamine a otros componentes. En cualquier
caso, no existe un acuerdo unánime sobre el concepto de estacionalidad ni sobre cómo
debe ser tratada en los trabajos empíricos y teóricos. Y en el caso particular de datos de
muy alta frecuencia cabe pensar en la necesidad de replantear algunas nociones.
Es evidente que una agregación temporal excesiva puede impedir que se
aprecien determinados comportamientos o respuestas dinámicas. Y salvo que el objetivo
del análisis no vaya más allá de la descripción de tendencias generales en el largo plazo,
la elección de la frecuencia con la que se observan los datos es un elemento
determinante del éxito del estudio. En este sentido, el uso más extendido de series
temporales con mayor frecuencia de observación en la literatura estadísticoeconométrica es, sin duda, una medida del progreso de la economía aplicada.
Sin embargo, el estudio de series semanales, diarias u horarias introduce un
elemento de complejidad cuyo tratamiento requiere nuevos enfoques metodológicos. En
series de alta frecuencia suelen coexistir fluctuaciones de distinto periodo que deben ser
tenidas en cuenta para especificar correctamente la estacionalidad. Del mismo modo que
la percepción de la tendencia en series económicas puede alterarse si se ignora la
presencia de la fluctuación cíclica, esta misma variación puede incidir, a su vez, en la
identificación de la variación estacional; y más factible aún resulta la incorrecta
evaluación de la magnitud de una fluctuación estacional si otras fluctuaciones de
periodo distinto no son especificadas explícitamente. Esta circunstancia obliga a recurrir
a una especificación que permita la estimación simultánea de todas las variaciones
estacionales presentes, que pueden introducirse como determinísticas o estocásticas. En
este sentido, las formulaciones convencionales pueden combinarse con las funciones
splines, que suponen, en general, un ahorro computacional significativo y pueden, de
hecho, ser la única vía posible de estimación.
2
En el ámbito del análisis de series temporales, las splines aproximan el
comportamiento de otras funciones en periodos de tiempo dados. Aunque las funciones
splines son una herramienta tradicional1, muchos de los desarrollos teóricos deben ser
adaptados cuando la magnitud que se intenta aproximar es cualquiera de las variaciones
periódicas de una serie temporal. El objetivo de este trabajo es proponer un
procedimiento específico, que se desarrolla en la sección segunda, para estimar la
variación estacional anual en series temporales horarias, caracterizadas por la
inconstancia del periodo en el que se completa dicha fluctuación en presencia de años
bisiestos. En la tercera sección, el procedimiento desarrollado se aplica a una serie
horaria de demanda de energía eléctrica en España. Finalmente, se presentan las
principales conclusiones.
2. Funciones splines y variación estacional en datos horarios
En una serie horaria, la variación de periodo anual, aunque se asuma la
estabilidad de ésta a lo largo de los años, difícilmente podrá ser estimada a través de un
sencillo modelo de variables cualitativas. Ahora bien, si el patrón estacional de período
anual se ajusta a una curva relativamente suave, dicho patrón puede ser descrito de
forma parsimoniosa mediante las denominadas funciones splines, que determinan la
variación estacional registrada en una observación determinada de la serie como función
de la estación a la que pertenece dicha observación.
Otro aspecto interesante cuando se trabaja con datos horarios es la
heterogeneidad del patrón estacional en presencia de años bisiestos, puesto que la
longitud del periodo en que se completa la variación anual no permanece constante. Sin
embargo, las funciones splines permiten abordar estas situaciones particulares dado que
constituyen una herramienta más flexible que otras formulaciones.
A continuación se propone un método para tratar esta heterogeneidad. La
variación estacional anual se recoge a través de una función spline cúbica periódica
obtenida a partir de la optimización de una función relativa al error cometido en el
ajuste, sin que se exija el paso por determinados puntos2. Debe tenerse en cuenta que
esta fluctuación se completa en un período de 8760 horas para años no bisiestos y 8784
1
Véase Poirier (1973, 1976), De Boor (1978), Marsh (1983, 1986), Marsh et al. (1990) y Monahan
(2001).
2
La propuesta realizada en este trabajo se sitúa en la línea original de Poirier (1973, 1976), frente a la
propuesta de Koopman (1992) y Harvey et al. (1997), en la que la función spline es forzada a pasar por
ciertos puntos o nodos.
3
para años bisiestos. Entonces, una vez formulada una spline que aproxime el patrón
estacional en un año no bisiesto, puede obtenerse una aproximación del patrón
estacional en un año bisiesto mediante la imposición de adecuadas condiciones de
continuidad.
2.1. Procedimiento para estimar la variación anual en años no bisiestos
Suponga que los valores y t de la serie observada han sido adecuadamente
filtrados para eliminar la variación tendencial y las variaciones estacionales diferentes
de la anual. Sea  tanual la variación estacional anual en el instante t. Para recoger la
variación anual en un año no bisiesto por medio de una spline cúbica periódica, puede
asumirse, como hipótesis preliminar, que la estacionalidad es determinística3; es decir,
t
anual
h

anual
h
si la observación en el instante t corresponde a la hora h a del año,
a
 1, ..., 8760
a
.
Una vez que se han eliminado las observaciones horarias correspondientes al 29
de febrero de cada año bisiesto, una estimación preliminar del patrón estacional puede
obtenerse mediante el cálculo de medias por hora para cada una de las 8760 horas del

año. Sea ˆ1anual
,h
a
a
h  1 ,..., 8760
el conjunto de medias por hora corregidas de forma que la
suma de los efectos estacionales correspondientes a las 8760 horas del año sea nula.
Entonces,
ˆ
anual
1,t
  ˆ
anual
1, h
a

a
h  1 ,.., 8760
(1)
si la observación en el instante t corresponde a la hora h a . Para recoger el componente
ˆ1, h
anual
a
, h a  1, ..., 8760 , puede emplearse una spline cúbica periódica g a ( h a ) , definida
como
 
g ( h )  g i ( h )  g i,0  g i,1 h  g i,2 h
a
a
a
a
a
2
 
 g i,3 h
a
3
, h ia1  h a  h ia , i  1, ..., k , (2)
con h 0a  1 y h ka  8 760 . Esta spline debe satisfacer las condiciones de continuidad
tradicionales. Sin embargo, el carácter periódico se asegura mediante la imposición de
condiciones adicionales. El conjunto final de restricciones es:
3
El supuesto de comportamiento determinístico se introduce con objeto de simplificar la exposición del
procedimiento. Un patrón estacional que evolucione en el tiempo puede recogerse, sin abandonar la
aproximación desarrollada, utilizando una spline estocástica.
4
a) continuidad de la función, g a ,
g i , 0  g i ,1 h i  g i , 2 h i
a
a

2
 g i , 3 h i
a

 g i  1 , 0  g i  1 ,1 h i  g i  1 , 2 h i
3
a
a

 g i  1 , 3 h i


 ; (3b)
2
a
3
, (3a)
para i  1,..., k  1 , y
g k , 0  g k ,1 h k  1   g k , 2 h k  1   g k , 3 h k  1   g 1 , 0  g 1 ,1 h 0  g 1 , 2 h 0
a
2
a
3
a
a
a
 g 1 , 3 h 0
2
a
3
b) continuidad de la primera derivada,  g a ,
g i ,1  2 g i , 2 h i  3 g i , 3 h i
a

a
 g i 1 ,1  2 g i  1 , 2 h i  3 g i 1 , 3 h i
2
a
a

2
,
(3c)
para i  1,..., k  1 , y



g k ,1  2 g k , 2 h k  1  3 g k , 3 h k  1
a
a

2
 ;
a 2
 g 1 ,1  2 g 1 , 2 h 0  3 g 1 , 3 h 0
a
(3d)
c) continuidad de la segunda derivada, 2 g a ,
2 g i , 2  6 g i , 3 hi  2 g i  1, 2  6 g i  1, 3 hi
a
a
,
(3e)
para i  1,..., k  1 , y


2 g k , 2  6 g k , 3 h k  1  2 g 1, 2  6 g 1, 3 h0
a
a
.
(3f)
Una vez que se ha especificado la spline en cada intervalo y se asume que los
puntos de ruptura hia , i  1,..., k  1 , son conocidos, el siguiente paso consiste en
determinar los parámetros g i,0 , g i,1 , g i,2 y g i,3 , i  1, ..., k . Dado que el número de
parámetros desconocidos, 4k, es mayor que el número de condiciones impuestas, 3k, los
parámetros del vector G 3kx1 = ( g 1,1 , g 1,2 , g 1,3 , ..., g k,1 , g k,2 , g k,3 ) ' pueden expresarse
como función de los parámetros del vector G kx* 1  ( g 1, 0 , g 2 , 0 , ..., g k , 0 ) ' . Es decir,
g r  g 1, 0  r ,1  g 2 , 0  r , 2  ...  g k 1, 0  r , k 1  g k , 0  r , k
,
(4)
para r  1, ...,3k , siendo g 1  g 1,1 , g 2  g 1, 2 , g 3  g 1, 3 , ..., g 3 k  2  g k ,1 , g 3 k 1  g k , 2 y
g 3 k  g k ,3
a
hi
y donde los parámetros  son funciones apropiadas de los puntos de ruptura
, i  0 ,..., k . Así,
g (h )  g 1, 0 X 1, h a  g 2 , 0 X 2 , h a  ...  g k  1, 0 X k  1, h a  g k , 0 X k , h a ,
a
a
a
a
a
5
a
(5)
donde los regresores
, i  1, ..., k , están definidos como funciones apropiadas de los
a
X i ,h a
puntos de ruptura y de la hora
ˆ h
anual
estacional,
ˆ1, h
anual
a
,
a
puede
h
a
del año. Entonces, otra estimación del patrón
obtenerse
mediante
la
estimación
del
modelo
 g ( h )   h a , donde  h a es un término de perturbación asociado al ajuste; es
a
a
decir, ˆ hanual  gˆ a ( h a ) , h a  1,..., 8760 . Los puntos de ruptura hia , i  1,..., k  1 , se eligen
a
de forma que se minimice la suma de cuadrados de los residuos.
2.2 Procedimiento para estimar la variación anual en años bisiestos
La spline anterior recoge la variación estacional anual para años no bisiestos,
pero para modelar esta fluctuación en años bisiestos, es preciso especificar otra spline
g
ab
definida como
 g a ( h ab )
,
 29 F ab
ab
ab
g (h )   g
(h )
,
 g a ( h ab  24 ) ,

h
ab
 1,..., 1416
h
ab
 1417 ,..., 1440
h
ab
 1441 ,..., 8784
(6)
donde g a es la spline definida para un año no bisiesto y g 29 F es una función
polinomial, que recoge la variación estacional anual en las horas correspondientes al 29
de febrero, definida como
g
29 F
(h
)  g0
ab
 g1
29 F
29 F
h
ab
 g2
29 F
h 
ab 2
 g3
29 F
h 
ab 3
, h1ab  h ab  h2ab , (7)
donde h1ab  1417 y h2ab  1440 .
La continuidad de la spline, g ab , y su primera derivada,  g ab , puede asegurarse
mediante la imposición de las restricciones
29 F
 g1
(h 1  1 )  g 2
(h 1  1 )
2
 g3
(h 1  1 )  g (h 1  1 ) ,
(8a)
29 F
 g1
(h 2  1 )  g 2
(h 2  1 )
2
 g3
(h 2  1 )  g (h 1 ) ,
(8b)
g0
g0
29 F
29 F
ab
29 F
ab
29 F
ab
ab
29 F
 2g2
h
ab
1
 1  3g3
29 F
 2g2
h
ab
2
 1  3g3
g1
29 F

29 F

29 F
29 F
29 F
h
ab
1
1
h
ab
2
1
ab
3
ab
a
3
a

2
 g
a
h

2
 g
a
h  .
ab
1
1

ab
ab
(8c)
y
g1
29 F
6
ab
1
(8d)
Si las observaciones correspondientes al 29 de febrero se localizan en el tramo
l-ésimo de la spline definida para un año no bisiesto, las restricciones anteriores pueden
escribirse

en
G 4 x1  g 0
29 F
29 F
términos
29 F
, g1
29 F
29 F
, g2
, g3
H
matriciales
como
H
29 F
G
29 F
 R
29 F
,
donde
 ,
29 F
4x4
1

1

0

 0
h
h
 h
 1  h
1
2 h
1
2 h
 

 1 
 1 

 1  
(9)
 ...  1, l g l , 0  ...  1, k g k , 0 

 ...   2 , l g l , 0  ...   2 , k g k , 0 
,
 ...   3 , l g l , 0  ...   3 , k g k , 0 

 ...   4 , l g l , 0  ...   4 , k g k , 0 
(10)
ab
1
1
ab
1
ab
2
ab
2

 1
h
h
 1  3 h
 1  3 h
1
ab
1
ab
1
2
ab
1
2
ab
2
ab
1
ab
2
1
3
3
2
2
y
29 F
R 4 x1
 r129 F   1,1 g 1, 0
 29 F  
 2 ,1 g 1, 0
r2
  29 F   
r
   3 ,1 g 1, 0
3
 29 F  
 r4    4 ,1 g 1, 0
donde los parámetros  m,1 ,...,  , m, k , m  1,..., 4 , están definidos como funciones
apropiadas de los parámetros  3 l  2 ,l ,...,  3 l  2 , k ,  3 l 1, l ,...,  3 l 1, k ,  3 l , l ,...,  3 l , k . Entonces,
G
29 F

 H

29 F -1
R
29 F
(11)
donde
H
29 F

1
4x4
  1 ,1

 2 ,1
 
  3 ,1

  4 ,1
 1, 2
 1, 3
 2,2
 2 ,3
 3,2
 3,3
 4,2
 4 ,3
 1, 4 


 3,4 

 4,4 
 2,4
(12)
de forma que
g
29 F
h   g
ab
X 1, h ab  ...  g l , 0 X l , h ab  ...  g k , 0 X k , h ab , h1  h
29 F
1, 0
29 F
29 F
ab
ab
 h2 ,
ab
(13)
donde los regresores X i29,h F , i  1,..., k , están definidos como funciones apropiadas de
ab
los parámetros  de la matriz R 29 F , los parámetros  de la matriz H 29 F 
1
h
ab
del año.
7
y la hora
Entonces, otra aproximación de la variación de periodo anual,  2anual
, puede
,t
a
a
 g ( h ) , si la observación en el instante t corresponde a la hora
definirse como  2anual
,t
h
a
ab
ab
 g ( h ) , si la observación en el instante t
de un año no bisiesto, o  2anual
,t
corresponde a la hora h ab de un año bisiesto. Es decir,
 2 ,t
anual
 g 1, 0 X 1, t
anual
 ...  g k , 0 X k , t
anual
,
(14)
donde las variables X ianual
, i  1,..., k , están definidas como se indica a continuación. Si
,t
la observación en el instante t corresponde a la hora h a de un año no bisiesto,
h  1,..., 8760 , X i , t
anual
a
h
ab
 X i , h a . Si la observación en el instante t corresponde a la hora
a
de un año bisiesto, h ab  1,..., 8784 ,
X
anual
i ,t
 X a ab
,
i,h

29 F
  X i,h a b ,
X a
,
 i , h a b  24
h
ab
 1 ,..., 1416
h
ab
 1417 ,..., 1440
h
ab
 1441 ,..., 8784
(15)
Ahora, puede obtenerse una estimación de  2anual
mediante el ajuste mínimo
,t
cuadrático del modelo de regresión
ˆ1 , t
anual
 g 1, 0 X 1, t
anual
 ...  g k , 0 X k , t
anual
 t ,
(16)
donde ˆ1anual
se define como sigue. Si la observación en el instante t corresponde a la
,t
anual
hora h a de un año no bisiesto, h a  1,..., 8760 , ˆ1anual
 ˆ1, h . Si la observación en el
,t
a
instante t corresponde a la hora h ab de un año bisiesto, h ab  1,..., 8784 ,
ˆ
anual
1, t

donde ˆ1anual
,h
a
a
h  1 ,..., 8760
 ˆ anual
ab
1, h
 29 F
  ˆ1, h a b
 ˆ anual
 1, h a b  24
,
,
,
h
ab
 1 ,..., 1416
h
ab
 1417 ,..., 1440
h
ab
 1441 ,..., 8784
(17)
es la serie definida en la ecuación (1) y ˆ129,h F
ab

h
ab
 1417 ,..., 1440
son las
medias horarias correspondientes a cada una de las 24 horas de los días 29 de febrero de
los años bisiestos de la muestra4. Finalmente, puede obtenerse una tercera aproximación
4
Nótese que en un año bisiesto, las estimaciones de la variación estacional de periodo anual deben ser
corregidas de modo que la suma de los efectos estacionales en las 8784 horas del año sea nula.
8
de la variación estacional de periodo anual,  3anual
, incorporando los regresores X ianual
en
,t
,t
un modelo de series temporales junto a los demás componentes de la serie.
3. Demanda horaria de energía eléctrica en España
A continuación, el procedimiento desarrollado en la sección anterior se emplea
para modelar los efectos estacionales de la serie horaria de demanda de energía eléctrica
en España (medida en mega-watios) desde la hora 1 del jueves 1 de enero de 1998 hasta
la hora 24 del lunes 31 de diciembre de 20015.
Como consecuencia del cambio de hora que se efectúa cada año, la fuente
original de datos proporcionaba 23 observaciones horarias correspondientes a los días
29 de marzo de 1998, 28 de marzo de 1999, 26 de marzo de 2000 y 25 de marzo de
2001, y veinticinco observaciones horarias correspondientes al 25 de octubre de 1998,
31 de octubre de 1999, 29 de octubre de 2000 y 28 de octubre de 2001. Para evitar la
heterogeneidad causada por este cambio de hora, los datos disponibles han sido
asignados a las horas correspondientes como si dicho cambio no hubiera tenido lugar.
Es decir, cuando el cambio se produce en marzo, las 23 observaciones correspondientes
al día del cambio y la primera observación del día siguiente se han considerado como
las 24 observaciones correspondientes al día del cambio. Cuando el cambio tiene lugar
en octubre, la primera observación correspondiente al día del cambio se considera la
última observación correspondiente al día previo y, de ese modo, sólo las siguientes 24
observaciones correspondientes al día del cambio se han asignado finalmente a ese día.
De esta forma, se obtiene una serie con 24 observaciones en cada día del periodo
estudiado. La serie resultante se denota por y t t 1,..., 35064 .
El gráfico 1 muestra la existencia de inestabilidades en el comportamiento de
esta serie horaria. Se observa una débil tendencia de crecimiento, aunque este
movimiento en el largo plazo está oscurecido por un importante componente estacional.
Una especificación adecuada de este componente debe tener en cuenta la existencia de
variaciones estacionales simultáneas con distinto periodo: anual, semanal y diario. De
manera que la demanda horaria de energía eléctrica podría ser expresada como
yt  f (  t ,  t
diaria
, t
semanal
, t
anual
, t ) ,
donde  t representa el componente tendencial,
5
Los datos utilizados corresponden a la información pública proporcionada por el Operador del Mercado
de Electricidad (OMEL) y disponible en http:/www.omel.com.
9
t
diaria
,  tsemanal y  tanual recogen las variaciones estacionales diaria, semanal y anual,
respectivamente, y  t refleja movimientos no sistemáticos.
Con objeto de obtener alguna indicación preliminar de la presencia de las
variaciones anual, semanal y diaria, se ha eliminado el componente de largo plazo,
estimado por medio del modelo
yt    t  vt .
(18)
A partir de los residuos del modelo anterior, vˆ t t 1,..., 35064 , se han calculado medias
móviles de periodo 168, mm (168 ) t t  85 ,..., 34980 , de modo que se amortigüen las
variaciones de periodo 24 y 168 (variaciones diaria y semanal, respectivamente). Estas
medias móviles permiten observar año tras año un patrón estacional regular. El patrón
estacional anual se aprecia con claridad en el gráfico 2, que muestra las medias por hora

en cada una de las 8760 horas del año, ˆ1anual
,h
a
a
h  1 ,..., 8760
, calculadas a partir de la serie
mm (168 ) t  y apropiadamente corregidas.
Una vez obtenida una primera aproximación de la variación de periodo anual
(véase más adelante), la serie v̂ t  ha sido filtrada con objeto de eliminar dicha
fluctuación y, a partir de la serie resultante, se han calculado medias móviles de periodo
24, mm ( 24 ) t t  25 ,..., 35040 . Una aproximación de la variación de periodo semanal puede
obtenerse a partir de estas medias móviles mediante el cálculo de medias corregidas
correspondientes a cada hora de las semana, ˆ1semanal
,h
s

s
h  1 ,..., 168
(gráfico 3).
Finalmente, a partir de la serie v̂ t  filtrada con objeto de eliminar las
fluctuaciones de periodo anual y semanal (véase más adelante), puede obtenerse una
aproximación de la variación diaria mediante el cálculo de medias corregidas

correspondientes a cada hora del día, ˆ1diaria
,h
d
h
d
 1 ,..., 24
(gráfico 4).
A modo de hipótesis preliminar, puede asumirse que las principales
características de la serie temporal mostrada en el gráfico 1 son un componente
tendencial de naturaleza estocástica y un componente estacional que puede describirse
apropiadamente por medio de tres variaciones periódicas simultáneas. Además, el
cambio de hora tiene un impacto sobre la demanda. De hecho, ésta es la hipótesis que
10
justifica que dicho cambio se produzca y tal impacto ha sido tenido en cuenta en la
especificación del modelo, definido como
yt   t   t
diaria
 t
semanal
 t
anual
 C t   t
,
(19)
donde


 1,
Ct  


 0 ,
 2091  t  7130

 10827  t  16034
si 
 19563  t  24770
 28299  t  33506
en otros casos
(20)
dado que se asume que el cambio de hora tiene lugar a las 2:00 o 3:00 horas.
Desde un punto de vista clásico, la tendencia y el componente estacional se
formulan como funciones determinísticas del tiempo. Sin embargo, la estabilidad del
componente tendencial parece un supuesto poco realista en el caso bajo estudio.
Además, aunque las medias por hora del año, la semana o el día (gráficos 2 a 4) indican
el comportamiento estacional promedio, es difícil admitir que se trata de un
comportamiento fijo.
En este trabajo, se recurre a los modelos estructurales como herramienta capaz
de capturar las inestabilidades de los diferentes componentes de la serie. El objetivo de
esta aproximación es, precisamente, describir el comportamiento de dichos
componentes, cada uno de los cuales posee una formulación estocástica explícita que
permite su interpretación directa (véase Harvey, 1989, Koopman, 1992, y Durbin y
Koopman, 2001). Por otro lado, la frecuencia horaria con que se registran los datos
aconseja utilizar formulaciones parsimoniosas del patrón estacional. En este sentido, las
variaciones estacionales de periodo más largo —anual y semanal—han sido modeladas
mediante funciones splines, incorporadas en el modelo estructural bajo el supuesto de
que dichas variaciones no evolucionan en el tiempo6.
6
El hecho de que sólo se disponga de datos correspondientes a 4 años impide contrastar cambios lentos
en la variación estacional anual. Si, a partir de la serie mm ( 24 ) t  , se construye una colección de 168
series, una correspondiente a cada hora de la semana, la evolución de éstas proporciona cierta evidencia
de comportamiento estocástico de los efectos estacionales semanales. En el mismo sentido, si se elimina
la tendencia y las variaciones estacionales anual y semanal y, a partir de la serie resultante, se construyen
24 series, una para cada hora del día, la evolución de estas series muestra con bastante claridad la
naturaleza estocástica de los efectos estacionales a lo largo del día. Además, existen razones para obtener
esta conclusión. Por ejemplo, se espera que el máximo dentro del día ocurra una hora antes en invierno.
11
Así, el modelo dado por la ecuación (19) podría ser formulado como un modelo
estructural en el que la variación de periodo diario se modela a través de un conjunto de
términos trigonométricos como sigue
12
diaria
γt

j,t
j 1
donde 
j,t
 γ j,t   cos λ j

* 

 j,t    sen λ j
 γ , con  γ
sen λ j   γ j,t 1   ω j,t
 *    *
cos λ j   γ j,t 1   ω j,t




, j  1,...,12 ,
(21)
y  *j,t son procesos ruido blanco de media nula incorrelados mutuamente
con varianza común  2 , j  1,...,12 , y λ j  2πj/ 24 , j  1,...,12 , son las frecuencias
correspondientes a los componentes cíclicos asociados a esta variación estacional. Los
efectos estacionales de periodo semanal y anual se recogen mediante splines cúbicas
periódicas7. Se asume, finalmente, que las perturbaciones de los diferentes componentes
estocásticos están mutuamente incorreladas.
Para formular las splines, es necesario obtener aproximaciones iniciales de las
dos fluctuaciones periódicas que se pretende modelar. Con respecto a la variación de
periodo anual, el procedimiento desarrollado en la sección segunda conduce a
especificar una spline de trece tramos. Teniendo en cuenta que las localizaciones de los
puntos de ruptura son: h1a  323 , h2a  468 , h3a  3292 , h4a  5354 , h5a  5403 ,
h6  5536
a
, h7a  7476 , h8a  8135 , h9a  8145 , h10a  8255 , h11a  8525 y h12a  8535 8, la
spline anual puede expresarse en términos de los regresores X ianual
, definidos como en
,t
la ecuación (14), es decir,
 3,t
anual
 g 1, 0 X 1, t
anual
 ...  g k , 0 X 13 , t
anual
,
(22)
e incorporarse en el modelo estructural (ecuación (19)) a través de los regresores X ianual
,
,t
i  2 ,...,13 , junto al resto de componentes9.
Teniendo en cuenta que podría no ser factible manejar variaciones estacionales estocásticas simultáneas,
se asume, a priori, que las variaciones semanal y anual son fijas.
7
Una aproximación alternativa consiste en convertir la serie horaria en 24 series, una para cada hora del
día (véase Ramanathan et al., 1997). Sin embargo, este procedimiento no aporta una formulación
parsimoniosa de la demanda horaria de energía eléctrica.
8
La spline especificada debe ser el resultado de un equilibrio entre el grado de ajuste y alisado que se
desea conseguir. Así, el número de nodos debe ser tal que se capturen los principales cambios de
curvatura de la función aproximada por la spline (véase De Boor, 1978:303-304). Una vez determinado el
número, la localización de los puntos de ruptura se determina mediante un costoso procedimiento
iterativo dirigido a minimizar la suma de cuadrados de los residuos derivados del ajuste.
9
Uno de los regresores que define la spline debe ser eliminado con objeto de evitar problemas de
multicolinealidad.
12
Antes de estimar dicho modelo estructural, debe formularse la spline semanal.
Para ello, debe eliminarse la variación estacional anual. En este sentido, puede
obtenerse una aproximación de  2anual
, como se indica en la ecuación (16), estimando el
,t
modelo
ˆ1 , t
anual
 g 1, 0 X 1, t
anual
 ...  g k , 0 X 13 , t
anual
 t ,
(23)
donde ˆ1anual
está definido en las ecuaciones (1) y (17), siendo ˆ129,h F
,t
ab

h
ab
 1417 ,..., 1440
los
valores de la serie v̂ t  (véase ecuación (18)) en cada una de las 24 horas del 29 de
febrero de 2000, corregidos por el mismo factor de corrección aplicado a la serie de
medias definida en la ecuación (1) con objeto de que la suma de los efectos estacionales
fuese nula.
A partir de la serie ˆ 2anual
t 1,..., 35064 , puede obtenerse una primera aproximación
,t
de  tsemanal mediante lo siguientes pasos: 1) obtener la serie vˆt  ˆ 2anual
t 1,..., 35064 ; 2) a
,t
partir de la serie obtenida en el paso anterior, calcular la serie de medias móviles de
periodo 24, mm ( 24 ) t  ; 3) calcular medias por hora de la semana de la serie anterior; 4)
obtener nuevas medias por hora de la semana corregidas de forma que la suma de los
efectos estacionales a lo largo de la semana sea nula. La serie resultante se denotará por
ˆ
semanal
1, h
s
, de modo que ˆ
semanal
1, t
  ˆ
semanal
1, h
s

s
h  1 ,.., 168
, si la observación en el instante t
corresponde a la hora h s de la semana. Siguiendo el procedimiento descrito en la
sección 2.1, el componente ˆ1semanal
se ha modelado como
,h
s
 2 ,t
semanal
 g 1, 0 X 1, t
s
semanal
 ...  g 6 , 0 X 6 , t
s
semanal
,
(24)
donde X isemanal
, i  1, 2 , ..., 6 , son los regresores que definen una spline periódica cúbica
,t
de 6 tramos con puntos de ruptura h1s  2 , h2s  31 , h3s  131 , h4s  133 y h5s  134 . La
aproximación final de  tsemanal ,  3semanal
, puede estimarse incorporando los regresores
,t
semanal
X i ,t
, i  2 , ..., 6 , en el modelo estructural (ecuación (19)).
Una vez formuladas las splines anual y semanal, el modelo estructural que
parece apropiado es
13
yt   t   t
diaria
 g 2 ,0 X 2 ,t
 ...  g 13 , 0 X 13 , t
 g 2,0 X 2,t
 ...  g 6 , 0 X 6 , t
anual
s
semanal
anual
s

 C t   t
semanal
(25)
Los resultados de la estimación máximo verosímil de este modelo indican que el
patrón estacional diario es de carácter estocástico, mientras que el término de pendiente
es fijo. Si se incluye un componente de pendiente determinístico, el test de significación
de este componente en el vector de estado final sugiere que el componente de nivel
debería ser modelado como un camino aleatorio sin deriva. La bondad de ajuste del
modelo es relativamente elevada, pero, debido a la presencia de observaciones
anómalas, se han introducido variables de intervención en el componente de nivel, que
se formula como
 t   t 1 

d h
I d  h d   t ,  t ~NID(0,  
2
d h
d
),
(26)
d
donde I d  h es igual a uno si la observación corresponde a la hora h d del día d de la
d
muestra y es igual a cero en otro caso10. Los resultados de la estimación se muestran en
la tabla 1 y en los gráficos 2 a 4.
Las estimaciones de los hiperparámetros indican el grado en que el nivel de la
serie y el patrón estacional diario cambian con el tiempo. Nótese que la varianza del
componente irregular es aproximadamente nula; sin embargo, se observan claramente
comportamientos no sistemáticos que, de hecho, están siendo recogidos por otros
componentes estocásticos, sobre todo por el componente de nivel, cuyo término de
perturbación posee la varianza más alta.
A pesar de la no significación estadística de algunos de los parámetros que
definen la spline anual, se ha decidido que los regresores correspondientes deben
permanecer en el modelo puesto que capturan un comportamiento estacional muy
relevante desde un punto de vista económico11. Nótese que la naturaleza de los efectos
10
Sólo se han utilizado variables de intervención cuando la magnitud de las anomalías es demasiado
grande. Este criterio resulta útil para datos de alta frecuencia debido a que el número de observaciones
anómalas suele ser alto.
11
El test F de significación conjunta de los efectos estacionales anuales, F12, 35036 = 0.64969, sugiere la no
relevancia estadística del conjunto de regresores X 2y, t ,..., X 13y , t . Sin embargo, en un modelo estructural de
series temporales, este test F está sesgado hacia el no rechazo de la hipótesis nula debido a la naturaleza
estocástica de algunos componentes. Cuando la spline anual se elimina del modelo, esta variación
estacional podría ser capturada aproximadamente por medio de un nivel estocástico. En cualquier caso,
incluir regresores estadísticamente irrelevantes podría causar pérdida de eficiencia. Sin embargo, cuando
se estima el modelo sin spline, los efectos sobre las estimaciones del resto de parámetros no parecen
significativos.
14
estacionales anuales depende sobre todo de factores climatológicos, tales como la
temperatura. La demanda de energía eléctrica aumenta cuando las temperaturas son frías
debido al uso de calefacción. Un periodo con temperaturas muy altas también produce
un incremento de la demanda debido al uso de aire acondicionado. Por supuesto, otras
muchas características también influyen en la demanda de energía eléctrica, por
ejemplo, otras condiciones meteorológicas. En este sentido, el clima moderado de
España podría explicar la débil relevancia estadística del patrón estacional anual.
Por otro lado, el signo negativo de la estimación del parámetro  indica un
ahorro de energía como consecuencia del cambio de hora. Sin embargo, esta conclusión
debe ser tomada con cautela puesto que este efecto podría estar relacionado con el
patrón estacional anual. Téngase en cuenta que entre marzo y octubre, período en el que
se localiza el cambio, las temperaturas más moderadas podrían causar una reducción de
la demanda.
Dos de los parámetros  d  h (366-1 y 731-1) corresponden a la primera hora de
d
los años 1999 (viernes) y 2000 (sábado), y las celebraciones del año nuevo pueden
explicar el incremento de la demanda. En cambio, a las 9 de la mañana del primer día de
2001 (lunes) se registra un descenso de la demanda con respecto a los niveles esperados
a principios de la semana y de la jornada laboral. El resto de observaciones anómalas
introducidas se localizaron a las 9 de la mañana del domingo 14 de febrero de 1999 y a
primera hora de los lunes 15 y 22 de enero de 2001. En estos tres casos, el nivel de
demanda fue inferior al esperado.
Las estimaciones de los efectos estacionales anual y semanal, ˆ3anual
y ˆ3semanal
, se
,h
,h
a
s
obtuvieron a partir de las estimaciones de los coeficientes de los regresores
anual
X 2 ,t
anual
,..., X 13 ,t
semanal
,..., X 6 ,t
, en el primer caso, y X 2semanal
, en el caso semanal12. El efecto
,t
estacional de periodo anual representa menos del 15.6250% del valor de la serie original
en cualquier instante del tiempo de la muestra. En términos medios a lo largo de la
muestra, este porcentaje es del 5.1922%. En el caso semanal, estos dos porcentajes son
12
El término independiente de cada una de las splines ha sido calculado de forma que las medias de las
fluctuaciones estacionales de periodo anual y semanal estimadas fuesen nulas. La estimación del
componente de nivel también se ha corregido con el fin de que dichos términos independientes no
quedasen recogidos simultáneamente en los componentes tendencial y estacional. Dicha estimación en el
último instante de la muestra fue ˆ T  19585 .126 .
15
del 29.8470% y del 7.3694%, respectivamente. De acuerdo con estas cifras, el efecto
estacional de periodo semanal parece más relevante que el anual.
El gráfico 2 muestra el patrón estacional anual para un año no bisiesto. Se
observa una primera fase de crecimiento que finaliza a mediados de enero, seguida de
otra de descenso suave que continua hasta finales de abril. Entonces, se produce un
moderado crecimiento hasta finales de julio y un posterior y abrupto descenso que
conduce a niveles mínimos a mediados de agosto. Después del verano, se inicia un
período inestable: crecimiento en septiembre, descenso hasta mediados de octubre,
máximos locales a finales de noviembre y mediados de diciembre y mínimos locales a
comienzos y finales de diciembre, coincidiendo con las fiestas navideñas.
El gráfico 3 presenta un patrón semanal típico para el consumo de energía
eléctrica. Los mínimos corresponden al fin de semana y la demanda es también más
baja los lunes por la mañana y en la tarde-noche de los viernes que en el resto de la
semana.
Las estimaciones del componente estacional de periodo diario el 31 de diciembre
de 2001 muestran un patrón similar a las medias por hora del día representadas en el
gráfico 413. Las diferencias pueden explicarse por la naturaleza estocástica de este
componente en el modelo finalmente especificado. Este carácter estocástico se observa
más claramente si se representa su evolución para cada una de las 24 horas del día a lo
largo de la muestra. El gráfico 4 muestra también los valores mínimos y máximos del
componente estacional diario correspondientes a cada una de las horas del día. Los
niveles mínimos corresponden a la madrugada. El crecimiento iniciado al amanecer
finaliza alrededor de mediodía. Luego, la demanda permanece aproximadamente al
mismo nivel hasta las primeras horas de la tarde y un nuevo crecimiento conduce a un
máximo registrado al final de la tarde, cuando coinciden los usos industriales y
domésticos.
El efecto estacional de periodo diario llega a representar el 31.8603% del nivel
de la serie. En términos medios a lo largo de la muestra, este porcentaje es del 9.3845%.
Si se evalúa el efecto estacional conjunto, es decir, como resultado de la agregación de
las variaciones anual, semanal y diaria, este último porcentaje asciende al 12.5665%.
13
El valor del estadístico de significación conjunta de los efectos estacionales diarios indica que son
2
 1965 . 26 ).
estadísticamente significativos (  23
16
4. Conclusiones
En este trabajo se ha mostrado que los modelos estructurales de series
temporales resultan apropiados para tratar las inestabilidades que caracterizan, por lo
general, a las series horarias. Además, el estudio de series de este tipo puede revelar la
existencia de importantes fluctuaciones periódicas de alta frecuencia, lo que representa
un obstáculo para la predicción en el corto plazo. De ahí la conveniencia de analizar
cada variación estacional —anual, semanal y diaria— y, así, identificar tanto los puntos
álgidos de la serie como los momentos en que ésta toma valores más bajos dentro del
día, la semana o el año. Modelar este patrón estacional es una tarea cuya complejidad
analítica y computacional procede, no sólo del número de fluctuaciones superpuestas de
distinto periodo, sino, especialmente, del gran número de parámetros que precisa una
formulación habitual que pretenda captar estas variaciones, ya sea a través de variables
cualitativas o términos trigonométricos. En este sentido, puede recurrirse a las funciones
splines para recoger las fluctuaciones cuyo periodo se completa en un número más
elevado de observaciones. En particular, se ha desarrollado un procedimiento capaz de
resolver el problema de heterogeneidad del patrón estacional causado por la presencia
de años bisiestos. Finalmente, la estimación conjunta de fluctuaciones periódicas exige
la especificación adecuada del modelo. Para ello, conviene aislar cada una de estas
fluctuaciones y las funciones splines pueden ser un instrumento útil para obtener,
cuando menos, aproximaciones iniciales de estos comportamientos.
Algunas de las limitaciones de la aplicación podrían ser superadas si se
dispusiera de un periodo de observación más largo que permitiera comprobar el carácter
estocástico de la fluctuación estacional de periodo anual. Sin embargo, desde el punto
de vista práctico la posibilidad que ofrecen los datos, incluso para el caso semanal, no
puede materializarse sin superar previamente las limitaciones de los programas
informáticos estándar, que impiden la estimación de formulaciones estocásticas
convencionales para recoger variaciones estacionales de periodo muy largo y que, ni
siquiera contemplan la estimación de dos o más fluctuaciones estacionales estocásticas
sea cual sea el periodo asociado a ellas. En este sentido, y aunque cambios en el diseño
de los programas pueden ser suficientes para considerar conjuntamente varias
fluctuaciones estacionales, la implementación de funciones splines estocásticas
constituiría, sin duda, una alternativa computacionalmente eficiente.
17
Bibliografía
1. De Boor, C. (1978): A Practical Guide to Splines, Springer-Verlag.
2. Durbin, J. y S.J. Koopman (2001): Time Series Analysis by State Space Models,
Oxford University Press.
3. Harvey, A.C. (1989): Forecasting, Structural Time Series and the Kalman Filter,
Cambridge University Press.
4. Harvey, A.C., S.J. Koopman y M. Riani (1997): “The modelling and seasonal
adjustment of weekly observations”. Journal of Business and Economic Statistics,15(3),
pp. 354-368.
5. Koopman, S.J. (1992): Diagnostic Checking and Intra-Daily Effects in Time Series
Models, Tinbergen Institute Research Series 27.
6. Marsh, L. (1983): “On estimating spline regression”. Proceedings of SAS User’s
Group International, 8, pp. 723-728.
7. Marsh, L. (1986): “Estimating the number and location of knots in spline regression”.
Journal of Applied Business Research, 3, pp. 60-70.
8. Marsh, L., M. Maudgal y J. Raman (1990): “Alternative methods of estimating
piecewise linear and higher order regression models”. Proceedings of SAS User’s
Group International, 15, pp. 523-527.
9. Monahan, J. (2001): Numerical Methods of Statistics. Cambridge University Press.
10. Poirier, D.J. (1973): “Piecewise regression using cubic splines”. Journal of the
American Statistical Association, 68, pp. 515-524.
11. Poirier, D.J. (1976): The Econometrics of Structural Change with Special Emphasis
on Spline Functions, North-Holland.
12. Ramanathan, R., R. Engle, C.W.J. Granger, F. Vahid-Araghi y C. Brace (1997):
“Short-run forecasts of electricity loads and peaks”. International Journal of
Forecasting, 13(2), pp. 161-174.
Tabla 1. Resultados de la estimación del modelo
Hiperparámetros(a)
2
ˆ 
0.0000 (0.0000)
ˆ 
2
159200 (1.0000)
Otros parámetros
18
2
ˆ 
9.5941 (0.0001)
ĝ 2 , 0
ĝ 3 , 0
ĝ 4 , 0
ĝ 5 , 0
ĝ 6 , 0
ĝ 7 , 0
-6945.3(b)
(b)
2952.6
65946(b)
3(b)
-10119x10
42906x103(b)
3(b)
-1010.9x10
14768x103(b)
s
gˆ 2 , 0
-107.58
ˆ366  1
1954.5
ĝ 9 , 0
-11517x10
6
s
gˆ 3 , 0
6267.6
ˆ410  9
-2217.0
ĝ 10 , 0
1228.2x106(b)
s
gˆ 4 , 0
678.14x103
ˆ731  1
2378.9
3(b)
s
gˆ 5 , 0
47335x10
3
ˆ1097  9
-1885.2
-1888.6x106(b)
s
gˆ 6 , 0
-1159.5x103
ˆ1111  1
-2444.9
-306.89
ˆ1118  1
-2695.6
ĝ 8 , 0
ĝ 11 , 0
ĝ 12 , 0
ĝ 13 , 0
-72693x10
-16133x10
3(b)
ˆ
Componente estacional diario (estimaciones del lunes 31 de diciembre de 2001)
1
2
3
4
5
6
-250.4685
-1945.8747
-2887.2017
-3173.2476
-3370.9385
-3396.2862
7
8
9
10
11
12
-2800.8991
-2202.6243
-1153.5518
35.0769
1490.3795
1780.0914
(a)
13
14
15
16
17
18
1682.0284
1173.9980
308.9819
-10.0428
-29.5138
683.0407
19
20
21
22
23
24
3033.6346
3422.2234
3049.6872
2261.2590
1073.3487
1225.7441
Entre paréntesis se muestran los q-ratios, es decir, los cocientes entre las varianzas de los términos de
perturbación de cada componente y la mayor de ellas.
(b)
Parámetros no significativos con un nivel de significación del 10%.
19
Gráfico 1. Demanda horaria de energía eléctrica en España, y t 
30000
27500
25000
22500
20000
17500
15000
12500
0
8760
17520
26280
Gráfico 2. Patrón estacional de periodo anual, ˆ 1anual
 y ˆ3anual
,h
,h
a
a
35040

3000
2000
1000
0
1
479 957 1435 1913 2391 2869 3347 3825 4303 4781 5259 5737 6215 6693 7171 7649 8127 8605
-1000
-2000
-3000
******
ˆ
anual
1, h
a

____________
ˆ
anual
3, h
a

20
Gráfico 3. Patrón estacional de periodo semanal, ˆ1semanal
 y ˆ3semanal
,h
,h
s
s

2000
1000
0
1
9
17
25
33
41
49
57
65
73
81
89
97 105 113 121 129 137 145 153 161
-1000
-2000
-3000
-4000
******
ˆ
semanal
1, h
s

____________
ˆ
semanal
3 ,h
s

Gráfico 4. Patrón estacional diario: medias por hora del día, ˆ1diaria
, y variación
,h
d
estacional estocástica diaria, ˆtdiaria (medias, mín, máx.)
5000
4000
3000
2000
1000
0
-1000
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
-2000
-3000
-4000
-5000
******
medias por hora del día
______
ˆt
diaria
(medias) ____________ ˆtdiaria (mín., máx.)
21
Descargar