Analisis de series temporales y prediccion

Anuncio
Analisis de series
temporales y predicci6n
/
/
Esquema del capitulo
19.1.
Numeros indice
indice de precios de un unico articulo
i~ice de precios agregado no ponderado
in ice de precios agregado ponderado
i dice de cantidades agregado ponderado
Cambio del periodo base
19.2. Un contraste no parametrico de aleatoriedad
19.3. Componentes de una serie temporal
19.4. Medias m6viles
Extracci6n del componente estacional por medio de medias m6viles
19.5. Suavizaci6n exponencial
Modelo de predicci6n por medio de la suavizaci6n exponencial con el metodo
Holt-Winters
Predicci6n de series temporales estacionales
19.6. Modelos autorregresivos
19.7. Modelos autorregresivos integrados de medias m6viles
Introducci6n
En este capitulo presentamos metodos para analizar conjuntos de datos que contienen
mediciones de varias variables a 10 largo del tiempo. Ejemplos de datos de series temporales son las ventas mensuales de un producto y los tipos de interes, los beneficios
empresariales trimestrales y el consumo agregado y las cotizaciones al cierre de la bolsa.
Serie temporal
Una serie temporal es un conjunto de mediciones, ordenadas en el tiempo, sobre una cantidad de inten!s. En una serie temporal, la secuencia de observaciones es importante, a diferencia de 10 que ocune en los datos de corte transversal, en el que la secuencia de observaciones
no es importante.
Los datos de series temporales normal mente poseen caracteristicas especiales
-relacionadas con la secuencia de observaciones- que exigen el desarrollo de metodos de anal isis estadistico especiales. Casi todos los metodos de anal isis de datos y de
inferencia que hemos desarrollado se basan en el supuesto de que las muestras son
764
Estadfstica para administracion y economfa
aleatorias, en concreto, de que los errores de las observaciones son independientes. EI
supuesto de la independencia raras veces es realista en el caso de los datos de series
temporales. Consideremos, por ejemplo, una serie de ventas mensuales de un producto
manufacturado y observemos las razones posibles por las que no son independientes.
Si el mes pasado las ventas fueron superiores a la media, es razonable esperar que
continuen siendo altas, ya que no es probable que cambie bruscamente la situacion de
la economfa y de las empresas. Por 10 tanto , es de esperar que las ventas de meses
contiguos sean similares. Tambien observamos que las ventas de muchos productos tienen una pauta estacional: los pantalones cortos y los banadores se venden mas en primavera y a principios del verano que en invierno. Muchas tiendas minoristas venden
mas en el cuarto trimestre debido a las compras de regalos de Navidad. Estos y otros
muchos ejemplos demuestran la ausencia de independencia.
La ausencia de independencia entre las observaciones de series temporales plantea
serios problemas si se utilizan con datos de series temporales los metodos estadfsticos
convencionales, que suponen que las observaciones son independientes. Ya vimos el
problema en el apartado 14.7 cuando analizamos las dificultades que se plantean si se
utilizan metodos convencionales de regresion cuando los errores estan correlacionados .
EI supuesto de la independencia es fundamental; tambien pueden plantearse otros problemas serios si se utilizan metodos convencionales cuando las observaciones son dependientes. En este capftulo, centramos la atencion en los metodos de anal isis de series
temporales que se utilizan cuando hay una unica serie temporal.
Hemos analizado el aspecto negativo de los tipos de pautas de dependencia que es
probable que aparezcan en los datos de series temporales. Estos problemas son reales
y requieren metodos especiales. Sin embargo, esta dependencia tam bien puede explotarse para realizar predicciones de los futuros valores de los datos de series temporales
cuya varianza es menor. Por ejemplo, si hay una correlacion entre errores de meses
contiguos en una serie de ventas al por menor, esa correlacion puede utilizarse para hacer una prediccion de las ventas del proximo mes mejor que una prediccion basada en
una muestra aleatoria. Presentaremos metodos basados en el supuesto de que las pautas anteriores de relacion entre mediciones de una serie temporal se mantendran en el
futuro y pueden utilizarse para hacer predicciones, 10 cual es como afirmar que podemos
aprender en realidad del estudio de la historia.
En el primer apartado desarrollamos numeros fndice, que se utilizan en algunos estudios economicos. Los metodos de anal isis de series temporales que se presentan en los
apartados posteriores no requieren el conocimiento de los numeros fndice. Se incluyen
aquf para hacer una presentacion completa de los temas relacionados con el analisis de
series temporales.
19.1. Numeros fndice
Nuestro analisis comienza con el desarrollo de numeros fndice . Consideremos, a modo de
introduccion, la siguiente pregunta: l,que variaciones ha experimentado el precio de los
automoviles fabricados en Estados Unidos en los 10 tiltimos afios? Ni que decir tiene que
ha subido, pero l,como puede describirse cuantitativamente esta subida? A primera vista,
no parece que sea muy diffcil responder a esta pregunta. EI primer paso serfa recoger informacion sobre el precio de estos automoviles en cada uno de los 10 ultimos afios y representarlo en un gr:ifico temporal.
Sin embargo, el analisis detenido del problema podrfa plantear algunas preguntas. En
primer lugar, observamos que los automoviles no son homogeneos, por 10 que es necesario
definir con mas precision el tipo de automovil. Existe claramente una amplia variedad de
Capitulo 19.
Analisis de series temporales y predicci6n
765
precios y de calidades y la variacion del precio medio de todos los automoviles vendidos
podrfa deberse meramente a un cambio de la pauta de compra: ~se venden automoviles de
precio mas alto? En este caso, el precio medio subirfa, porque tenemos automoviles de precio mas alto. Otros cambios de la combinacion de mere ado podrfan provocar otras variaciones de la media. La Tabla 19.1 muestra un sencillo ejemplo hipotetico de un mercado
en el que solo hay automoviles de precio bajo y automoviles de precio alto. Observese que
el precio medio baja, pero que esta bajada se debe a que en la mezcIa hay mas automoviles
de precio bajo y menos de precio alto. Esta forma de comparar el precio de los automoviles de dos afios diferentes no es especialmente uti!.
Tabla 19.1.
Datos hipoteticos sobre los precios y las ventas de automoviles.
Automoviles pequeDos
ADO
1
2
Precio
(miles de
dolares)
10
11
)
Automoviles de lujo
Numero
vendido
(miles)
Precio
(miles de
dolares)
Ntimero
vendido
(miles)
5
15
30
33
IS
5
Todos los automoviles
Precio medio
(miles de dolares)
25,0
16,5
Otra solucion es caIcular el precio medio considerando un unico automovil de cada tipo, como en la Tabla 19.2. Este metoda tambien tiene problemas, porque tenemos un mercado en el que los automoviles pequefios son considerablemente mas populares que los de
lujo. El precio de los primeros es el mismo en los dos afios, mientras que el de los segundos se duplica. Como consecuencia, la media calculada considerando un unico automovil
de cada tipo es mucho mas alta en el segundo ano. Pero esta media no refJeja exactamente
la situacion, ya que da el mismo peso a los dos tipos de automovil cuando, en realidad, los
automoviles pequenos se compran mucho mas a menudo.
Tabla 19.2.
Datos hipoteticos sobre los precios y las ventas de autom6viles:
igual ponderacion.
Automoviles pequeDos
ADO
1
2
Automoviles de lujo
Todos los automoviles
Precio
(miles de
dolares)
Numero
vendido
(miles)
Precio
(miles de
dotares)
Numero
vendido
(miles)
Precio medio de
cada tipo de automovil
(miles de dolares)
10
100
100
24
48
1
1
29
10
17
Estos ejemplos demuestran que, para hacernos una idea fiable de la pauta general de
los precios a 10 largo del tiempo, hay que tener en cuenta las cantidades compradas en cada periodo. Veremos como pueden caIcularse medias ponderadas adecuadas.
Se plantea el mismo problema si los compradores compran mas automoviles con mas
extras el segundo ano que el primero. En ese caso, compran implfcitamente automoviles de
mayor calidad que en el primer ano. Podrfamos exarninar solamente los precios de los
automoviles sin extras para hacer una comparacion valida.
Las mejoras tecnologicas plantean otra dificultad. No es sorprendente observar que los
automoviles actuales consumen menos gasolina y duran mas que los que se fabricaban ha-
766
Estadfstica para administracion y economfa
ce 20 0 30 afios. Por 10 tanto, los cambios de la calidad pueden influir mucho en las subidas de los precios. Es muy importante tenerlos en cuenta cuando se hacen comparaciones
de precios, pero las tecnicas para analizar su influencia quedan fuera del alcance de este
libro.
Hemos puesto ejemplos de un unico producto para ilustrar el problema, pero esas comparaciones normalmente solo tienen interes para las personas relacionadas directamente
con la compraventa de ese producto. Nos dedicaremos, pues, a comparar las variaciones de
los precios de unos productos con las variaciones de los precios de otros.
EI problema de numeros fndice que examinamos a continuacion tiene por objeto comparar las variaciones de los precios de un grupo de mercancfas. Por ejemplo, el precio de
las acciones de empresas que cotizan en bolsa varfa en un meso Nos gustarfa desarrollar
una medida de la variacion agregada de los precios. Los numeros fndice pretenden resolver
esos problemas.
Indice de precios de un unico articulo
Comenzamos nuestro analisis de los numeros fndice con un sencillo caso. La Figura 19.1
es una hoja de calculo Excel que muestra el calculo de un fndice de precios de las acciones
de Ford Motor Company en un periodo de 12 semanas. La segunda columna contiene el
precio efectivo de las acciones. Es algo diffcil interpretar estos numeros, pero esta tarea
puede simplificarse calculando un fndice de precios utilizando el precio de la primera semana como periodo base. En la tercera columna, vemos el fndice de precios calculado.
Asf, el fndice de precios de la segunda semana es
100 (
19875)
2~,25
= 98,1
basandose en el precio de la segunda seman a de 19,875. Los porcentajes calculados de esta
forma se Haman numeros fndice del precio. La eleccion del periodo base es arbitraria. Podrfamos haber elegido cualquier otra semana como base y haber expresado todos los precios en porcentaje del precio de esa semana.
La ventaja de utilizar aquf mimeros fndice reside en que es mas facil interpretar los numeros. Por ejemplo, en la Figura 19.1 vemos inmediatamente que el precio de las acciones
de Ford Motor Company fue un 13,6 por ciento mas alto en la seman a 12 que en la 1.
Figura 19.1.
Precios e fndi ce de
precios de las
acciones de Ford
Motor Company en
12 semanas.
X Microsoft Excel Book1
Price
Price Index
20.250
100.0 '
19.000
19.750
20.250
19.875
19.375 '
19625
21125
22.375
25.000
23000
93.8
97.5
100.0
98.1
95.7
96.9
1043 '
110.5 :
123.5
1136 ,
100(19.875J=98. 1
20.25
19875c:::JEIl.-"--L~=:....!..._-..l
4:
5'
6'
7
8
9'
10 '
11
12
Capitulo 19. Analisis de series temporales y prediccion
767
Calculo de indices de precios de un unico articulo
Supongamos que tenemos una serie de observaciones a 10 largo del tiempo del precio de un
unico articulo. Para construir un indice de precios, elegimos como base un periodo de tiempo y
expresamos el precio de cad a periodo en porcentaje del precio del periodo base. Por 10 tanto,
si Po representa el precio del periodo base y P, el precio del segundo periodo, el indice de precios del segundo periodo es
Indice de precios agregado no ponderado
A continuacion, vemos como se representan las variaciones de los precios agregados de un
grupo de artfculos. La Figura 19.2 es una hoja de calculo Excel que muestra los precios
pagados a los agricultores estadounidenses, en dolares, pOl' quintal por el trigo, el mafz y la
soja en 10 anos. La tabla tarribHm muestra una manera de lograr un fndice de precios agregada de estos cultivos. Calculamos el precio medio de cada ano y utilizamos esa media
para construir un fndice de la media, utilizando el primer ano como base.
Figura 19.2.
Precios por quintal
de tres cultivos en
10 anos: fndi ce de
precios agregado
no ponderado.
.x NJClosoft [lICel , Flguro 11 1
Puc e Indell.xls
I
Med ia simple
Es facil calcular el fndice de precios agregado no ponderado, como muestra la Figura 19.2. Expresa el precio medio de cada ano en porcentaje del precio medio del ano base.
Sin embargo, no tiene en cuenta las diferencias entre las cantidades cultivadas de estos
productos. La formu la de la Figura 19.2 indica la division de las sumas de los precios. Eso
es, por supuesto, 10 mismo que dividir pOl' las medias de estos precios. Estas medias serfan
el resultado de dividir las sumas del numerador y del denominador por 3.
Un indice de precios no ponderado
Supongamos que tenemos una serie de observaciones en el tiempo sobre los precios de un
grupo de K articu los . Se elige como base un periodo de tiempo.
EI indice de precios agregado no ponderado se obtiene calculando el precio medio de
estos articulos en cada periodo de tiempo y calculando a continuaci6n un indice de estos preGios medios. Es decir, el precio medic de cada periodo se expresa en porcentaje del precio
medio del periodo base. Sea POi el precio del i-esimo articulo en el periodo base y P'i el precio
768
Estadfstica para administracion y economfa
de este articulo en el segundo periodo. EI indice agregado no ponderado de precios de este
segundo periodo es
K
L
Pli
100
indice de precios agregado ponderado
En general, nos gustarfa ponderar los precios por alguna medida de la cantidad vendida.
Una posibilidad es utilizar las cantidades medias de algunos de los periodos en cuesti6n 0
de todos. En muchos casos, es caro obtener cantidades, por 10 que los fndices se basan en
cantidades de un unico periodo. Cuando estas cantidades proceden del periodo base, el fn dice resultante se llama indice de precios de Laspeyres.
El fndice de Laspeyres compara, en efecto, el coste total de comprar las cantidades del
periodo base en el periodo base con el coste total de comprar estas mismas cantidades en
otros periodos. Para ilustrarlo, consideremos los datos de la Figura 19.2 sobre los precios
de los cultivos con la informaci6n adicional de que la producci6n en el ano 1 fue de l.352
millones de quintales de trigo, de 4.152 millones de quintales de mafz y de l.127 millones
de quintales de soja. Por 10 tanto, el coste, en mill ones de d6lares, de la producci6n total
del ano 1 fue
.
(l.352)(1,33) + (4.152)(1 ,33) + (1.127)(2,85) = 10.532
En el ano 2, a los precios vigentes entonces, el coste total de comprar las cantidades del
ano base habrfa sido
(l.352)(1,34) + (4.152)(1,08) + (1.127)(3,03) = 9.711
El fndice de precios de Laspeyres del ano 2 es, pues,
9.7 11 )
100 ( 10.532 = 92,2
La Figura 19.3 muestra el fndice completo correspondiente a estos datos ca!culado de esta
forma.
EI Indice de precios de Laspeyres
Supongamos que tenemos un grupo de K mercancias de las cuales se dispone de informaci6n
sobre los precios que ten ian en un periodo de tiempo. Se selecciona un peri odo como base del
indice. EI Indiee de preeios de Laspeyres en cualqu ier periodo es el coste total de comprar
las cantidades comerciadas en el periodo base a los precios del periodo de interes, en porcentaje del coste total de comprar estas mismas cantidades en el periodo base.
Sea POi el precio y %i la cantidad comprada del i-esimo articulo en el periodo base. Si P1i es
el precio del i-esimo articulo en el segundo periodo, el indice de precios de Laspeyres del
periodo es
100
Capitulo 19. Analisis de series temporales y pred iccion
Figura 19.3.
fndice de precios de
Laspeyres de tres
cu ltivos.
769
X Microsoft Excel" Figure 17 1 Price Index. xl.
1I~ Eile !::dit 'liew Insert Fgrmat l ools Qata ~HStat ~indow Wji! 2!mulate tlelp
ID~ !iii I ~ [9. ~ 1JI, i%ll @ 4 1\" .
~
~+ ~,
r .. ·1 t;,
1L f,.
I U
~
~
$
%0 J +.00
,,0 ••
_
_ _ Ea !
+.
- .-",·,,·,,··-"".···-:",,·-,,·,,"""·"·--1-"·"··············,,"'''...,,''''
-.--..
E6
,Y
. " , = =SUlvlPRODUCT($B$4:$D$4 ,B6D6)
-j'Ic;.-;;;--,,----,, • .10. 1B
A . -J
{ ' _."."."
B
,-~"
C
Iiii
D
.-----~
=-
I
E
F
G
2
3
4
5
6
7
B
9
10
11
12
13
14
15
16
. Yea'r
VVhe'al'
Corn
Soybeans Total Cost'
Year 1
,
Production
1,352
4,152
,127
Year
Prices
1.33
1.33
1>
285 1 lO,532!
1.08 '
2'
134
3.03
9,711 :
4.37
13,323
1,76 '
3
1.57
4,
395 :
5.68 '
2.55
22,329
5,
25,594
3. 03
6.64 :
4.09 !
6
3.56
2.54
4.92 '
20 ,904 '
6.31 '
20 ,293
7:
273 .
2.15
3:
2.33
18,773
2.02 :
6.42 '
20,255 '
2.97
2.25
6.12 '
9:
10
3.73
2.52
6.28
22 ,651
Laspeyres
Index
100
922 ' ~
131I
212.0 :
243.0 '
19B.5 '
1927 i
178.2 '
192.3 ,
215.1
-
JOo( 10,532
9,711 )= 92.2
17
Es util comparar la formula del indice de precios de Laspeyres con la del indice de precios agregado no ponderado. La diferencia es que, cuando se calcula el indice de Laspeyres, el precio de cada articulo se pondera por la cantidad comerciada en el periodo base.
Vemos que el indice de precios de Laspeyres utiliza unicamente la informacion sobre
la cantidad del periodo base. Eso es valioso cuando es diflcil obtener esa informacion de
cada periodo. Podrfa ser un inconveniente si las cantidades del periodo base no fueran representativas de la serie temporal examinada. Por 10 tanto, el indice de precios podria quedarse anticuado. Este problema puede resolverse calculando un fndice de precios de Laspeyres movil, en el que el periodo base se cambia de vez en cuando obteniendo
informacion sobre la cantidad de los nuevos periodos base. Muchos de los indices de precios oficiales que se publican, como el indice de precios de consumo, se calculan esencialmente de esta forma.
Indice de cantidades agregado ponderado
Los indices de precios constituyen una representacion de la evolucion de los precios agregados de un grupo de mercancfas. Tambien podriamos querer una representacion de la
evolucion de las cantidades totales comerciadas. De nuevo, es probable que cualquier enfoque razonable de este problema de como resultado un indice de cantidades ponderado, ya
que probablemente querriamos dar mas peso a un cambio de la cantidad comprada de un
articulo muy caro que a un cambio de la misma cantidad comprada de un articulo barato.
Un metoda para lograrlo es el Indice de cantidades de Laspeyres, que ilustramos con las
cantidades producidas de trigo, maiz y soja de la Figura 19.4.
El fndice de cantidades de Laspeyres pondera las cantidades por los precios del periodo
base. Las ponderaciones de los precios son 1,33, 1,33 Y 2,85 en el caso del trigo, el maiz y
la soja, 10 que da como resultado un valor total en el ano 1 de lO.532 millones de dolares .
Para obtener un indice de cantidades del ano 2, 10 comparamos con el valor total de la produccion del ano 2, si hubieran estado vi gentes los precios del ano 1; es decir,
(1.618)(1 ,33) + (5.641 )(1,33) + (1.1 76)(2,85) = 13.006
770
Estadfstica para administracion y economfa
Figura 19.4.
Produccion, en
millones de
quintales, e fndice
de cantidades.
E
Microsoft Excel- Figure 17.1 Pnce Index
_! ~
Wheat
Year
Corn
Soybea ns Total Cost
Laspeyre s
Quant ity
inde x
Year 1
Pric es
1
2
3
10
1.33
1,352
1,61 8
1,545
1.105
2.122
2.142
2,026
1.199
2,134
2,370
1.33
4,152
5,641
5,573
5.647
5.829
6.266
6,357
7,082
7,933
6,648
2.85
1,127
1,176
1,271
1.547
1,547
1.288
1.116
1,843
2,268
1,817
10,532
13,0061
13,089
14 ,187
14.984
14 ,853
16,040
17,064
19,861
17,172
100( 13,006) = 123.5
10,532
1341
1423
141 .0
152.3
162.0
188.6
1GJ.0
El fndice de cantidades de Laspeyres del ano 2 es, pues,
13,006)
100 ( 10,532 = 123,5
La Figura 19.4 muestra las cantidades producidas y el indice de cantidades de un periodo
de 10 anos,
EI fndice de cantidades de Laspeyres
Tenemos datos sobre la cantidad de un conjunto de artfculos recogidos durante un conjunto de
K afios. Se selecciona un periodo como periodo base, Elindice de cantidades de Laspeyres
en cualquier periodo es el coste total de las cantidades comerciadas en ese periodo, basado
en los precios del periodo base y expresado en porcentaje del coste total de las cantidades del
periodo base.
Sean %i y POi la cantidad y el precio del i-esimo articulo en el periodo base y q1i la cantidad
de ese articulo en el periodo de interes. EI indice de cantidades de Laspeyres de ese periodo
es, pues,
100
Cambio del periodo base
Las series oficiales de mimeros fndice se actualizan cambiando el periodo base por uno
mas reciente. En estos casos, normalmente se calcula el valor del fndice original en el
periodo que ahora se toma como base. Observese a modo de ilustraci6n el caIculo de la
columna F de la Figura 19,5, que muestra los indices de precios del trigo, el mafz y la soja.
La columna F muestra el indice de precios de los cultivos de los anos 1 a 6, utilizando el
ano 1 como base comenzando por la fila 14 de la columna F. La columna H indica el fndice de precios de Laspeyres de los anos 6 a 10, utilizando el ano 6 como base, Estos indices
se representan en la Figura 19.6, en la que es evidente la discontinuidad en el ano 6.
Analisis de series temporales y predicci6n
Capitulo 19.
Figura 19.5.
in dice de precios
ag regado de
Laspeyres utilizando
diferentes anos
base.
X
NtcfOloh
~
Excel ·
t" ,dO
D (;i:
FIQUIO
~
17 1 P"co Indo. all
1"'''' '",mot look
~".
" cit Cl>. ~' i ,1\ lib e <1
;. ,
_.. _ _ WUI jJmuI.t.
IjoIo
1 1W1~ 1 ~1Q,,1:JHE]
.:l!fJ~
I
.., . " , to '5' I 1: f· !l HI}. ~ ! 100% · 100
:1 10 . 1B I l l 8'. Oil
$ % • :.8.~ \If t,e .-:= ~ .~ :_
*,-.:1
- ,, ~ fl1-;100/SF$1:' _. -- -- - ."'.~ -- .... -----.
;.~." .
'-- -~u
m:
771
..L
2
.1::'
Sphc~d
4 1
'ie;a r
INheat
(0111
1,352
4,152
So)'be-ans Tola! Co;~t
Laspe yres
Tot al Co:l
L.lJs pey re s Inde x
Inde x
Year & 8 lse
('fecH G BasEl)
) ';- (11 '1
5 I PwJ!j.:tlon
6 ; \'e,ir
7
8 ,
9
10
4
11
5
12 j
6
t
lieal 6
Prices
133
1301
176 '
3 95 ·
4 09
356
1 33
108
157
255
303
254
-;4
21 42.00
626600
G
3.56
254
;~
~
li
ffi l
19 )
m
2.73
233
297
215
202
225
2~
13 : Produc tion
29 i
9
to( ~ , i , t. !
1,1"27
3m
IO.5 3 ~
1000
" .U53
9.711
13.823
22 ,32'3
922
1;;,540
'16.5
1312
19.::36
31,755
66 1
1068
2120
2430
1985
25,~94
20 .904
504
35.m!
100.0 -243-.0) = 122.4
( 198.5
11$300
.<j
S,2
681
fi 42
61:'
6~
F19tJr€> 176
n,G7fJ
23,091
1000
94.0 ·
667
94 9
107 O·
I(\J G
940
867
94 9
1070
25 ,917
2<3,343
31,976
Yr" .. I"de, ,..._ ...... -,•.lr-.- -.., - _-. -_ -..-.., - -t.ll
,. - .-..-j - , - - - - - ,
,
.4.. .. '_._ ~ _____ ~ _____,.",, __._ •. _ '.'.. '_'" _.'
\,;!:~~,.I1,,! .A,.El.U4r.~.U,~ ,.A..!.W:U.?,-'!.Ji._~~!J:?,LA fiIJ UI· C I 't.!; A.fm~
~eady
.
, 1--' i - -
r'"I"
.
.~:~~~IJ..~.~:::'::~.::'?~.::.~.:..~.:.... ...i.!lr..~~::-*.,~~:l::'~:'.'~~.1:Jl~ Mic<a..ft E,ce! · fi!>< ..
'N(X>1
i
:i:!l!li"·~·1 1I .~Ii.\! '.
Examinando la Figura 19.6, es diffcil comprender claramente las pautas de precios de
to do el periodo. Por 10 tanto, prefeririamos examinar un indice de precios enlazado que
tuviera el ano 6 como ano base. En el Indice original bas ado en el ano 1, el Indice del ano
6 era 198,5 como se ve en la Figura 19.5. Para transformar el indice del ano 6 basado en el
ano 1 en un fndice del ano 6 tomando como base el ano 6, dividimos por 198,5 y multiplicamos por 100. Tambien podemos converti r todos los demas indices cuya base es el ano 1
a una base del ano 6 dividiendo por 198,5 y multiplicando por 100. Por ejemplo, el nuevo
Indice del ano 5 es
2430)
100,0 '
( 198,5
Figura 19.6.
Gr3fico temporal del
indice de precios
agregado de
Laspeyres can los
anos 1-6 (ana base
1) y los arios 6-10
(ano base 6).
=
122,4
300,0
250,0
1/1
Q)
200,0
.!:a
"C
I:
Q)
(,)
150,0
.;:
D..
----.-
100,0
J
/
/\
-- .......
---
50,0
0,0
o
2
4
6
Year
8
10
772
Estadfstica para administracion y economfa
La Figura 19.7 representa el fndice enlazado que se obtiene utili zando co mo base el
ano 6. Este gnifico es una representaci6n In:is clara de la pauta de vari aci6n de los precios
en el periodo de 10 anos.
Figura 19.7.
fndice de precios
agregado de
Laspeyres enlazado
del trigo, el marz y
la soja (ano
6=100).
140,0
120,0
100,0
><
(1)
"c
80,0
u
.;:
60,0
(1)
D..
40,0
20,0
0,0
0
2
4
8
6
10
Year
EJERCICIOS
Ejercicios basicos
Ejercicios aplicados
19.1. Suponga que esta analizando un mercado y en-
Nota : los ejercicios 19.4 a 19.7 deben realizarse mediante el programa Excel.
cuentra un fndice de precios de Laspeyres que se
calculo utilizando el ano 2000 como periodo base. Interprete los resultados suponiendo que el
fndice de 2003 es:
a) 134,5
b) 97,4
c) 101,7
19.2. Vuelva a la Figura 19.4. Calcule el fndice de
cantidades de Laspeyres revisado de los anos 1 a
6 suponiendo que los precios del ano 1 son 1,45
(trigo), 1,21 (mafz) y 2,98 (soja).
19.3. Las universidades tienen muchos costes, entre los
cuales se encuentran los costes de la energfa, los
libros, el laboratorio y demas equipo, el material
de oficina y la mana de obra. Suponga que Ie piden que muestre como han variado los niveles de
precios a los que se enfrenta su universidad en
los 10 Ultimos anos. l,Que dificultades esperarfa
encontrarse y como intentarfa resolverlas?
19.4. La tabla adjunta muestra el precio por accion del
Banco de Nueva York, Inc., de 12 semanas.
Semana Precio Semana Precio Semana Precio
2
3
4
35
357/8
346/8
343/8
5
6
7
8
35
347/8
35
346/8
9
10
11
12
346/8
35 2/8
38 6/8
37 1/8
a) Calcule un fndice de precios utilizando la semana 1 como periodo base.
b) Calcule un fndice de precios utilizando la semana 4 como periodo base.
19.5. Un restaurante ofrece tres platos especiales: bistec, pescado y pollo. La tabla adjunta muestra
sus precios medios (en dolares) en los 12 meses
del ano pasado.
Capitulo 19.
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Sepliembre
Oclubre
Noviembre
Diciembre
Bistec
Pescado
Polio
7,12
7,41
7,45
7,70
7,72
7,75
8,10
8,15
8,20
8,30
8,45
8,65
6,45
6,40
6,25
6,60
6,70
6,85
6,90
6,84
6,96
7.10
7,10
7,14
5,39
5,21
5,25
5,40
5,45
5,60
5,54
5,70
5,72
5,69
5,85
6,21
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Bistec
Pescado
Polio
123
110
115
101
118
100
92
87
123
131
136
149
169
160
18 1
152
140
128
129
130
164
169
176
193
243
25 1
265
231
263
237
221
204
293
301
327
35 1
773
19.6. La tabla adjunta muestra los salarios por hora de
tres tipos de empleados de una pequena empresa
en 6 anos.
Aiio
Obreros
J
2
3
4
5
6
10,60
11 ,10
11 ,80
11,90
12,30
12,50
Administrativos Supervisores
8,40
8,70
9,10
9,20
9,60
9,70
16,40
19,50
19,90
18,80
19,00
19,30
Tome el ano 1 como base. Ese ano habia 72
obreros, 23 administrativos y 10 supervisores.
a) Halle el fndice de salarios por hora no ponderado.
b) Halle el fndice de salarios por hora de Laspeyres.
La tabla adjunta muestra el nllmero mensual de
pedidos de estos platos especiales. Tome enero
como base.
Mes
Amilisis de series temporales y prediccion
19.7. La tabla adjunta muestra un indice de precios de
un grupo de mercancfas en 6 anos. Calcule un fndice enlazado utilizando el ano 4 como base.
Aiio
2
Mia base 1
Ano base 2
100
3
4
5
6
108,4 114,3 120,2
100
103,5 107,8
19.8. Explique por que es util desarrollar un fndice
a) Halle el fndice de precios agregado no ponde-
de precios de un grupo de productos, por ejemplo, un fndice de precios de la energfa. (,Cmlles
son las ventajas de un fndice de precios ponderado?
rado.
b) Halle el fndice de precios de Laspeyres.
c) Halle el fndice de cantidades de Laspeyres.
19.2. Un contraste no parametrico de aleatoriedad
Para analizar datos de series temporales, hay que realizar en primer lugar un contraste de
aleatoriedad de las series temporales. Presentamos el contraste de rachas, que es un contraste no parametrico especialmente facil de realizar.
Para mostrar el contraste, examinaremos primero una serie de 16 observaciones diarias
sobre un Indice del volumen de acciones negociadas en la bolsa. Los datos se muestran en
la Tabla 19.3 y se representan en la Figura 19.8. En esta figura, se ha trazado una lfnea en
la mediana. La mediana de un numero par de observaciones es la media del par central
cuando las observaciones se ordenan en sentido ascendente. En este caso, es
Mediana =
107
+ 108
2
107,5
Si esta serie fuera aleatoria, el volumen negociado en un dia seria independiente del
volumen negociado en cualquier otro dla. En concreto, un dla de un elevado volumen de
774
Estadfstica para administraci6n y economfa
Tabla 19.3.
Figura 19.8.
Indice del volumen
de acciones
negociado seg un el
dfa.
fndice del volumen de acciones negociado.
D1a
VolumeD
Dia
VolumeD
Dia
VolumeD
1
2
3
4
98
93
82
103
5
6
7
113
9
10
114
107
130
III
104
103
8
11
III
12
109
Dia
VolumeD
13
109
108
128
14
15
16
92
~---------------,
•
120 -
•
•
c
(1)110•
•••
E
107,5 ... ......... ... ... .. .... ....... ........ ... .. .
::::l
g
100 -
•
90 80
• •
•
•
-~
•
•
_ _ _-,~_ _ _. -_ _ _,-~
o
10
5
15
Dfa
contrataciones no tendrfa mas probabilidades que cualquier otro dfa de ir seguido de otro
dfa de un elevado volumen de contrataciones. EI contraste de rachas que presentamos aquf
divide las observaciones en un subgrupo situado por encima de la mediana y un subgrupo
situado por debajo de la mediana, como muestra la Figura 19.8; la mediana es 107,5 . Si +
representa las observaciones situadas por encima de la mediana y - las observaciones situadas por debajo de la median a, observamos la siguiente pauta a 10 largo de los dfas consecutivos:
-- - -++ - - +-+++++ Esta secuencia esta formada por una racha de cuatro « - », seguida de una racha de dos
«+ », una racha de dos «- », una racha de un «+ », una racha de un «- », una racha de
cinco «+» y, finalmente, una racha de un «- ». En total, hay, pues, R = 7 rachas.
Si, como cabrfa sospechar aqu!, existe una relacion positiva entre las observaciones
contiguas en el tiempo, serfa de esperar que hubiera relativamente pocas rachas. En nuestro
ejemplo, nos preguntamos que probabilidad hay de observar siete rachas 0 menos si la serie es realmente aleatoria. Para eso es necesario saber cual es la distribucion del numero de
rachas cuando la hipotesis nula de la aleatoriedad es verdadera. La Tabla 14 del apendice
muestra los valores tabulados de la distribucion acumulada. En esa tabla vemos que, cuando 11 = 16 observaciones, la probabilidad segun la hipotesis nula de encontrar 7 rachas 0
menos es 0,214. Por 10 tanto, la hipotesis nula de la aleatoriedad solo puede rechazarse
frente a la alternativa de una relacion positiva entre las observaciones contiguas al nivel de
significacion del 21,4 por ciento. Este no es suficientemente pequeno para que sea razonable rechazar la hipotesis nula ni suficientemente grande para apoyar firmemente la hipotesis nula. No hemos encontrado simplemente pruebas contundentes para rechazarla. Los
contrastes de aleatoriedad basados en muestras pequenas como esta tienen poca potencia.
Capitulo 19.
Analisis de series temporales y predicci6n
775
EI contraste de rachas
Supongamos que tenemos una serie temporal de n observaciones. Representemos las observaciones situadas por encima de la media con el signo « + » y las observaciones situadas por
debajo de la media con el signo « - ». Utilicemos estos signos para definir la secuencia de observaciones de la serie. Sea Rei numero de rachas que hay en la secuencia. La hipotesis nula
es que la serie es un conjunto de variables aleatorias. La Tabla 14 del apendice indica el nivel
de significacion mas bajo al que puede rechazarse esta hipotesis nula frente a la alternativa de
una relacion positiva entre las observaciones contiguas, como una funcion de R y n.
Si la alternativa es una hipotesis bilateral sobre la ausencia de aleatoriedad, el nivel de significacion debe duplicarse si es de menos de 0,5. Si el nivel de significacion a de la tabla es
superior a 0,5, el nivel de significacion adecuado para el contraste frente a la alternativa bilateral es 2(1 - a).
En el caso de las series temporales en las que n > 20> la distribuci6n normal es una
buena aproximaci6n de la distribuci6n del numero de rachas segun la hipotesis nula. Puede
demostrarse que segun la hip6tesis nula
n
R---l
Z=
2
---;::::;;:::::==
n 2 - 2n
4(n - 1)
sigue una distribucion normal estandar. Este resultado es un contraste de aleatoriedad.
EI contraste de rachas: grandes muestras
Dado que tenemos una serie temporal de n observaciones y n > 20, el numero de rachas, R,
es el numero de secuencias que se encuentran por encima 0 por debajo de la mediana. Queremos contrastar la hipotesis nula
Ho: la serie es aleatoria
Los siguientes contrastes tienen un nivel de significacion a.
1.
Si la hipotesis alternativa es una relacion positiva entre las observaciones contiguas, la
regia de decision es
n
R - --l
2
Rechazar Ho si
(19.1 )
4(n - 1)
2.
Si la hipotesis alternativa es una hipotesis bilateral de ausencia de aleatoriedad, la regia
de decision es
n
n
R- - - l
Rechazar Ho si
2
2
n
-
2n
4(n - 1)
R - --l
<
2
- Z(1./2
0
n2 -
2n
4(n - 1)
>
Z(1./2
(19.2)
776
Estadfstica para administraci6n y economfa
EJEMPLO 19.1. Amilisis de los datos sobre las ventas
(contraste de rachas)
Le han pedido que averigiie si los 30 arios de ventas anuales siguen una pauta aleatoria
de una observaci6n a la siguiente en una serie temporal.
Solucion
Pinkham
Sales Data
Los datos para realizar este estudio se encuentran en un fichero de datos Hamado Pinkham Sales Data y en el disco de datos. La Figura 19.9 es un gnifico de series temporales de los datos en el que se ha trazado la mediana. El examen de este grafico sugiere
que las observaciones no son independientes, ya que parece que siguen una pauta. Los
estadfsticos del contraste de rachas pueden calcularse utilizando el pragrama Minitab u
atro paquete estadfstico. Realizando un amllisis por computador u observando la Figura 19.9, vemos que la serie tiene ocho rachas y que la hip6tesis nul a de una serie temporal aleatoria se rechaza con un p-valor = 0,0030.
•• •
2500
•
•
(f)
2000
Q)
ell
•
..• .-
1.768,5 .-•• ~ •••••••••••••••••• 11 ••••••••••••
•
1500
• • ••
•
• ••
•
••
•
•
1000 ' r - - - _ , r - - - - - , - - - - - - - - . - - '
1930
1940
1950
1960
Year
Figura 19.9.
Datos sobre las ventas de Lydia Pinkham a 10 largo del tiempo.
Tambien podrfamos utilizar el numero de rachas y el estadfstico del contraste para
calcular el valor de Z del contraste:
n
R -- -l
Z=
2
n
2
-
2n
4(n - 1)
8 - 15 - 1
-2,97
)900 - 60
116
y en la Tabla 1 del apendice vemos que el p-valor resultante de un contraste de dos colas es 0,0030, Vemos, pues, que las pruebas a favor de la hip6tesis de que la serie no es
aleatoria son abrumadoras.
Capftulo 19.
Analisis de series temporales y prediccion
777
EJERCICIOS
Ejercicios aplicados
Ejercicios basicos
19.9. Una serie temporal contiene 18 observaciones.
i Cua! es la probabilidad de que el numero de
rachas sea
a) inferior a 5?
b) superior all?
c) inferior a a 8?
19.10. Una serie temporal contiene 50 observaciones.
i Cual es la probabilidad de que el mimero de
rachas sea
a) inferior a 14?
b) inferior a 17?
c) superior a 38?
19.11. Una serie temporal contiene 100 observaciones.
i Cua! es la probabilidad de que el numero de
rachas sea
a) inferior a 25?
b) inferior a 41?
c) superior a 90?
19.12. " •. 1} El fichero de datos Exchange Rate muestra
un fndice del valor del dolar estadounidense
frente a las monedas de sus socios comerciales
durante 12 meses consecutivos. Utilice el contraste de rachas para hacer un contraste de aleatoriedad de esta serie.
19.13.
I., El fichero de datos Inventory Sales muestra
el cociente entre las existencias y las ventas de
la industria y el comercio de Estados Unidos en
un periodo de 12 afios. Realice un contraste de
aleatoriedad de esta serie utilizando el contraste
de rachas.
19.14.
fi, El fichero de datos Stock Market Index
muestra los rendimientos anuales de un fndice
bursatil durante 14 afios. Realice un contraste de
aleatoriedad utilizando el contraste de rachas.
19.15. (r .. El fichero de datos Gold Price muestra el
precio del oro (en dolares) vigente a finales de
afio de 14 afios consecutivos. Utilice el contraste de rachas para realizar un contraste de aleatoriedad de esta serie.
19.3. Componentes de una serie temporal
========~======================
En los apartados 19.3 a 19.5 presentamos algunos metodos descriptivos para analizar datos
de series temporales. La serie de interes se representa por medio de Xl' Xb ... , X/l Y en el
periodo t el valor de la serie es Xt.
Un modelo convencional de la conduct a de las series temporales identifica varios componentes de la serie. Tradicionalmente, en la mayoria de las series temporales se representan cuatro componentes al menos en parte:
1.
2.
3.
4.
Macro2000
El
El
El
El
componente
componente
componente
componente
tendencial
estacional
cfc1ico
irregular
Muchas series temporales muestran una tendencia a aumentar 0 a disminuir a un ritmo bastante continuo durante largos periodos de tiempo, 10 que indica la existencia de un
componentc tendencial. Por ejemplo, los indicadores de la riqueza nacional, como el producto interior bruto, normalmente crecen con el paso del tiempo. Las tendeneias a menudo se mantienen y, en ese easo, este eomponente es importante para haeer predicciones.
La Figura 19.10 muestra la serie temporal del producto interior bruto trimestral de mas
de 50 alios procedente del fichero de datos Macro2000 que se eneuentra en el disco de
datos. Esta pauta muestra c1aramente una fuerte tendencia ascendente que es mayor en
unos periodos que en otros. Este grafieo temporal revela un notable componente tenden-
778
Estadfstica para administraci6n y economfa
Figura 19.10.
Evoluci6n del
producto interior
bruto a 10 largo del
tiempo que indica la
existencia de una
tendencia.
8.000
0
...2
....
..Q
7.000
6.000
0
.;::
(l)
...-
c
0
...u
~
5.000
4.000
3.000
"0
0
0::
2.000
1.000
1950
1970
1960
1980
1990
2000
Tiempo (ano y trimestre)
cial que es importante para el amllisis inicial y que normalmente va seguido de amllisis
mas sofisticados, como mostramos en futuros apartados.
Otro importante componente es la pauta estacional. La Figura 19.11 muestra los beneficios trimestrales por acci6n de una empresa. Los beneficios del cuarto trimestre son considerablemente mas altos y los del segundo trimestre son algo mas altos que los de los demas periodos. Observese que esta pauta continua repitiendose en el ciclo de cuatro
trimestres que representa cada ano. Ademas del componente estacional, tam bien hay una
notable tendencia ascendente en los beneficios por acci6n. Nuestro tratamiento de la estacionalidad depende de nuestros objetivos. Por ejemplo, si es importante predecir cada trimestre de la forma mas precisa posible, incluimos un componente de estacionalidad en
nuestro modelo. En el apartado 14.2, por ejemplo, mostramos que pueden utilizarse variables ficticias para estimar un componente de estacionalidad en una serie temporal. Por 10
tanto, si prevemos que la pauta de estacionalidad continuara, debemos incluir la estimaci6n
del componente de estacionalidad en nuestro modelo de predicci6n.
Figura 19.11.
Beneficios
trimestrales por
acci6n de una
empresa que
indican la existencia
de un componente
estacional.
3 -
•
~p
-
u
(l)
•
c
(l)
III 1 -
•
•
•
t;::
•
•
••
•
• •• •
•
• •
••• ••• •• • • •
•
••
•
o2
3
4
5
6
7
8
9
Ario y trimestre
Para algunos otros fines, la estacionalidad puede ser una molestia. En muchas aplicaciones, el analista requiere una valoraci6n de las variaciones globales de una serie temporal, que no este contaminada por la influencia de factores estacionales. Supongamos, por
ejemplo, que acabamos de recibir las cifras mas recientes de los beneficios del cuarto trimestre de la empresa de la Figura 19.11. Ya sabemos que estas seran probablemente mucho mas altas que las del trimestre anterior. Lo que nos gustarfa hacer es averiguar que
Capitulo 19.
Analisis de series temporales y predicci6n
779
parte de este aumento de los beneficios se debe a factores puramente estacionales y que
parte representa un verdadero crecimiento subyacente. En otras palabras, nos gustarfa producir una serie temporal libre de la influencia estacional. Se dice que una serie de ese tipo
esta desestacionalizada. En el apartado 19.5 nos extenderemos algo mas sobre el ajuste estacional.
Las pautas estacionales en una serie temporal constituyen una forma de conducta oscilatoria regular. Ademas, muchas series temporales empresariales y economicas muestran
pautas oscilatorias 0 cfclicas que no estan relacionadas con la conducta estacional. Por
ejemplo, muchas series economicas siguen pautas cfcIicas ascendentes y descendentes. En
la Figura 19.9 vemos una pauta cfcIica en los datos sobre las ventas de Lydia Pinkham.
Observamos una disminucion de las ventas hasta un minimo en 1936, seguida de un
aumento hasta un maximo a mediados de los afios 40 y, a partir de entonces, una disminucion contin ua. Esta pauta es una serie temporal cfcIica frec uente y podemos describir la
conducta historica por medio de los movimientos cfcIicos. Sin embargo, no estamos sugiriendo que en esas pautas hist6ricas exista suficiente regularidad para poder hacer una prediccion fiable de los futuros maximos y mfnimos. De hecho, los datos de los que se dispone inducen a pensar que no es as!.
Hemos analizado tres fuentes de variabilidad en una serie temporal. Si pudieramos caracterizar las series temporales pri ncipalmente por medio del componente tendencial, el estacional y el cfcIico, las series variarfan de una manera uniforme con el paso del tiempo y
podrfamos hacer predicciones utilizando estos componentes. Sin embargo, los datos efectivos no se comportan de esa forma. La serie muestra, ademas de los principales componentes, componentes irregulares, inducidos por multitud de factores que influyen en la conducta de cualquier serie real y que muestran pautas que parecen impredecibles basandose en la
experiencia anterior. Puede considerarse que estas pautas son simi lares al termino de error
aleatorio de un modelo de regresion. En todos los ejemplos de componentes que hemos representado hasta ahora, podemos ver cIaramente el componente irregular aftadido a los
componentes estructurales.
Analisis de los componentes de las series temporales
Una serie temporal puede describirse mediante modelos basados en los siguientes componentes:
Tt Componente tendencial
St Componente estacional
Ct Componente ciclico
Componente irregular
't
Utilizando estos componentes, podemos decir que una serie temporal es la suma de sus componentes:
Xl = T,
+ St + Ct + It
En otras circunstancias , tambien podriamos decir que una serie temporal es el producto de sus
componentes, representado a menudo como un modelo de suma logarftmica:
No tenemos que limitarnos a estas dos formas estructurales. Por ejemplo, en algunos cas os
podrfamos tener una combinaci6n de formas aditivas y multiplicativas.
780
Estadfstica para administraci6n y economfa
Una gran parte de los primeros amllisis de series temporales trataban de aislar los componentes de una serie, 10 que permitfa expresar en cualquier momenta del tiempo el valor
de la serie en funci6n de los componentes. Este enfoque, en el que a menudo se utilizaban
medias m6viles, que analizamos en los dos apartados siguientes, se ha sustituido en gran
parte por enfoques mas modernos. Una excepci6n es el problema de la desestacionalizaci6n, que requiere la extracci6n del componente estacional de la serie y que analizamos en
el apartado 19.5.
El enfoque mas moderno del analisis de series temporales implica la construcci6n de
un modelo formal, en el que estan presentes, explicita 0 implicitamente, varios componentes, para describir la conducta de una serie de datos. Cuando se construyen modelos, hay
dos formas posibles de tratar los componentes de una serie. Una es considerarlos fijos a 10
largo del tiempo, de tal manera que una tendencia podrfa representarse por medio de una
lfnea recta. Este enfoque a menudo es uti! para ana!izar datos ffsicos, pero dista de ser adecuado en las aplicaciones empresariales y econ6micas, en las que la experiencia sugiere
que cualquier regularidad aparentemente fija es con demasiada frecuencia ilusoria cuando
se examina detenidamente. Para ilustrarlo, supongamos que examinamos solamente los datos de Lydia Pinkham correspondientes a los afios 1936-1943 . Vemos en la Figura 19.9
que en este periodo parece que hay una tendencia ascendente fija y continua. Sin embargo,
si esta «tendencia» se hubiera proyectado hacia delante unos cuantos afios a partir de 1943,
las predicciones resultantes de las futuras ventas habrfan sido muy inexactas. S610 mirando
el grafico de los afios siguientes vemos 10 inadecuado que habrfa sido un modelo de tendencia fija.
Cuando se trata de datos empresariales y econ6micos, es preferible tratar de otra forma
los componentes regulares de una serie temporal. En lugar de considerar que son fijos permanentemente, suele ser mas sensato pensar que evolucionan continuamente con el tiempo. Por 10 tanto, no necesitamos estipular pautas tendenciales 0 estacionales fijas sino que
podemos tener en cuenta la posibilidad de que estos componentes cambien con el tiempo.
Examinaremos este tipo de modelos despues de haber analizado las medias m6viles.
EJERCICIOS
Ejercicios aplicados
19.16. ' , EI fichero de datos Housing Starts muestra
las viviendas iniciadas por mil habitantes en Estados Unidos en un periodo de 24 aftos.
a) Utilice la variante del contraste de rachas
con gran des muestras para realizar un contraste de aleatoriedad de esta serie.
b) Trace un gnifico temporal de esta serie y comente los componentes de la serie que revela este gnifico.
19.17. I~ EI fie hero de datos Earnings per Share
muestra los beneficios por acci6n obtenidos por
una empresa en un periodo de 28 aftos.
a) Uti lice la variante del contraste de rachas
con grandes muestras para realizar un contraste de aleatoriedad de esta serie.
b) Trace un griifico temporal de esta serie y comente los componentes de la serie que revela este grafico.
19.4. Medias moviles
El componente irregular de algunas series temporales puede ser tan grande que oculte las
regularidades subyacentes y dificulte la interpretaci6n visual del grafico temporal. En estas
circunstancias, el grafico real parecera bastante irregular y es posible que queramos suavi-
Capitulo 19. Analisis de series temporales y predicci6n
781
zarlo para tener una imagen mas clara. Podemos reducir este problema utilizando una media movil.
Podemos suavizar el grafico utilizando el metoda de las medias moviles, que se basa
en la idea de que cualquier gran componente irregular en cualquier momento del tiempo
ejercera un efecto menor si promediamos el punto con sus vecinos inmediatos. El metoda
mas sencillo que podemos utilizar es una media movil centrada simple de (2m + 1) puntos.
Es decir, sustituimos cada observacion X t por la media de sf misma y sus vecinas, de manera que
m
1
x/ = 2m
+ 1 j =L- m Xl +j
2m
+
1
Por ejemplo, si fijamos m en 2, la media movil de 5 puntos es
Dado que la primera observacion es
X I'
la primera media movil serra
Esta es la media de las cinco primeras observaciones. En el caso de los datos sobre las
ventas de Lydia Pinkham del ejemplo 19.1, tenemos que en 1933
xj'
=
l.806 + 1.644 + l.814 + l.770 + l.518
5
= l.710,4
Asimismo, x~' es la media de la segunda a la sexta observacion, y asf sucesivamente. La
Tabla 19.4 muestra la serie original y la serie suavizada. Observese que en el caso de las
medias m6viles centradas perdemos la primera y la ultima m observaciones. Por 10 tanto,
aunque la serie original va de 1931 a 1960, la serie suavizada va de 1933 a 1958.
Medias m6viles centradas simples de (2m
+ 1) puntos
Sean X 1 ' X2 , X3 , ... , Xn observaciones de una serie temporal de interes. Puede obtenerse una
serie suavizada utilizando una media m6vil centrada simple de (2m + 1) puntos.
1
x/ =
In
L X
2m + 1 j=-m
(t = m
t+j
+
1, m
+ 2,
... , n - m)
(19.3)
Las medias m6viles pueden hallarse utilizando el program a Minitab, como muestra la
Figura 19.12. Vemos tanto la serie original como la serie suavizada -la serie de medias
moviles de 5 puntos- representadas en relacion con el tiempo. Como puede observarse, la
serie de medias moviles es de hecho mas suave que la serie original. Por 10 tanto, la serie
de medias m6viles ha eliminado el componente irregular subyacente de la serie para mostrar mejor los componentes estructurales.
782
Estadfstica para administraci6n y economfa
Tabla 19.4.
Figura 19.12.
Ventas anuales de Lydia Pinkham can la media m6vil centrada simple
de 5 puntas.
ADO
Ventas
1931
1932
1933
1934
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944
1945
1.806*
1.644*
1.814
1.770
1.518
1.103
1.266
1.473
1.423
1.767
2.161
2.336
2.602
2.518
2.637
Medial
ADo
Ventas
Medial
1.710,4
1.569,8
1.494,2
1.426
1.356,6
1.406,4
1.618
1.832
2.057,8
2.276,8
2.450,8
2.454
2.370,8
1946
1.947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
2.177
1.920
1.910
1.984
1.787
1.689
1.866
1.896
1.684
1.633
1.657
1.569
1.390
1.387*
1.289*
2.232,4
2.125,6
1.955,6
1.858
1.847,2
1.844,4
1.784,4
1.753,6
1.747,2
1.687,8
1.586,6
1.527,2
1.458,4
Moving Average
Media m6vi l
centrada simple de
5 puntas de los
datos sabre las
ventas de Lydia
Pinkham.
2700
•
Actual
.::..
Smoothed
-
Actual
-
Smoothed
",2200
~
co
(f)
1700
Moving Average
length :
MAPE:
1200
10
20
17
MAD:
316
MSD:
149873
30
Time
El tipo de media m6vil que analizamos en este apartado no es mas que uno de los muchos que podrfan utilizarse. A menudo se considera deseable utilizar una media ponderada,
en la que se da la mayor parte del peso a la observacion central y el peso de otros val ores
disminuye conforme estan mas lejos de la observacion central. Por ejemplo, podrfamos utilizar una media ponderada como
x
-
+ 2X - l + 4x + 2x + + x + 2
2
t 1
x* = -t - -t - - - t- - - --t
t
10
En to do caso, el objetivo al utilizar medias moviles es la eliminacion del componente
irregular con el fin de tener una imagen mas clara de las irregularidades subyacentes en
una serie temporal. La tecnica quiza sea mas valiosa con fines descriptivos, en la elaboracion de graficos como el de la Figura 19.12.
Capitulo 19.
Analisis de series temporales y prediccion
783
Extraccion del componente estacional por medio
de medias moviles
A continuaci6n, presentamos un metoda para utilizar medias m6viles con el fin de extraer
los componentes estacionales de las series empresariales y econ6micas. Los componentes
estacionales pueden ser molestos y el analista puede querer eliminarlos de la serie para
apreciar mejor la conducta de otros componentes. Recuerdese tam bien que en el apartado 14.2 mostramos que pueden utilizarse variables ficticias para estimar y controlar los
efectos estacionales.
Consideremos una serie temporal trimestral que tiene un componente estaciona1. Nuestra estrategia para eliminar la estacionalidad es caIcular medias m6viles de cuatro puntos
para reunir los valores estacionales en una unica media m6vil estacional. Por ejemplo, utilizando los datos de la Tabla 19.5 sobre los beneficios por acci6n, el primer miembro de la
serie serfa
0,300 + 0,460 + 0,345
4
+ 0,910
= 0,50375
y el segundo miembro serfa
0,460
+ 0,345 + 0,910 + 0,330
4
= 0,51125
La Tabla 19.5 muestra la serie completa.
Esta nueva serie de medias m6viles deberfa estar libre de estacionalidad, pero aun hay
un problema. La localizaci6n en el tiempo de los miembros de la serie de medias m6viles
no corresponde exactamente a la de los miembros de la serie original. EI primer termino es
la media de las cuatro primeras observaciones y, por 10 tanto, podrfamos considerar que
esta centrado entre la segunda observaci6n y la tercera:
,
X'"
2,5
+ X2 + X3 + X4
= Xl
--C.-_---=-_---=-_---'
4
Asimismo, el segundo termino podrfa expresarse de la forma siguiente:
X*
3.5
+ X3 + -X4 ---'+ X5
= X2
---"------'--4
Este problema puede superarse centrando nuestra serie de medias m6viles de 4 puntos,
10 cual puede hacerse caIculando las medias de pares contiguos, que en el caso del primer
valor es
xl
= X*
2,5
+ x*3,5
2
0,50375
+ 0,51125
2
= 0,5075
Este valor es la media m6vil centrad a correspondiente a la tercera observaci6n de la serie
original. EI resto de la serie de medias m6viles centrad as esta en la primera columna de la
Tabla 19.5. Observese de nuevo que con este metodo se pierden dos observaciones de cada
extremo de la serie.
La Figura 19.13 representa la serie de medias m6viles centradas, junto con laserie original. Es evidente que se ha eliminado el componente estacional. Ademas, como hemos
784
Estadfstica para administraci6n y economfa
Tabla 19.5.
Trimestre
del ano
Beneficios
1,1
1,2
1,3
1,4
2,1
2,2
2,3
2,4
3,1
3,2
3,3
3,4
4,1
4,2
4,3
4,4
5,1
5,2
5,3
5,4
6,1
6,2
6,3
6,4
7,1
7,2
7,3
7,4
8,1
8,2
8,3
8,4
0,3
0,46
0,345
0,91
0,33
0,545
0,44
1,04
0,495
0,68
0,545
1,285
0,55
0,87
0,66
1,58
0,59
0,99
0,83
1,73
0,6 1
1,05
0,92
2,04
0,7
1,23
1,06
2,32
0,82
1,41
1,25
2,73
Figura 19.13.
Media m6vil
centrada de 4
pu ntas y serie
ori ginal de los
benefi cios par
acci6n de una
empresa.
Beneficios efectivos por acci6n de una empresa y media m6vil centrada
de 4 puntos.
Medias moviles
de 4 puntos
Medias moviles
centradas de 4 puntos
*
*
*
*
0,50375
0,51125
0,53250
0,55625
0,58875
0,63000
0,66375
0,69000
0,75125
0,76500
0,81250
0,84125
0,91500
0,92500
0,95500
0,99750
1,03500
1,04000
1,05500
1,07750
1,15500
1,17750
1,22250
1,25750
1,32750
1,35750
1,40250
1,45000
1,55250
0,5075
0,5219
0,5444
0,5725
0,6094
0,6469
0,6769
0,7206
0,7581
0,7888
0,8269
0,8781
0,9200
0,9400
0,9763
1,0163
1,0375
1,0475
1,0663
1,1163
1,1663
1,2000
1,2400
1,2925
1,3425
1,3800
1,4263
1,5013
*
*
*
Moving Average
•
Actual
Smoothed
.c.
2.5
-
-
Actual
-
Smoothed
en
OJ
c
E
1.5
ell
w
rv'bving Average
Length :
MAPE :
0.5
1930
19 40
1950
Time
196 0
28.27 19
MAD:
0.3353
MSD:
0.2361
Analisis de series temporales y prediccion
Capitulo 19.
785
utilizado medias m6viles, tambien se ha suavizado el componente ilTegular. La imagen resultante nos permite, pues, juzgar las regularidades no estacionales de los datos. Vemos
que en la serie suavizada domina un a tendencia ascendente. Un examen mas detenido
muestra un crecimiento continuo de los beneficios en la primera parte de la serie, una parte
central de crecimiento bastante mas lento y una reanudaci6n en la ultima parte del periodo
de una pauta similar a la primera.
Metoda de desestacionalizacion mediante medias moviles simples
Sea X t (t = 1, 2, ..., n) una serie temporal estacional del periodo 5 (5 = 4 en el caso de los datos trimestrales y 5 = 12 meses en el caso de los datos mensuales). Se obtiene una serie de
siguiendo estos dos pasos, en los que se supone
medias m6viles centradas de 5 puntos,
que s es par:
x;,
1.
Calcular las medias m6viles de 5 puntos:
s/ 2
*
_j
I
X t +O,5 -
2.
Xt + j
= - (s/ 2) +
I
S
(t = ~, ~ +
1, ... , n -
~)
(19.4)
2, ... , n -
2
s)
(19.5)
Calcular las medias m6viles centradas de s puntos:
x* = X*
{- 0,5
1
+ x*1+ 0,5
2
( 2s+ 2s+
t=
1,
Hemos visto que la serie de medias m6viles centradas de s puntos pueden ser utiles para comprender la estructura de una serie temporal. Como esta libre en gran medida de la
estacionalidad y se ha suavizado el componente inegular, es adecuada para identificar un
componente tendencial 0 cfclico. Esta serie de medias m6viles tambien constituye la base
de muchos metodos practicos de desestacionalizaci6n. EI me to do especffico depende de
una serie de factores, entre los que se encuentran el grado de estabilidad que se supone que
tiene la pauta estacional y si la estacionalidad se considera aditiva 0 multiplicativa. En el
segundo caso, a menudo tomamos logaritmos de los datos.
A continuaci6n, analizamos un metodo de desestacionalizaci6n que se basa en el supuesto implfcito de que la pauta estacional es estable a 10 largo del tiempo. EI metoda se
conoce con el nombre de metoda del indice estacional. Suponemos que en cualquier mes 0
trimestre, en cada afio, el efecto de la estacionalidad es un aumento 0 una reducci6n de la
serie en el rnismo porcentaje.
Ilustraremos el metoda del indice estacional utilizando los datos sobre los beneficios de
la empresa. La serie desestacionalizada se calcula en la Tabla 19.6. Las dos primeras columnas contienen la serie original y la media m6vil centrada de 4 puntos. Para evaluar la
influencia de la estacionalidad, expresamos la serie original en porcentaje de la serie de
medias m6viles centradas de 4 puntos. Asi, por ejemplo, en el caso del tercer trimestre del
afio 1, tenemos que
X ) = 100
100 ( .-2
xt
(0345) =
'
0,5075
67,98
Estos porcentajes tambien se encuentran en la Tabla 19.7, en la que se muestra el caleulo
del indice estacional. Para evaluar el efecto de la estacionalidad en el primer trimestre, observamos la median a de los siete porcentajes de ese trimestre. Este es el cuarto valor cuan-
786
Estadfstica para administraci6n y economfa
Tabla 19.6.
Trimestre
del aDO
Ajuste estacional de los beneficios por acci6n de una empresa
mediante el metodo del fndice estacional.
Xt
0,300*
0,460*
0,345
0,910
0,330
0,545
0,440
1,040
0,495
0,680
0,545
1,285
0,550
0,870
0,660
1,580
0,590
0,990
0,830
1,730
0,610
1,050
0,920
2,040
0,700
1,230
1,060
2,320
0,820
1,410
1,250*
2,730*
1,1
1,2
1,3
1,4
2,1
2,2
2,3
2,4
3,1
3,2
3,3
3,4
4,1
4,2
4,3
4,4
5,1
5,2
5,3
5,4
6,1
6,2
6,3
6,4
7,1
7,2
7,3
7,4
8,1
8,2
8,3
8,4
Tabla 19.7.
x*t
100e~·)
x""
Iodice
estaciooal
Serie
ajustada
67,98
174,37
60,62
95,20
72,20
160,77
73,13
94,37
71,89
162,91
66,51
99,08
71 ,74
168,09
60,43
97,41
80,00
165,16
57,21
94,06
78,88
170,00
56,45
95,16
78,96
168,12
57,49
93,92
61,06
96,15
72,95
169,84
61,06
96,15
72,95
169,84
61,06
96,1 5
72,95
169,84
61,06
96,15
72,95
169,84
61,06
96,15
72,95
169,84
61,06
96,15
72,95
169,84
61,06
96,15
72,95
169,84
61,06
96,15
72,95
169,84
0,491.3
0,4784
0,4729
0,5358
0,5405
0,5668
0,6032
0,6123
0,8107
0,7072
0,7471
0,7566
0,9008
0,9048
0,9047
0,9303
0,9663
1,0296
1,1378
1,0186
0,9990
1,0920
1,26 11
1,20ll
1,1464
1,2793
1,4531
1,3660
1,3429
1,4665
1,7135
1,6074
t
0,5075
0,5219
0,5444
0,5725
0,6094
0,6469
0,6769
0,7206
0,7581
0,7888
0,8269
0,8781
0,9200
0,9400
0,9763
1,0163
1,0375
1,0475
1,0663
1,1163
1,1663
1,2000
1,2400
1,2925
1,3425
1,3800
1,4263
[,5013
Calculo del fndice estacional de los datos sobre los beneficios
por acci6n de la empresa.
Trimestre
ADO
1
2
1
2
3
4
5
6
7
8
Mediana
lndice estacional
60,62
73,13
66,51
60,43
57,21
56,45
57,49
60,43
61,06
95 ,20
94,37
99,08
97,41
94,06
95 , 16
93,92
95,16
96,15
3
4
67,98
72,20
71 ,89
71,74
80,00
78,88
78,96
174,36
160,77
162,91
168,09
165,16
170,00
168,12
72,20
72,95
168,09
169,84
Sumas
395,88
400
Capitulo 19.
Analisis de series temporales y prediccion
787
do se ordenan en sentido ascendente, es decir, 60,43. Tambien hallamos la mediana de XI
en porcentaje de x? para cada uno de los demas trimestres.
Para calcular los indices estacionales, tambien ajustamos los indices de manera que su
media sea 100. Vemos en la Tabla 19.7 que las cuatro medianas solo suman 395,88. Podemos calcular los indices finales --que tienen una media de 100- multiplicando cada mediana por (400/ 395,88). En el caso del primer trimestre tenemos que
,
Indice
estacional
=
400 )
60,43 ( 395,88
=
61,06
Esta cifra estima que la estacionalidad reduce los beneficios del primer trimestre a un
61,06 pOI' ciento de los que se habrian obtenido en ausencia de factores estacionales.
Los indices estacionales de la ultima fila de la Tabla 19.7 se encuentran en la quinta
columna de la 19.6. Observese que se utiliza el mismo in dice para cualquier trimestre de
cada ano. Por ultimo, obtenemos nuestro valor desestacionalizado:
Valor original )
. I
Valor ajustado = 100 ( 'd'
In Ice estaclOna
Por ejemplo, en el caso del tercer trimestre del ano 1, el valor desestacionalizado es
0345)
100 ( 7~,95 = 0,4729
La serie desestacionalizada completa que se obtiene de esta forma se muestra en la ultima columna de la Tabla 19.6 y se representa en la Figura 19.14. Observese que parece
que sigue quedando una cierta estacionalidad en la ultima parte del periodo, 10 cual induce
a pensar que podrfa ser deseable un enfoque mas elaborado, que tuviera en cuenta los cambios de las pautas estacionales.
Figura 19.14.
Beneficios
ajustados
estacionalme nte por
cada acci6n de una
empresa.
co
'0
co
N
1,5 -
co
c
0
u
co
.....
(J)
Q)
(J)
1,0 -
Q)
'0
Q)
.;::
Q)
(j)
0,5 -
•
~
,
2
~
•
•
• •
• •
•• •
•
•
•• ••
•
••
•
3
4
5
6
7
8
9
Trimestre del ario
El metodo del fndice estacional aquf presentado es una sencilla solucion al problema de
los indices. Muchas series temporales importantes -como el producto interior bruto y sus
componentes, el empleo y el desempleo, los precios y los salarios- tienen un fuerte componente estacional. Generalmente, los organismos oficiales publican datos sobre esas cantidades tanto desestacionalizados con sin desestacionalizar. Los metodos oficiales de ajuste,
aunque son mas complejos que el que hemos descrito aqui, normal mente se basan en me-
788
Estadfstica para administraci6n y economfa
dias m6viles. El metoda de desestacionalizaci6n que se utiliza mas a menu do en las publicaciones oficiales de Estados U nidos es el metodo del Censo X-II. Se diferencia del metodo del fndice estacional en que tiene en cuenta el posible cambio de la pauta estacional a
10 largo del tiempo. Puede demostrarse que en su versi6n aditiva X-ll estima de una manera bastante aproximada el componente estacional de una serie temporal mensual por medio de
donde
siendo XI el valor original de la serie en el periodo t y xt* la media m6vil centrada de 12
puntos. Naturalmente, si se utiliza ese metodo, es necesario dar un tratamiento especial a
los valores que se encuentran al final de la serie, ya que la expresi6n del factor estacional
implica valores de la serie temporal que aun no han ocurrido. Una forma posible de lograr10 es sustituir los valores futuros desconocidos de la media m6vil por predicciones basadas
en los datos de los que se dispone.
EJERCICIOS
Ejercicios aplicados
19.18. ~ ~ El fichero de datos Quarterly Earnings
19.18 muestra las ventas trimestrales realizadas
por una empresa en un periodo de 6 afios.
a) Trace un gnifico temporal de esta serie y
analice sus caracterfsticas.
b) Uti lice el metoda del fndice estacional para
desestacionalizar esta serie. Represente gnificamente la serie desestacionalizada y analice sus caracterfsticas.
19.19.
I.., El
fichero de datos Quarterly Sales muestra las ventas trimestrales realizadas por una
empresa en un periodo de 6 afios.
a) Trace un gnifico temporal de esta serie y
analice sus caracterfsticas.
b) Utilice el metoda del fndice estacional para
desestacionalizar esta serie. Represente gnlficamente la serie desestacionalizada y analice sus caracterfsticas.
19.20. ,. .. Calcule una serie de medias m6viles centradas simples de 3 puntos de los datos sobre el
precio del oro del ejercicio 19.15. Represente la
serie suavizada y analice el gnifico resultante.
19.21. ' . Calcule una serie de medias m6viles centradas simples de 5 puntos de los datos sobre la
construcci6n de viviendas del ejercicio 19.16.
Trace un gnifico temporal de la serie suavizada
y comente sus resultados .
19.22.
I. Calcule
una serie de medias m6viles centradas si mples de 7 puntos de los datos sobre los
beneficios de la empresa del ejercicio 19.17.
Basandose en un grifico temporal de la serie
suavizada, (',que puede decirse de sus componentes regulares?
19.23. Sea
xl"
1
=
111
I X+
2m + 1 j~-III
t
j
una media m6vil centrada simple de (2m
puntos. Demuestre que
x*
/+ 1
=
x*
f
x/ + I1I + I -
+
1)
X' - m
--'--'--"-'--'--'---_--'--"C.
2m
+
1
(',C6mo podrfa utilizarse este resultado en el
calculo eficiente de la serie de medias m6viles
centradas?
19.24. f ~ EI fichero de datos Quarterly Earnings
19.24 muestra los beneficios por acci6n obtenidos por una empresa en un periodo de 7 afios.
a) Trace un grafico temporal de estos datos.
(',Sugiere su grafico la presencia de un fuerte
componente estacional en esta serie de beneficios?
b) Utilizando el metodo del fndice estacional,
obtenga una serie de beneficios desestacionalizada. Represente gr:ificamente esta serie
y comente su conducta.
Capitulo 19.
19.25. a) Demuestre que la serie de medias m6viles
centradas de s puntos del apartado 19.4 puede expresarse de la forma siguiente:
X, _ (s/ 2)
+ 2(x,_ (s/ 2) + I + ... + x, + (s/2) -
x/=
I - X, + (s/2 )
2s
b) Demuestre que
.*
.\ , + I
=
."
X'"
,
+ (s/2 ) + I + X t + (s/2) - Xt + -X't --'--'--'--- - - ' - ' - ' - -25
(s/2) + I '-'--'-----
xt -
(s/2)
- - =--'
Analisis de series temporales y prediccion
789
Analice las ventajas de esta f6rmula, desde
el punto de vista del calculo, para desestacionalizar series temporales mensuales.
19.26. , ~ El fichero de datos Monthly Sales muestra
las ventas mensuales de un producto en un
periodo de 3 afios. Utilice el metodo del In dice
estacional para obtener una serie desestacionalizada .
19.5. Suavizaci6n exponencial
A continuaci6n analizamos algunos metodos para utilizar los valores actuales y pasados de
una serie temporal para predecir sus valores futuros. Este problema, facil de formular, puede ser muy diffcil de resolver satisfactoriamente. Generalmente, se utiliza una amplia variedad de metodos de predicci6n y la elecci6n final de uno de ellos depende en gran medida del problema, de los recursos y de los objetivos del analista y de la naturaleza de los
datos de los que dispone.
Nuestro objetivo es utilizar las observaciones existentes, XI ' X2' " ., Xl' sobre una serie
para predecir los valores futuros desconocidos Xt+]o X,+2, ". La predicci6n tiene una importancia fundamental en el mundo de la empresa como base racional para tomar decisiones.
Por ejemplo, la predicci6n de las ventas mensuales de un producto es la base de la politic a
de control de las existencias. Las predicciones sobre los futuros beneficios se utilizan cuando se toman decisiones de inversi6n.
En este apartado, introducimos un metoda de predicci6n que se conoce con el nombre
de suavizacion exponencial simple que da buen resultado en algunas aplicaciones. Constituye, ademas, la base de algunos metodos de predicci6n mas complejos. La suavizaci6n
exponencial es adecuada cuando la serie no es estacional y no tiene una tendencia ascendente 0 descendente sistematica.
En ausencia de tendencia y de estacionalidad, el objetivo es estimar el nivel actual de
la serie temporal y utilizar esta estimaci6n para predecir los futuros valores. Nuestra posici6n es que nos encontramos en el periodo t, estamos observando retrospectivamente la serie de observaciones XI' XI - I ' X t - 2, .'" Y queremos tener una idea del nivel actual de la serie. Para empezar, consideramos dos posibilidades extremas. En primer lugar, podrfamos
utilizar simplemente la observaci6n mas reciente para predecir todas las futuras observaciones. En algunos casos, como en el de los precios de los mercados especulativos, es posible que sea 10 mejor que podemos hacer, pero el resultado no tiene mucho exito. Sin embargo, en muchas series que tienen componentes irregulares, probablemente querrfamos
utilizar algunas observaciones anteriores de la serie. Eso identificarfa las pautas que pudieran existir en la serie temporal y evitarfa utilizar solamente una fluctuaci6n aleatoria como
base de nuestra predicci6n.
En el extremo opuesto, podrfamos utilizar la media de todos los val ores pasados como
estimaci6n del nivel actual. Basta una breve reflexi6n para pensar que a menu do eso no
sena util, ya que todos los valores pasados se tratarfan por igual. Asf, por ejemplo, si intentaramos predecir las futuras ventas mediante este procedimiento, darfamos la misma importancia a las ventas de hace muchos arros que a las ventas recientes. Parece razonable
que la experiencia mas reciente influya mas en nuestra predicci6n.
790
Estadfstica para administraci6n y economfa
La suavizaci6n exponencial simple es una soluci6n intermedia entre estos extremos;
hace una predicci6n basada en una media ponderada de los val ores actuales y de los pasados. Cuando se calcula esta media, se da mas peso a la observaci6n mas reciente, bastante
menos al valor inmediatamente anterior, menos al valor anterior, y asf sucesivamente. Estimamos el nivel del periodo actual t de la siguiente manera:
_
Xt ~
(1 -
IX)XI
+ 1X(1
-
donde rx es un numero comprendido entre
predicci6n de las futuras observaciones es
IX)Xt - 1
+ IX
2
(1 -
IX)X, - 2
+ ...
°y 1. Por ejemplo, suponiendo que
IX
=
0,5, la
por 10 que en el d.lculo de las predicciones se aplica a las observaciones actuales y pasadas una media ponderada con un os pesos cada vez menores.
En este modelo, vemos que la predicci6n de la serie en cualquier periodo t se estima de
la siguiente manera:
~
_
Xt -
(1 -
IX)XI
+ 1X(l
-
IX)XI _ I
+ IX2(1
-
IX)Xt - 2
+ ...
y, asimismo, el nivel del periodo anterior (t - 1) se estimarfa de la forma siguiente:
Multiplicando por rx, tenemos que
~
IXX, _ I
= 1X(1 -
IX)Xt - 1
+ rx 2(1
-
rx)X t - 2
+ rx 3 (1
-
IX)Xt - 3
+ ...
Por 10 tanto, restando estas dos ecuaciones, tenemos que
Y mediante una sencilla manipulaci6n, tenemos la ecuaci6n para calcular la predicci6n basada en la suavizaci6n exponencial simple:
Xc = aXt - 1 + (1 -
()()XI
para
°< ()( < 1
Esta expresi6n es un util algoritmo recursivo para calcular predicciones. EI valor predicho,
del periodo t es una media ponderada de la predicci6n del periodo anterior t - I Y la
ultima observaci6n XI' Las ponderaciones dadas a cada uno dependen de la elecci6n de ()(,
que es la constante de suavizaci6n. Observese que un elevado valor de IX da mas peso a
t - I' que se basa en la historia pas ada de la serie, y un peso menor a xI' que representa los
datos mas recientes.
Podemos ilustrar el metodo utilizando los datos sobre las ventas de Lydia Pinkham suponiendo que el valor de ()( = 0,4. El proceso comienza fijando el primer elemento de la
serie
XI = X I = 1.806
x
XI'
x
El segundo valor de la predicci6n serfa
X2
= O,4x[ + 0,6X2
= (0,4)(1.806) + (0,6)(1.644) = 1.708,8
Capitulo 19. Analisis de series temporales y predicci6n
791
Y este proceso conti nua con toda la serie de manera que
X3 = 0,4X2 + 0, 6X3
= (0,4)(1 .708,8) + (0,6)(1. 814) = 1.771,9
Predicci6n por medio de una suavizaci6n exponencial simple
Sea X j , X2 , . . . , Xn un conjunto de observaciones de una serie temporal no estacional sin ninguna tendencia ascendente 0 descendente sistematica. EI metodo de suavizaci6n exponencial
simple para hacer predicciones es el siguiente:
1.
Se obtiene la serie suavizada
xt :
(0 <
2.
IY.
< 1; t
= 2, 3, ... , n)
(19.6)
donde CI. es una con stante de suavizaci6n cuyo valor se fija entre 0 y 1.
A partir del periodo n, se obtienen predicciones de los futuros valores, xn + h ' de la serie
de la siguiente manera:
(h = 1, 2, 3, ... )
Hasta ahora apenas nos hemos referido a la elecci6n de la constante de suavizaci6n, IY.,
en las aplicaciones practicas. En las aplicaciones, esta elecci6n puede basarse en razones
subjetivas u objetivas. Una posibilidad es basarse en la experiencia 0 en el criterio personal. Por ejemplo, un analista que quiera predecir la demanda de un producto puede haber
trabajado muchas veces con datos sobre lfneas de producto similares y puede basarse en
esa experiencia para seleccionar el valor de IY.. La inspecci6n visual de un grafico de los
datos de los que se dispone tambien puede ser uti! para elegir el valor de la constante de
suavizaci6n. Si la serie parece que contiene un componente irregular considerable, no queremos dar demasiado peso unicamente a la observacion mas reciente, ya que podria no indicar que esperamos en el futuro. Eso sugiere que debemos elegir un valor relativamente
alto para la con stante de suavizacion. Pero si la serie es bastante suave, darfamos un valor
mas bajo a IY. para dar mas peso a la observacion mas reciente.
Un enfoque mas objetivo es probar con diferentes valores y ver cual ha conseguido
predecir mejor los movimientos historicos de la serie temporal. Por ejemplo, podrfamos
calcular la serie suavizada con los valores de IY. de 0,2, 0,4, 0,6 y 0,8 y elegir el valor que
predice mejor la serie historica. Calcularfamos el error de cada prediccion:
~
el=x, -x1 _ l
Una posibilidad es calcular, para cada valor de
errores:
11
sc
IY.
utilizado, la suma de los cuadrados de los
11
= "L. e12 = "
L. (X t
1= 2
-
~)2
X1
- l
1=2
El valor de IY. que minimiza la suma de los cuadrados de los errores es el que se utilizara para hacer futuras predicciones. La suavizaci6n exponencial simple puede realizarse utilizando el programa Minitab. La Figura 19.15 muestra un grafico de la serie original y de
la serie suavizada utilizando un valor de IY. = 0,1, que se ha elegido probando diferentes
valores y hallando el que producfa un ajuste satisfactorio. El indicador MSD de la Figura
19.15 es la suma de los cuadrados de los errores dividida por el numero de observaciones.
792
Estadfstica para administraci6n y economfa
Single Exponential Smoothing
Figura 19.15.
Datos sobre las
ventas de Lydia
Pinkham: valores
originales y val ores
suavizados
siguiendo el metodo
exponencial simple.
2700
•
Actual
"
Smoothed
-
2200
Actual
- Smoothed
en
OJ
ctI
(f)
1700
Smoothing Constant
Alpha:
MAPE:
1200
MAD:
0.900
9.5
164.0
MSD: 43274.2
1930
1950
1940
1960
Time
Cualquiera que sea el valor de la con stante de suavizacion que se uti lice, la ecuacion
19.6 puede considerarse un mecanismo de actualizacion. En el periodo (t - 1), el nivel de
la serie se estima por medio de x/ _I ' En el siguiente periodo, se utiliza la nueva observacion x t para actualizar esta estimacion, por 10 que la nueva estimacion del nivel es una media ponderada de la estimacion anterior y la nueva observacion.
Modelo de prediccion por medio de la suavizacion exponencial
con el metoda Holt-Winters
Muchos metodos de prediccion que se utilizan en el mundo de la empresa se basan en extensiones de la suavizacion exponencial simple. La suavizacion exponencial por medio del
metodo de Holt-Winters tiene en cuenta la tendencia y posiblemente tambien la estacionalidad de una serie temporal.
Consideremos, en primer lugar, una serie temporal no estacional. Queremos estimar no
solo el nivel actual de la serie sino tambien la tendencia, que es la diferencia entre el nivel
actual y el nivel anterior.
Representamos el valor observado por medio de X t Y la estimacion del nivel por medio
de
La estimacion de la tendencia se representa por medio de Tr El principio en el que
se basa la estimacion de estas dos cantidades es igual que el del algoritmo de la suavizacion exponencial simple. Las dos ecuaciones de estimacion son
x/.
x/ = 0:(x/ _ 1
Tt = fJTt -
I
+ Tt - I) + (l - o:)xt
+ (l - fJ)(xt - xt - I)
< 0: < 1)
(0 < fJ < 1)
(0
donde IX Y fJ son constantes de suavizacion cuyos valores se fijan entre 0 y 1.
EI metoda de Holt-Winters, comparable ala suavizacion exponencial simple, utiliza estas ecuaciones para actualizar las estimaciones anteriores utiIizando una nueva observacion. La estimacion del nivel, XI - I' realizada en el periodo (t - 1), tomada junto con la
estimacion de la tendencia, Tt - I , sugiere un nivel (X, _ I + Tt - I ) en el periodo t. Esta estimacion se modifica, a la luz de la nueva observacion, Xl' para obtener una estimacion actualizada del nivel, Xl' utilizando la ecuacion dada.
Asimismo, se estima la tendencia en el periodo (t - 1) como TI _ I' Sin embargo, una
vez que se dispone de la nueva observacion, Xl' la estimacion de la tendencia es la diferen-
Capitulo 19.
793
Analisis de series temporales y predicci6n
cia entre las dos estimaciones mas recientes del niveI. La tendencia estimada en el periodo
t es, pues, la medi a ponderada indicada.
Comenzamos los caIculos estableciendo que
A continuaci6n, aplicamos las ecuaciones anteriores, para t = 3, 4, ... , n. Mostramos estos
caIculos en el ejemplo 19.2. A continuaci6n, resumimos todo el procedimiento.
Predicci6n con el metodo de Holt-Winters: series no estacionales
Sea X1 , X2 , ... , Xn un conjunto de observaciones sobre una serie temporal no estacional. EI
todo de Holt-Winters para realizar predicciones consiste en 10 siguiente.
1.
Se obtienen estimaciones del nivel
Xt
= X2
T2
x y de la tendencia T de la forma siguiente:
t
t
= X2 - Xl
1 + Tt - I ) + (1 - a)xt
Tt = PTt - 1 + (1 - P)(Xt - Xt - 1)
Xt =
2.
me-
a(xt -
(0 < a < 1; t = 3, 4, ... , n)
(0 <
P<
1; t = 3, 4, ... , n)
(19.7)
donde IX Y (J son constantes de suavizaci6n cuyos valores se fijan entre 0 y 1.
A partir del periodo n, se obtienen predicciones de los futures valores, xn + h' de la serie
p~r medio de
(19.8)
donde h es el numero de periodos futuros.
EJEMPLO 19.2. Predicci6n del credito al consumo (suavizaci6n
exponencial con el metodo Holt-Winters)
Se Ie ha pedido que haga una predicci6n del credito al consumo pendiente utilizando el
metodo de suavizaci6n exponencial de Holt-Winters.
Solucion
Los calculos siguientes se bas an en los datos sobre el credito al con sumo de la Tabla 19.8, que tam bien contiene los caIculos del metodo de Holt-Winters.
Las estimaciones iniciales del nivel y de la tendencia del ano 2 son
y
T2
= X2 - Xl = 155 - 133 = 22
Esta aplicaci6n de la suavizaci6n utiliza los valores de a
Xt = 0,3(xt - 1 + T, Tt
=
O,4Tt -
1
I)
+ 0,6(xt
= 0,3 y P = 0,4 y las ecuaciones
+ 0,7x,
-
Xt-I)
794
Estadfstica para administracion y economfa
Tabla 19.8. Calculos del cn3dito al consumo pendiente basad os en el metodo
de Holt-Winters (IX = 0,3, fJ = 0,4) y realizados a partir de la salida Minitab.
~
t
1
2
3
4
5
6
7
8
9
10
11
Xt
xt
Tt
133
155
165
171
194
231
274
312
313
333
343
155
169
175
192
223
266
309
324
338
347
22
17
11
14
25
36
40
25
18
13
Para t = 3,
X3
= 0,3(X2 + T2) + 0,7X3
= (0,3)(155 + 22) + (0,7)(165)
= 168,6
y, ademas,
T3 = 0,4T2 + 0,6(X3 - X2)
= (0,4)(22) + (0,6)(168,6 - 155)
= 16,96
Para t = 4,
X4 = 0,3(X3 + T3)
=
+ 0,7X4
(0,3)(168,6 + 16,96) + (0,7)(171)
=
175,4
y, ademas,
T4 = 0,4T3 + 0,6(X4 - X3)
= (0,4)(16,96) + (0,6)(175,4 - 168,6)
=
10,86
Los calculos restantes se hacen de la misma forma, fijando t = 5, 6, ... , 11 . La Tabla 19.8 muestra los resultados de estos calculos.
Utilicemos ahora estas estimaciones del nivel y de la tendencia para predecir las futuras observaciones. Dada una serie XI' Xz, ... , XIl' las estimaciones mas recientes del nivel y de la tendencia son t y T", respectivamente. En la realizaci6n de predicciones se
supone que esta tendencia mas reciente se prolongara a partir del nivel mas reciente.
Por 10 tanto, hacemos una predicci6n utilizando la relaci6n
x
XII + I
=
xn + TI1
Capitulo 19.
Analisis de series temporales y predicci6n
795
y para el periodo siguiente
=
xn + 2T"
Xn + h =
xn + hTn
X,,+2
y, en general, para h periodos venideros
En la Tabla 19.8 vemos que las estimaciones mas recientes del nivel y de la tendencia son
XII = 347
Las predicciones para los tres periodos siguientes son
X/2
347
X13 = 347
XI4 = 347
=
+ 13 = 360
+ (2)(13) =
+ (3)(13) =
373
386
EI metoda de Holt-Winters puede calcularse utilizando el programa Minitab y la Figura 19.16 muestra el grafico de series temporales y las predicciones. EI metoda del
Minitab es algo distinto del que acabamos de describir. En primer lugar, las entradas del
nivel y de la tendencia son
NiveJ = 1 - IX
Tendencia = 1 - f3
Double Exponential Smoothing for Credit
450 -
."
350 -
/~.
.-t=
"CI
Q)
....
U
250 -
150 -
/
Actual
"
Predicted
•
Forecast
-
Actual
-
- Predicted
- - - Forecast
Smoothing Constants
Alpha (leve l): 0.700
Gamma (trend): 0.600
-/1
",,-"
/'
•
MAPE:
MAD:
~
'T-----"-----,-----r
o
5
10
15
MSD:
7.108
16.487
354.837
Time
Figura 19.16.
Credito al consumo pendiente observado y predicho.
Ademas, el Minitab calcula una estimacion para el primer periodo utilizando el siguiente metodo:
1.
2.
EI Minitab ajusta un modelo de regresion lineal a datos de series temporales
(variable y) en relacion con el tiempo (variable x).
La constante de esta regresion es la estimacion inicial del componente del niveJ;
el coeficiente de la pendiente es la estimacion inicial del componente tendencial.
796
Estadfstica para administracion yeconomfa
Como consecuencia, los val ores ca1culados con el programa Minitab, que se muestran
en la Tabla 19.9, son algo distintos de los que figuran en la 19.8. EI me to do del Minitab
generalmente hace predicciones algo mejores que el metodo mas simplificado que hemos mostrado. Si el \ector utiliza otros paquetes estadfsticos, compruebe los algoritmos
especfficos utilizados para asegurarse de que comprende 10 que ca1cula. Normalmente,
puede hacerse pulsando la opcion Ayuda.
Tabla 19.9.
Periodo
2
3
4
5
6
7
8
9
10
11
Caleulos del eredito al eonsumo pendiente (a = 0,3, f3 = 0,4)
y realizados eon el programa Minitab.
Credito al consumo
observado
Valor esperado
del nivel
Tendencia
133
155
165
171
194
231
274
312
313
333
343
l30
156
170
177
192
224
266
309
324
338
347
28
27
19
12
14
24
35
40
25
18
13
Predicciones
360
373
385
12
13
14
Predicci6n de series temporales estacionales
A continuacion, examinamos una extension del metoda de Holt-Winters que tiene en cuenta la estacionalidad. En la mayorfa de los problemas practicos, el factor estacional se considera multiplicativo, por 10 que, por ejemplo, cuando se analizan cifras de ventas mensuales, se puede considerar que las ventas de enero son una proporcion de las ventas
mensuales medias. Se supone, al igual que antes, que el componente tendencial es aditivo.
Al igual que en el caso no estacional, utilizamos los sfmbolos X t , t y Tt para representar el valor observado y las estimaciones del nivel y de la tendencia, respectivamente, del
periodo t. El factor estacional es F" por 10 que si la serie temporal contiene s periodos al
ano, el factor estacional del periodo correspondiente del ano anterior es F t - s .
En el modelo de Holt-Winters, las estimaciones del nivel, de la tendencia y del factor
estacional se actualizan por medio de las tres ecuaciones siguientes:
x
donde
lI.,
f3 y 'Y
son constantes de suavizacion cuyos valores estan comprendidos entre 0 y 1.
Capftulo 19.
Analisis de series temporales y predicci6n
797
El termino (X' _I + T, _ I) es una estimaci6n del nivel del periodo t calculada en el
periodo anterior t - 1. Esta estimaci6n se actualiza cuando se dispone de x,. Pero tambien
eliminamos la influencia de la estacionalidad deflactandola por la estimaci6n mas reciente,
Ft - s , del factor estacional de ese periodo. La ecuaci6n de actualizaci6n de la tendencia, T"
es la misma que antes.
Por ultimo, el factor estacional, F" se estima utilizando la tercera ecuaci6n. La estimacion mas reciente del factor, que es la del ano anterior, es F t - s . Sin embargo, dividiendo la
nueva observaci6n, XI' por la estimacion del nivel, X,, se obtiene un factor estacional x/x,.
La nueva estimacion del factor estacional es una media ponderada de estas dos cantidades.
Predicci6n con el metodo de Holt-Winters: series estacionales
Sean X1 , X2 , •.. , Xn un conjunto de observaciones sobre una serie temporal estacional del periodo s (siendo s = 4 en el caso de los datos trimestrales y s = 12 en el de los datos mensuales).
EI metodo de Holt-Winters para realizar predicciones utiliza un conjunto de estimaciones recursivas a partir de la serie historica. Estas estimaciones utilizan una con stante del nivel, IX; una
constante de la tendencia, fJ, y una con stante estacional multiplicativa, y. Las estimaciones recursivas se basan en las siguientes ecuaciones:
(0 < ex < 1)
(0
Ft = yFI -
s
+ (1
Xl
- y) :::-
x,
(0
< fJ < 1)
(19.9)
< y < 1)
donde Xl es el nivel suavizado de la serie, Tt es la tendencia suavizada de la serie y Ft es el
ajuste estacional suavizado de la serie. Los detalles del calculo son tediosos y 10 mejor es hacerlo por computador. Hemos mostrado el algoritmo que utiliza el programa Minitab, pero numerosos paquetes estadfsticos de cali dad emplean metodos parecidos. Estos metodos pueden
diferir en la forma en que abordan la generacion de constantes para los periodos iniciales de
una serie temporal observada y, por 10 tanto, debe consultarse la documentaci6n del programa
para averiguar cual es exactamente el programa utilizado. Minitab utiliza un metodo de regresion mediante variables ficticias para obtener estimaciones de los periodos iniciales.
Una vez que el metodo inicial genera las constantes del nivel, la tendencia y la estacionalidad a partir de una serie historica, podemos utilizar los resultados para predecir los futuros valores de h periodos futuros a partir de la ultima observacion, xn ' de la serie historica. La ecuacion de prediccion es
(19.10)
Observamos que el factor estacional, F, es el generado para el periodo de tiempo estacional
mas reciente.
El metoda que hemos desarrollado aqul puede aplicarse utilizando el procedimiento del
Minitab Hamado «Winters method». Concretamente, eI metoda aqui descrito utiliza Ia opci6n «multiplicative». El me to do Winters empJea un componente del nivel , un componente
tendencial y un componente estacional de cada periodo. Utiliza tres ponderaciones 0 parametros de suavizaci6n para actualizar los componentes de cada periodo. Los valores iniciales del componente del nivel y del componente tendencial se obtienen a partir de una regresion lineal con respecto al tiempo. Los val ores iniciales del componente estacional se
obtienen a partir de una regresi6n mediante variables ficticias utilizando datos desestacio-
798
Estadfstica para administraci6n y econom fa
nalizados. Las ecuaciones de suavizaci6n del metoda de Winters para el modelo multiplicativo son las antes utilizadas.
Este me to do se mostrara utilizando los beneficios por acci6n de una empresa en el programa Minitab. En la Figura 19.17 se muestra un gnifico de los valores observados y ajustados, junto con predicciones para los cuatro periodos siguientes. Se realizan predicciones
utilizando las estimaciones mas recientes de la tendencia y del nivel y se ajustan para tener
en cuenta el factor estacional. Dada una estaci6n que contiene s periodos de ti empo, la predicci6n para un periodo en el futuro serfa
Figura 19.17.
Historia y
Winter's Multiplicative Model for Earnings
predicci6n de los
beneficios de una
empresa utilizando
el metoda de
Holt-Winters.
:~
3
.'
.'
\'
(J)
en
c 2
c
....
.'",
..." L\~":':.
~,
ctl
.",....
UJ
",
.,'
o
I
•
Actual
o
Pred icted
•
-
Forecast
Actual
- - Pred icted
- - .. Fo recast
Smoothing Constants
A lpha (level): 0,500
Gamma (trend): 0.500
Delta (season): 0.700
MAPE: 13.539 1
MAD:
0.0902
'-r----~----,__------,------' MSD:
o
10
20
0.0141
30
Time
Los datos de nuestro ejemplo contienen 32 periodos de tiempo y un factor estacional
s = 4, 10 que indica que son datos trimestrales. Por 10 tanto, para predecir la siguiente observaci6n despues del final de la serie, utilizamos la expresi6n
Esta predicci6n es para el primer trimestre; por 10 tanto, utilizamos el factor estacional del
primer trimestre mas reciente y es F 29 . En general, si estamos prediciendo h periodos en el
futuro, realizamos la predicci6n de la siguiente manera:
La predicci6n utiliza una constante del nivel, ex = 0,5, una constante de la tendencia,
f3 = 0,5 y una constante estacional, y = 0,3.
Por ultimo, en la Tabla 19.10 mostramos los resultados detail ados del calculo de los
factores de la tendencia, del nivel y el factor estacional de cada periodo.
Las predicciones efecti vas realizadas por medio del metodo de Holt-Winters dependen
de los valores especfficos elegidos para las constantes de suavizaci6n. Al igual que en
nuestro analisis anterior de la suavizaci6n exponencial, esta elecci6n podrfa basarse en cri-
Capitulo 19.
Tabla 19.10.
Analisis de series temporales y prediccion
Resultados de la aplicaci6n del metodo de suavizaci6n de Holt-Winters
en Minitab.
Valor
Estimaci6n Estimaci6n
Trimestre
Beneficios
del aDO de la empresa suavizado del nivel de la tendencia
1,1
1,2
1,3
1,4
2,1
2,2
2,3
2,4
3,1
3,2
3,3
3,4
4,1
4,2
4,3
4,4
5,1
5,2
5,3
5,4
6,1
6,2
6,3
6,4
7,1
7,2
7,3
7,4
8,1
8,2
8,3
8,4
9,1
9,2
9,3
9,4
799
0,300
0,460
0,345
0,9 10
0,330
0,545
0,440
1,040
0,495
0,680
0,545
1,285
0,550
0,870
0,660
1,580
0,590
0,990
0,830
1,730
0,610
1,050
0,920
2,040
0,700
1,230
1,060
2,320
0,820
1,410
1,250
2,730
0,043
0,360
0,433
1,055
0,450
0,498
0,389
1,028
0,424
0,671
0,518
1,269
0,550
0,758
0,623
1,514
0,666
0,916
0,697
1,767
0,714
1,047
0,782
1,795
0,741
1,238
0,988
2,131
0,799
1,419
1,172
2,531
0,387
0,562
0,609
0,631
0,584
0,619
0,672
0,696
0,770
0,801
0,843
0,869
0,886
0,964
1,019
1,067
1,032
1,077
1,193
1,215
1,150
1,1 47
1,246
1,354
1,355
1,370
1,433
1,519
1,572
1,597
1,671
1,765
0,242
0,208
0,128
0,075
0,014
0,024
0,039
0,031
0,053
0,042
0,042
0,034
0,025
0,052
0,053
0,051
0,008
0,026
0,071
0,047
-0,009
- 0,006
0,046
0,077
0,039
0,027
0,045
0,066
0,059
0,042
0,058
0,076
Estimaci6n
estacional
Predicci6n
0,713
0,851
0,628
1,529
0,609
0,872
0,646
1,505
0,633
0,856
0,646
1,486
0,624
0,888
0,648
1,482
0,588
0,910
0,681
1,441
0,548
0,914
0,721
1,487
0,526
0,902
0,734
1,515
0,523
0,889
0,744
1,537
0,963
1,705
1,48
3,18
terios subjetivos u objetivos. La experiencia del analista en el analisis de conjuntos de datos similares podrfa ayudarlo a dar valores adecuados a las constantes de suavizaci6n.
Tambien podrfa probar diferentes conjuntos de valores posibles con los datos hist6ricos de
que dispone y hacer las predicciones utilizando el conjunto de valores que dieran las mejores predicciones de esos datos. Esta estrategia es facil de poner en practica utilizando un
paquete estadfstico, como muestra el ejemplo que hemos presentado con el programa Minitab.
800
Estadfstica para administracion y economfa
EJERCICIOS
Ejercicios aplicados
19.27. I~ Basandose en los datos del ejercicio 19.13,
utilice el me to do de la suavizaci6n exponencial
simple para hacer predicciones del cociente entre las existencias y las ventas de los 4 pr6ximos afios. Utilice una constante de suavizaci6n
de a = 0,4. Represente graficamente la serie
temporal y las predicciones.
19.28. , f Utilice el metoda de la suavizaci6n exponencial simple con una constante de suavizaci6n de a = 0,3 para predecir el precio que tendra el oro en los 5 pr6ximos afios, basandose en
los datos del ejercicio 19.15.
19.29.
ff
19.30.
t Ii EI
las mismas predicciones de todos los futuros
valores de las series temporales. Dado que sabemos que todos los futuros valores no seran
iguales, eso es absurdo».
19.34. " EI fichero de datos Industrial Production
Canada muestra un fndice de producci6n industrial de Canada correspondiente a un periodo de
15 afios. Uti lice el metodo de Holt-Winters con
las constantes de suavizaci6n a = 0,3 Y f3 = 0,5
para hacer predicciones para los 5 pr6ximos
afios.
19.35.
Utilizando los datos del ejercicio 19.16, utilice el metodo de la suavizaci6n exponencial
simple con una con stante de suavizaci6n
a = 0,5 para predecir la construcci6n de viviendas de los 3 pr6ximos afios.
fichero de datos Earnings per Share
19.30 muestra los beneficios por acci6n que obtendra una empresa en un periodo de 18 afios .
a) Utilizando las constantes de suavizaci6n
a = 0,2, 0,4, 0,6 y 0,8, realice predicciones
basandose en la suavizaci6n exponencial
simple.
b) l.Cual de las predicciones elegirfa?
I,
El fichero de datos Hourly Earnings muestra los ingresos por hora de la industria manufacturera de Estados Unidos correspondientes a
un periodo de 24 meses. Uti lice el metodo de
Holt-Winters con las constantes de suavizaci6n
a = 0,3 Y f3 = 0,4 para hacer predicciones para
los 3 pr6ximos meses.
19.36. tt~ El fichero de datos Food Prices muestra un
fndice de los precios de los alimentos desestacionalizado de Estados Unidos correspondiente
a un periodo de 14 meses. Uti lice el metodo de
Holt-Winters, con las constantes de suavizaci6n
a = 0,5 Y f3 = 0,5, para hacer predicciones para
los 3 pr6ximos meses.
19.31. a) Si las predicciones se basan en una suavizaci6n exponencial simple y t representa el
valor suavizado de la serie en el periodo t,
demuestre que el error cometido en la predicci6n de x t ' realizada en el periodo (t - 1),
puede expresarse de la forma siguiente:
19.37.
'Ii
b) Por 10 tanto, demuestre que podemos escribir t = X t - ae t , donde vemos que se utiliza
la observaci6n mas reciente y el enor de
predicci6n mas reciente para calcular la predicci6n siguiente.
19.38.
f J Uti lice el metodo estacional de Holt-Win-
x
x
19.32. Suponga que en el metodo de la suavizaci6n exponencial simple la constante de suavizaci6n a
se fija en un valor igual a l. l.Que predicciones
se obtendran?
19.33. Comente la siguiente afirmaci6n: «Sabemos que
todas las series temporales empresariales y econ6micas muestran variabilidad a 10 largo del
tiempo. Sin embargo, si se utiliza el metoda de
la suavizaci6n exponencial simple, se obtienen
El fichero de datos Profit Margins muestra
los margenes porcentuales de beneficios de una
empresa conespondientes a un periodo de 11
afios. Realice predicciones para los 2 pr6ximos
afios utilizando el metoda de Holt-Winters con
las constantes de suavizaci6n a = 0,6 y
f3 = 0,6.
ters para realizar predicciones de las ventas para
dentro de ocho trimestres, basandose en los datos del ejercicio 19.18. Emplee las constantes
de suavizaci6n a = 0,6, f3 = 0,5 y y = 0,4.
Represente graficamente los datos y las predicciones.
19.39.
If Utilice
el metodo estacional de Holt-Winters para hacer predicciones de las ventas para
dentro de ocho trimestres, basandose en los datos del ejercicio 19.19. Emplee las constantes
de suavizaci6n a = 0,5, f3 = 0,4 y y = 0,3.
Represente graficamente los datos y las predicciones.
Capitulo 19.
Analisis de series temporales y prediccion
801
19.6. Modelos autorre resivos
En este apartado presentamos otro enfoque para hacer predicciones de series temporales.
Este enfoque implica la utilizaci6n de los datos de los que se dispone para estimar panimetros de un modelo del proceso que podrfa haber generado la serie temporal. En este apartado examinamos un metoda muy utilizado, los modelos autorregresivos, que se basa en el
enfoque de la construcci6n de modelos.
En el apartado 14.3 introdujimos el uso de variables dependientes retardadas en los
modelos de regresi6n multiple y ese enfoque es la base de los modelos que analizamos
aqu1. La idea es esencialmente considerar las series temporales como series de variables
aleatorias. A efectos pnicticos, a menudo podrfamos estar dispuestos a suponer que estas
variables aleatorias tienen todas ell as las rnismas medias y las rnismas varianzas. Sin embargo, no podemos suponer que son independientes entre S1. Ciertamente, si consideramos
una serie de ventas de un producto, es muy probable que las ventas de periodos contiguos
esten relacionadas entre S1. Las pautas de correlaci6n como las que hay entre periodos contiguos a veces se conocen con el nombre de autocorrelaci6n.
En principio, es po sible cualquier numero de pautas de autocorrelaci6n. Sin embargo,
unas son considerablemente mas probables que otras. Se plantea una posibilidad especialmente atractiva cuando se exarnina una correlaci6n bastante estrecha entre observaciones
contiguas en el tiempo, una correlaci6n menos estrecha entre observaciones separadas por
dos periodos, una correlaci6n mas debil aun entre los valores separados por tres periodos,
etc. Surge una sencilla pauta de autocorrelaci6n de este tipo cuando la correlaci6n entre
valores contiguos es algun numero -por ejemplo, 4>,- que entre valores separados por
dos periodos es 4>T, que entre valores separados por tres periodos es 4>f, y asf sucesivamente. Por 10 tanto, si XI representa el valor de la serie en el periodo t, tenemos en este
modelo de autocorrelaci6n que
(j = 1, 2, 3, ... )
Esta estructura de autocorrelaci6n da lugar a un modelo de series temporales de la forma
donde y y 4>1 son parametros fijos y las variables aleatorias "'t tienen una media de 0 y una
varianza fija para todo t y no estan correlacionadas entre S1. EI fin del parametro y es tener
en cuenta la posibilidad de que la serie x t tenga alguna media distinta de O. Por 10 demas,
este es el modelo que utilizamos en el apartado 14.7 para representar la autocorrelaci6n de
los terminos de error de una ecuaci6n de regresi6n. Se llama modelo autorregresivo de primer orden.
El modelo autorregresivo de primer orden expresa el valor actual, XI' de una serie en el
valor anterior, xt _ " y una variable aleatoria no autocorrelacionada, "'t. Dado que la variable
aleatoria "'t no esta autocorrelacionada, es impredecible. En el caso de las series generadas
por el modelo autorregresivo de primer orden, las predicciones de los futuros valores s610
dependen del valor mas reciente de la serie. Sin embargo, en much as aplicaciones querrfamos utilizar mas de una observaci6n como base para hacer predicciones. Una extensi6n
obvia del modelo serfa hacer depender el valor actual de la serie de las dos observaciones
mas recientes. Por 10 tanto, podrfamos utilizar un modelo
802
Estadfstica para administraci6n y economfa
donde Y, ¢l Y ¢2 son panimetros fijo s. Este modelo se llama modelo autorregresivo de segundo orden.
En terminos mas generales, dado un entero positivo cualquiera p, el valor actual de la
serie puede hacerse dependiente (Ii nealmente) de los p valores anteriores por medio del
modelo autorregresivo de orden p:
donde Y, ¢l Y ¢2> ... , ¢p son panimetros fij os. Esta ecuaci6n describe el modelo autorregresivo general. En el resto de este apartado, consideramos el ajuste de esos modelos Y su uso
para predecir los val ores futuros.
Supongamos que tenemos una serie de observaciones X l ' X2, . . . , XII" Queremos utilizarlas
para esti mar los parametros desconocidos Y, ¢l ' ¢2' ... , ¢p para los que la suma de los cuadrados de las diferencias son
II
sc = I
(X t -
Y-
¢ IX t - 1 -
¢2Xt - 2 -
. .. -
¢~t_ p)2
t=p+ l
sea la menor posible. Por 10 tanto, la estimaci6n puede realizarse utilizando un program a
de regresi6n multiple. Mostramos este metodo en el ejemplo 19.3 utilizando los datos sobre las ventas de Lydia Pinkham.
Modelos autorregresivos y su estimacion
Sea XI (t = 1, 2, ..., n) una serie temporal. Un modelo que puede utilizarse a menudo eficazmente para representar esa serie es el modele autorregresivo de orden p:
(1 9.11)
donde y, ¢1' ¢2' ... , ¢ son parametros fijos y las cf son variables aleatorias que tienen una media de 0 y una varian~a constante y que no estan correlacionadas entre sf.
Los parametros del modele autorregresivo se estiman por medio de un algoritmo de minimos cuadrados, tal que los valores de y, ¢1' ¢2' ..., ¢p minimizan la suma de los cuadrados
siguiente:
n
SC =
I
(X t -
Y - ¢lXt - l -
¢ 2Xt - 2 -
... -
¢~t _ p)2
(19.12)
t= p + 1
EJEMPLO
19.3. Predicci6n de los datos sobre las ventas
(modelo autorregresivo)
Pinkham
Sales Data
Se Ie ha pedido que desarrolle un modelo autonegresivo para predecir los datos sobre
las vent as de Lydia Pinkham (vease el fichero de datos Pinkham Sales Data).
Soluci6n
Para utilizar un modelo autonegresivo que permita hacer predicciones de los futuros valores, es necesario fijar un valor para p, el orden de la autonegresi6n. Debemos elegir
un valor de p 10 suficientemente alto para tener en cuenta toda la conducta importante
de autoconelaci6n de la serie. Pero tampoco queremos que p sea tan grande que inc1uyamos parametros irrelevantes y que la estimaci6n de los parametros importantes sea
Capitulo 19. Analisis de series temporales y prediccion
803
ineficiente como consecuencia. En general, se prefieren los model os «parsimomcos»
-sencillos, pero suficientes para lograr el objetivo- para hacer buenas predicciones de
datos de series temporales.
Una posibilidad es fijar el valor de p arbitrariamente, quiza basandose en la experiencia anterior con conjuntos de datos similares. Otro enfoque es fijar un orden maximo, K, de la autolTegresion y estimar, a su vez, modelos de orden p = K, K - 1, K - 2, ...
Se contrasta para cada valor de p la hipotesis nula de que el ultimo para metro de la
autorregresion, ¢>p, del modelo es 0 frente a la altemativa bilateral. EI procedimiento
concluye cuando hallamos un valor de p para el que esta hipotesis nula no se rechaza.
Nuestro objetivo es, pues, contrastar la hipotesis nul a
frente a la alternativa
En el Capitulo 12 presentamos metodos para contrastar la hipotesis nula, Ho. Sabemos
basicamente que el cociente entre la estimacion del coeficiente y la desviacion tfpica
del coeficiente sigue una distribucion t de Student. La salida Minitab del analisis de regresion -y la salida del analisis de regresion de cualquier paquete estadfstico- incluye
ese calculo de la t de Student y, ademas, la probabilidad de que la hipotesis nula sea
verdadera -el p-valor de la hipotesis nula- dada la t de Student calculada.
Predicci6n a partir de model os autorregresivos estimados
Supongamos que tenemos las observaciones X1 , X2 , ... , xt de una serie temporal y que se ha
ajustado un modele autorregresivo de orden p a estos datos. Expresamos el modelo estimado
de la siguiente manera:
(19.13)
Partiendo del periodo
guiente manera:
n, hacemos predicciones de los futuros valores de la serie de la si(19.14)
xn+
donde para j > 0,
j es la prediccion de x
t
plemente el valor observado de xt + r
+ partiendo del periodo n, y para j ~ 0, xt +
j
j
es sim-
La Figura 19.18 muestra copias abreviadas de la salida Minitab del analisis de regresion para modelos autorregresivos utilizando los datos sobre las ventas de Lydia Pinkham
y suponiendo que p = 1, 2, 3,4.
Aplicaremos este metodo a los datos sobre las ventas de Pinkham utilizando un nivel
de significacion del 10 por ciento para nuestros contrastes. Basandonos en los resultados
de Ia Figura 19.18, comenzamos con la regresion suponiendo que p = 4. Observamos que
el coeficiente de X t - 4 tiene un estadistico t de Student de - 1,39 y un p-valor de 0,180. Por
10 tanto, no podemos rechazar Ia hipotesis nula de que el coeficiente es 0 y pasamos a la
regresion suponiendo que p = 3. En este caso, vemos que el coeficiente de Xt - 3 tiene un
804
Estadfstica para administraci6n y economfa
Figura 19.18.
Modelos
autorregresivos
para los datos
sobre las ventas de
Lydia Pinkham
(salida Minitab).
Regression with p = 1
Sales = 193 + 0.883 Salelag1
29 cases used 1 cases contain missing values
Predictor
Constant
Salelag1
S = 207.0
Coef
193 . 3
0.8831
R-Sq = 73.4%
StDev
189.0
0.1024
T
P
1. 02
0.316
0.000
8.62
R-Sq(adj) = 72.4%
Regression with p = 2
Sales = 314 + 1.18 Salelag1 - 0.358 Salelag2
28 cases used 2 cases contain missing values
Predictor
Constant
Sale1ag1
Salelag2
S = 199.6
Coef
313.7
1.1801
-0 .3578
R-Sq = 76.9%
StDev
192.5
0.1870
0.1914
T
P
1. 63
0.116
0.000
0 . 073
6.31
-1 .87
R-Sq(adj) = 75.1 %
Regression with p =3
Sales = 322 + 1.19 Sa1e1ag1 - 0.317 Salelag2 - 0.057 Salslag3
27 cases used 3 cases contain missing values
Predictor
Constant
Salelag1
Sale1ag2
Salslag3
S =203.0
Coef
322.3
1.1881
-0.3168
-0.0574
R-Sq = 78 .1%
StDev
215.7
0.2065
0.3081
0.2098
T
1. 49
5.75
-1.03
-0.27
P
0.149
0.000
0.315
0.787
R-Sq(adj) = 75.2%
Regression with p = 4
Sales = 446 + 1.19 Salelag1 - 0.439 Sa1elag2 + 0.286 Salslag3 - 0.291
Salelag4
26 cases used 4 cases contain missing values
Predictor
Coef
StDev
T
P
Constant
446.2
232.8
1.92
0.069
Sale1ag1
1.1937
0.2108
5.66
0.000
Salelag2
-0.4391
0.3238
-1.36
0.190
Salslag3
0.2859
0.3174
0.90
0.378
Salelag4
-0.2914
0.2101
-1.39
0.180
S = 202.6
R-Sq = 80.1%
R-Sq(adj) = 76.3%
estadfstico t de Student igual a - 0,27 y un p-valor de 0,787. Una vez mas, no podemm
rechazar la hip6tesis nul a de que este coeficiente es 0. En el caso del modelo de regresi6n
en el que se supone que p = 2, vemos que el coeficiente de X t - 2 tiene un estadfstico t dE
Student de - 1,87 Y un p-valor de 0,073. Por 10 tanto, podemos rechazar la hip6tesis nu12
de que el coeficiente de X t - 2 es 0. El modelo elegido es el modelo con dos valores retardados, p = 2. La ecuaci6n final es
Xt = 313,7 + 1,1801xt _
1 -
0,3578xt _ 2
Ahora que tenemos el modelo, queremos aplicarlo para hacer predicciones con los datm
sobre las ventas de Lydia Pinkham. Comenzamos sefialando que los dos ultimos valores dE
la serie de datos son
y
X29 = 1.387
X30 = 1.289
Analisis de series temporales y predicci6n
Capitulo 19.
805
Ahora podemos predecir el siguiente valor X31:
X31 = 313,68 + 1,l80X30 - 0,358x29
= 313,68 + (1,180)(1.289) - (0,358)(1.387) = 1.338,2
Reconocemos que el valor predicho del termino de error, 81' es O. Ahora podemos predecir
el siguiente valor de la serie siguiendo el mismo procedimiento, con la salvedad de que
ahora debemos utilizar el valor predicho de X31, es decir, Xt:
X32
+ 1,180X31 - 0,358x30
= 313,68 + (1,180)(1.338,2) - (0,358)(1.289) = 1.431,29
=
313,68
Estos calculos pueden realizarse directamente mediante el programa Minitab - 0 mediante
cualquier otro buen paquete estadfstico- y los resultados se muestran en la Figura 19.19.
Podemos continuar con este proceso y hacer predicciones para tantos periodos futuros
como queramos. La serie temporal de ventas y las predicciones para seis periodos se muestran en la Figura 19.20.
Figura 19.19.
Valores predichos a
partir de un modelo
autorregresivo para
los datos sobre las
ventas de Pinkham
(salida Minitab).
Sales
=
314 + 1.18 Salelag1
-
0.358 Salelag2
28 cases used 2 cases contain missing values
Predictor
Constant
Salelag1
Salelag2
S
=
Coef
313.7
1.1801
-0.3578
199 .6
R-Sq
StDev
192.5
0.1870
0.1914
=
76 . 9%
T
1. 63
6 . 31
-1.87
R-Sq(adj)
=
P
0.116
0.000
0.073
75.1%
Predicted Values
Fit
1338.6
Figura 19.20.
Ventas de Lydia
Pinkham y
predicciones
basad as en el ajuste
de un modelo
autorregresivo de
segundo orden.
StDev Fit
63.5
95.0% CI
1207.7,
1469.4)
95.0% PI
907.1,
1770 . 1)
Time Series Plot for Sales
(with forecasts and their 95% confidence limits)
2500
2000
rJ)
(])
co
(/)
1500
1000
2
4
6
8
10 12 14 16 18 20 22 24 26 28 30
Time
806
Estadfstica para administraci6n y economfa
EJERCICIOS
Ejercicios aplicados
19.40. Basandose en los datos de la Tabla 19.10, estime un modelo autorregresivo de primer orden
para calcular el fndice del volumen de acciones
negociadas. Utilice el modelo ajustado para hacer predicciones para los 4 pr6ximos dfas.
19.41. (0 It) EI fichero de datos Trading Volume muestra el volumen de transacciones (en cientos de
miles) de acciones de una empresa realizadas en
un periodo de 12 meses. Estime con estos datos
un modelo autorregresivo de primer orden y utilice el modelo ajustado para hacer predicciones
del volumen para las 3 pr6ximas semanas.
19.42.
19.43.
f,
Basandose en el fichero de datos Housing
Starts del ejercicio 19.16, estime modelos autorregresivos de 6rdenes 1 a 4. Utilice el metoda
de este apartado para contrastar la hip6tesis de
que el orden de la autorregresi6n es (p - 1)
frente a la alternativa de que es p, con un nivel
de significaci6n del 10 por ciento. Seleccione
uno de estos model os y haga predicciones de 1a
construcci6n de viviendas para los 5 pr6ximos
afios. Trace un griifico temporal que muestre las
observaciones originales junto con las predicciones. i,Serfan diferentes las predicciones si se
utilizara un nivel de significaci6n del 5 por
ciento para los contrastes del orden autorregresivo?
t.9
Basandose en el fichero de datos Earnings
per Share del ejercicio 19.17 sobre los beneficios por acci6n de una empresa, ajuste modelos
autorregresivos de 6rdenes 1 a 4. Utilice el metodo de este apartado para contrastar la hip6tesis de que el orden de la autorregresi6n es
(p - 1) frente a la alternativa de que el verdadero orden es p , con un nivel de significaci6n
del 10 por ciento. Seleccione uno de estos modelos y haga predicciones de los beneficios por
acci6n para los 5 pr6ximos afios. Trace un grafico que muestre las observaciones originales
junto con las predicciones. i,Serfan diferentes
los resultados si se utilizara un ni vel de significaci6n del 5 por ciento para los contrastes?
19.44. if., Vuelva al fichero de datos Earnings per
Share 19.30 del ejercicio 19.30 sobre los beneficios por acci6n de una empresa. Ajuste modelos auton·egresivos de 6rdenes 1, 2 y 3. Utilice
el metodo del apart ado 19.6 para contrastar la
hip6tesis de que el orden de la autorregresi6n es
(p - 1) frente a 1a alternativa de que es p, con
un nivel de significaci6n del 10 por ciento y seleccione un valor para el orden autorregresivo.
Utilice el modelo seleccionado para hacer predicciones de los beneficios por acci6n para dentro de 4 afios. Trace un grMico temporal de las
observaciones y las predicciones. i,Serfan diferentes los resultados si se utilizara un nivel
de significaci6n del 5 por ciento para los contrastes?
19.45. (if Y En la Figura 19.18, se muestran modelos
autorregresivos ajustados de 6rdenes 1 a 4 para
datos sobre las ventas anuales. A continuaci6n,
seleccionamos un modele contrastando la hip6tesis nula de una autorregresi6n de orden
(p - 1) frente a la alternativa de una autorregresi6n de orden p al nivel de significaci6n del 10
por ciento. Repita este procedimiento, pero haga un contraste al ni vel de significaci6n del 5
por ciento.
a) i,Que modelo autorregresivo se selecciona
ahora?
b) Realice predicciones de las ventas para los 3
pr6ximos afios basandose en este modelo seleccionado.
19.46. Se ha observado que las ventas anuales de un
producto podrfan muy bien describirse por medio de un modelo autorregresivo de tercer orden. EI modelo estimado es
X,= 202+ I,lOX' - 1 - 0,48X' - 2 + 0,17X'-3 +£,
En 1993, 1994 Y 1995, las ventas fueron de 867,
923 y 951, respectivamente. Calcule las predicciones de las ventas para los afios 1996 a 1998 .
19.47. En el caso de muchas series temporales, especialmente en el de los precios de los mercados
especulativos, se ha observado que el modelo
del pas eo aleatorio representa satisfactoriamente los datos efectivos. Este modelo es
Demuestre que, si este modele es adecuado, las
predicciones de XII + /" partiendo del periodo n,
vienen dadas por
Xn+h = Xn
(h = 1,2,3, .. .)
19.48. ~ <1 Vuelva al fichero de datos Hourly Earnings del ejercicio 19.35, que muestra los beneficios de 24 meses. Sean x, (t = 1, 2, ... , 24) las
Capitulo 19.
observaciones. A continuaci6n, construya la serie de primeras diferencias:
z, = X,
-
X'-i
(t
= 2, 3, ... , 24)
Ajuste modelos autorregresivos de 6rdenes 1 a
4 a la serie Z,. Utilizando el metodo de este
apartado para contrastar la hip6tesis de que el
Analisis de series temporales y predicci6n
807
orden autorregresivo es (p - 1) frente a la alternativa de orden p, con un nivel de significaci6n
del 10 por ciento, seleccione uno de estos modelos. Utilizando el modelo seleccionado, realice predicciones para Z" donde t = 25, 26 Y 27.
Realice predicciones de los beneficios para los
3 pr6ximos meses.
19.7. Modelos autorregresivos integrados de medias m6viles
En este apartado introducimos brevemente un metodo para hacer predicciones de datos de
series temporales que se utiliza mucho en las aplicaciones empresariales. Los modelos que
analizamos incluyen como caso especial los modelos autorregresivos que hemos estudiado
en el apartado 19.6.
En un libro ch'isico, George Box y Gwilyn Jenkins introdujeron una metodologfa 10 suficientemente versatil para que un usuario moderadamente habil obtenga buenos resultados
en una amplia variedad de problemas de prediccion que se plantean en la practica (vease la
referencia bibliografica 1). La esencia del metoda de Box-Jenkins es el examen de una amplia clase de modelos a partir de los cuales pueden realizarse predicciones, junto con una
metodologfa para elegir, en funcion de las caracterfsticas de los datos de los que se dispone, un modelo adecuado para cualquier problema de prediccion.
La clase general de modelos es la clase de modelos autorregresivos integrados de medias moviles (ARIMA). Son extensiones bast ante naturales de los modelos autorregresivos
del apartado 19.6. Ademas, la suavizacion exponencial simple y los predictores de HoltWinters pueden obtenerse a partir de miembros especfficos de esta clase general, al igual
que otros muchos algoritmos que se utilizan frecuentemente para hacer predicciones. Los
modelos y las tecnicas de analisis de series temporales de Box-Jenkins pueden generalizarse para tener en cuenta la estacionalidad y tambien para analizar series temporales relacionadas, por 10 que es po sible predecir los futuros valores de una serie a partir de informacion no solo sobre su propio pasado sino tambien sobre el pas ado de otras series
relevantes. Esta ultima posibilidad permite adoptar un enfoque para realizar predicciones
que generaliza los metodos de regresion analizados en los Capftulos 12 a 14.
No es posible en el espacio de que disponemos analizar exhaustivamente la metodologfa de Box-Jenkins (para una introduccion a esta metodologfa, vease la referencia bibliografica 3). Consta, esencialmente, de tres fases :
1.
2.
3.
Basandose en estadfsticos sinteticos que son faciles de calcular a partir de los datos
de que se dispone, el analista selecciona un modelo especffico de la clase general.
No se trata simplemente de seguir automaticamente una serie de reglas sino que
hace falta un cierto grado de criterio personal y de experiencia. Sin embargo, el
analista no se compromete para siempre a seguir el modelo elegido en esta fase sino
que puede abandonarlo en favor de otro en una fase posterior si parece deseable.
EI modelo especffico elegido tiene casi invariablemente algunos coeficientes desconocidos. Estos deben estimarse a partir de los datos de los que se dispone utilizando tecnicas estadfsticas eficientes, como mfnimos cuadrados.
Por ultimo, hay que averiguar si el modelo estimado es una representacion adecuada de los datos de series temporales de los que se dispone. Cualquier indicio de
808
Estadfstica para administracion y economfa
que no 10 es en esta fase puede sugerir alguna especificaci6n alternativa y el proceso de selecci6n del modelo, de estimaci6n de los coeficientes y de comprobaci6n
del modelo se repite hasta que se encuentra uno satisfactorio.
EI enfoque de Box-Jenkins para hacer predicciones tiene la gran ventaja de la flexibili-
dad: existe una amplia variedad de predictores y la elecci6n entre ellos se basa en los datos. Ademas, cuando se ha comparado este enfoque con otros metodos, utilizando series
temporales econ6micas y empresariales efectivas, normalmente se ha observado que funciona muy bien. Por 10 tanto, puede decirse que ha superado la prueba de fuego: jen la
practica, funciona!
Para concluir este breve analisis, observese que existen programas informaticos para
realizar analisis de series temporales ajustando a los datos modelos ARIMA, incluido un
conjunto de procedimientos del programa Minitab. Sin embargo, el metodo tiene un inconveniente en comparaci6n con otros mas sencillos analizados en apartados anteriores de este
capitulo. Como hay flexibilidad para elegir un modelo adecuado de la clase general, el enfoque de Box-Jenkins es mas caro que los metodos que imponen una unica estructura del
modelo a todas las series temporales porque debe ser utilizado por personas cualificadas.
RESUMEN
Este capftulo es una introduccion al amilisis de los datos de series temporales . Hemos presentado, en primer
lugar, los nllmeros In dice como medida estandarizada
de las variaciones a 10 largo del tiempo . En el resto del
capItulo, hemos mostrado algunos utiles metodos para
predecir datos de series temporales.
Los numeros Indice constituyen una base coherente
a 10 largo del tiempo para representar precios, cantidades y otras medidas importantes. Los numeros Indice
simples son una medida del cambio can respecto a un
periodo de tiempo fijo. Los numeros Indice ponderados, como el fndice de Laspeyres, parten de proporciones de bienes constantes e indican como influyen las
variaciones de los precios de cada bien en el precio
agregado de la cesta de mercado.
Hemos comenzado la prediccion de datos de series
temporales con un amilisis de los principales componentes de las series temporales: tendencial, cfclico, estacional e irregular. A continuacion, hemos presentado
una serie de instrumentos aplicados que han demostrado ser eficaces para hacer predicciones. Hemos mostra-
do algunas versiones de los modelos de medias moviles
ponderadas y los modelos exponenciales. Hemos visto
como pueden utilizarse algunas variantes de estos metodos para controlar y estimar el efecto de los principales componentes.
Hemos introducido los model os autorregresivos para ilustrar el enfoque estocastico de las predicciones de
datos de series temporales. En ese enfoque, estimamos
parametros de un modelo que podrfan haber generado
la serie temporal. Un enfoque consiste en utilizar modelos autorregresivos en los que se plantea que una
medida en el periodo t es una funcion lineal de las observaciones pasadas mas un termino de error aleatorio.
EI desarrollo del modelo implica la especificacion del
modelo, la estimacion y a continuacion la realizacion
de un contraste para averiguar la eficacia del modele
para hacer predicciones. Por ultimo, hemos ofrecido
una vision panoramica de los modelos integrados autorregresivos de medias moviles, que son la base de una
amplia variedad de especificaciones de model os, dependiendo de la estructura que se crea que tiene el proceso.
TERMINOS CLAVE
aniilisis de los componentes
de las series temporales, 779
calculo de fndices de precios
de un lmico articulo, 767
cambio del periodo base, 770
contraste de rachas, 775
contraste de rachas: grandes muestras, 775
fndice de cantidades agregado
ponderado, 769
fndice de cantidades de Laspeyres, 770
fndice de precios agregado
ponderado, 768
fndice de precios enlazado, 771
fndice de precios de Laspeyres, 768
fndice de precios no ponderado, 767
Capitulo 19.
Analisis de series temporales y predicci6n
numeros fndice, 764
predicci6n con el metodo de
Holt-Winters: series estacionales, 797
predicci6n con el metoda de
Holt-Winters: series no estacionales, 793
predicci6n a partir de modelos
autOlTegresivos estimados, 803
mcd ias moviles centradas
simples de (2m + 1) puntos, 781
metodo de desestacionalizaci6n
med iante medias m6viles simples, 785
modelos ARIMA, 807
modelos autOlTegresivos
y su estimaci6n, 802
809
predicci6n por medio de la
suavizaci6n exponencial
simple, 791
series temporales, 777
suavizaci6n exponencial
simple, 789
EJERCICIOS V APLICACIONES DEL CAPITULO
19.49.
I"
Vuelva al ejercicio 19.35 y al fichero de datos Hourly Earnings, que muestra los ingresos
mensuales por hora de la industria manufacturera.
a) Calcule un fndice con el mes I como base.
b) Calcule un fndice con el mes 5 como base.
19.50. , . Una biblioteca compra Iibros y revistas.
La tabla adjunta y el fichero de datos Library
Purchases muestran los precios medios (en d6lares) pagados por cada uno y las cantidades
compradas en un periodo de 6 anos. Utilice el
ano 1 como base.
Libros
Revistas
ADO
Precio
Cantidad
Precio
Cantidad
1
2
3
4
5
6
20,4
22,3
23,3
24,6
27,0
29,2
694
723
687
731
742
748
30,1
33,4
36,0
39,8
45,7
50,7
155
159
160
163
160
155
a) Halle el fndice de precios agregado no ponderado.
b) Halle el fndice de precios de Laspeyres.
c) Halle el fndice de cantidades de Laspeyres.
19.51. Explique la afirmaci6n de que puede considerarse que una serie temporal esta formada por
varios componentes. Ponga ejemplos de series
temporales empresariales y econ6micas en las
que es de esperar que sean importantes determinados componentes.
19.52. En much as aplicaciones empresariales, las predicciones de los futuros valores de las series
temporales, como las ventas y los beneficios,
se hacen exclusivamente con informaci6n pasada sobre la serie temporal en cuesti6n. i,Que caracterfsticas de la conducta de las series temporales se explota en la producci6n de esas
predicciones?
19.53. Una persona encargada del control de las existencias solicita predicciones mensuales de las
ventas de varios productos para los 6 pr6ximos
meses. Esta persona tiene datos sobre las ventas
mensuales de cada uno de estos productos de
los 4 ultimos aftos. Decide utilizar como predicciones para cada uno de los 6 pr6ximos meses
las ventas mensuales medias de los 4 ultimos
anos. i,Cree que es una buena estrategia? Explique su respuesta.
19.54. i,Que se entiende por ajuste estacional de una
serie temporal? Explique pOI' que los organismos oficiales realizan muchos esfuerzos para
desestacionalizar las series temporales econ6micas.
19.55.
I .. EI fichero
de datos US Industrial Production muestra un fndice de producci6n industrial
de Estados Unidos de 14 aftos.
a) Realice un contraste de aleatoriedad de esta
serie utilizando el contraste de rachas.
b) Trace un grMico temporal de estos datos
y analice las caracterfsticas que revela el
grMico.
c) Calcule la serie de medias m6viles centradas
simples de 3 puntos. Represente grMicamente esta serie suavizada y anal ice su conducta.
19.56. "
EI fichero de datos Product Sales muestTa
24 observaciones anuales sobre las ventas de un
producto.
a) Uti lice la variante del contraste de rachas
para grandes muestras para hacer un contraste de aleatoriedad de esta serie.
b) Trace un grMico temporal de los datos y
analice las caracterfsticas de la serie mostra
da en este grMico.
c) Calcule la serie de medias m6viles centradas
simples de 5 puntos. Represente graficamente esta serie suavizada y anal ice su conducta.
810
Estadistica para administraci6n y economia
19.57. t,.) El fichero de datos Quarterly Earnings
19.57 muestra los beneficios trimestrales por accion de una empresa en 7 afios.
a) Represente gr<'ificamente estos datos. i,Sugiere este gr<'ifico la presenci a de un fuerte
componente estacional?
b) Utilice el metodo del fndice estacional para
obtener una serie desestacionalizada.
19.58.
f.,
El fichero de datos Price Index muestra 15
val ores mensuales del fndice de precios de una
mercancfa.
a) Calcule la serie de medias moviles centradas
simples de 3 puntos .
b) Trace un gr<'ifico temporal de la serie suavizada y comente sus caracterfsticas.
19.59. ~; Vuelva al ejercicio 19.56 y al fichero de datos Product Sales. Uti lice la suavizacion exponencial simple con una constante de suavizacion
rx = 0,5 para hacer predicciones de las ventas
para los 3 proximos afios.
19.60. ( ) Vuelva al ejercicio 19.58 y al fichero de datos Price Index. Utilice el metoda de HoltWinters con las constantes de suavizacion
rx = 0,3 y f3 = 0,4 para hacer predicciones del
Indice de precios para los 4 proximos meses.
19.61. ( ) Vuelva al ejercicio 19.57 y al fichero de datos Quarterly Earnings 19.57. Utilice el metodo estacional de Holt-Winters con las constantes
de suavizacion rx = 0,4, f3 = 0,4 y y = 0,2 para
hacer predicciones de esta serie de beneficios
por accion para los cuatro proximos trimestres.
19.62. 0' ,) Basandose en el fichero de datos Product
Sales del ejercicio 19.59, estime modelos autorregresivos de ordenes 1 a 4 para las ventas del
producto. Utilizando el metodo del apartado
19.6 para contrastar la hipotesis de que el orden
autorregresivo es (p - I) frente a la alternativa
de que el orden es p , con un nivel de significacion del 10 por ciento, elija uno de estos modelos. Haga predicciones para los 3 proximos afios
a partir del modelo elegido.
Bibliografla
1.
2.
3.
Box, G. E. P. Y G. M. Jenkins, Time Series Analysis, Forecasting, and Control, San Francisco,
Holden-Day, 1970.
Granger, C . W. Y P. Newhold, Forecasting Economic Time Series, Orlando, Fl, Academic Press,
1986, 2.a ed.
Newbold, P. y T. Bas, Introductory Business Forecasting, Cincinnati , OH, South-Western, 1994,
2.a ed.
Descargar