Analisis de series temporales y predicci6n / / Esquema del capitulo 19.1. Numeros indice indice de precios de un unico articulo i~ice de precios agregado no ponderado in ice de precios agregado ponderado i dice de cantidades agregado ponderado Cambio del periodo base 19.2. Un contraste no parametrico de aleatoriedad 19.3. Componentes de una serie temporal 19.4. Medias m6viles Extracci6n del componente estacional por medio de medias m6viles 19.5. Suavizaci6n exponencial Modelo de predicci6n por medio de la suavizaci6n exponencial con el metodo Holt-Winters Predicci6n de series temporales estacionales 19.6. Modelos autorregresivos 19.7. Modelos autorregresivos integrados de medias m6viles Introducci6n En este capitulo presentamos metodos para analizar conjuntos de datos que contienen mediciones de varias variables a 10 largo del tiempo. Ejemplos de datos de series temporales son las ventas mensuales de un producto y los tipos de interes, los beneficios empresariales trimestrales y el consumo agregado y las cotizaciones al cierre de la bolsa. Serie temporal Una serie temporal es un conjunto de mediciones, ordenadas en el tiempo, sobre una cantidad de inten!s. En una serie temporal, la secuencia de observaciones es importante, a diferencia de 10 que ocune en los datos de corte transversal, en el que la secuencia de observaciones no es importante. Los datos de series temporales normal mente poseen caracteristicas especiales -relacionadas con la secuencia de observaciones- que exigen el desarrollo de metodos de anal isis estadistico especiales. Casi todos los metodos de anal isis de datos y de inferencia que hemos desarrollado se basan en el supuesto de que las muestras son 764 Estadfstica para administracion y economfa aleatorias, en concreto, de que los errores de las observaciones son independientes. EI supuesto de la independencia raras veces es realista en el caso de los datos de series temporales. Consideremos, por ejemplo, una serie de ventas mensuales de un producto manufacturado y observemos las razones posibles por las que no son independientes. Si el mes pasado las ventas fueron superiores a la media, es razonable esperar que continuen siendo altas, ya que no es probable que cambie bruscamente la situacion de la economfa y de las empresas. Por 10 tanto , es de esperar que las ventas de meses contiguos sean similares. Tambien observamos que las ventas de muchos productos tienen una pauta estacional: los pantalones cortos y los banadores se venden mas en primavera y a principios del verano que en invierno. Muchas tiendas minoristas venden mas en el cuarto trimestre debido a las compras de regalos de Navidad. Estos y otros muchos ejemplos demuestran la ausencia de independencia. La ausencia de independencia entre las observaciones de series temporales plantea serios problemas si se utilizan con datos de series temporales los metodos estadfsticos convencionales, que suponen que las observaciones son independientes. Ya vimos el problema en el apartado 14.7 cuando analizamos las dificultades que se plantean si se utilizan metodos convencionales de regresion cuando los errores estan correlacionados . EI supuesto de la independencia es fundamental; tambien pueden plantearse otros problemas serios si se utilizan metodos convencionales cuando las observaciones son dependientes. En este capftulo, centramos la atencion en los metodos de anal isis de series temporales que se utilizan cuando hay una unica serie temporal. Hemos analizado el aspecto negativo de los tipos de pautas de dependencia que es probable que aparezcan en los datos de series temporales. Estos problemas son reales y requieren metodos especiales. Sin embargo, esta dependencia tam bien puede explotarse para realizar predicciones de los futuros valores de los datos de series temporales cuya varianza es menor. Por ejemplo, si hay una correlacion entre errores de meses contiguos en una serie de ventas al por menor, esa correlacion puede utilizarse para hacer una prediccion de las ventas del proximo mes mejor que una prediccion basada en una muestra aleatoria. Presentaremos metodos basados en el supuesto de que las pautas anteriores de relacion entre mediciones de una serie temporal se mantendran en el futuro y pueden utilizarse para hacer predicciones, 10 cual es como afirmar que podemos aprender en realidad del estudio de la historia. En el primer apartado desarrollamos numeros fndice, que se utilizan en algunos estudios economicos. Los metodos de anal isis de series temporales que se presentan en los apartados posteriores no requieren el conocimiento de los numeros fndice. Se incluyen aquf para hacer una presentacion completa de los temas relacionados con el analisis de series temporales. 19.1. Numeros fndice Nuestro analisis comienza con el desarrollo de numeros fndice . Consideremos, a modo de introduccion, la siguiente pregunta: l,que variaciones ha experimentado el precio de los automoviles fabricados en Estados Unidos en los 10 tiltimos afios? Ni que decir tiene que ha subido, pero l,como puede describirse cuantitativamente esta subida? A primera vista, no parece que sea muy diffcil responder a esta pregunta. EI primer paso serfa recoger informacion sobre el precio de estos automoviles en cada uno de los 10 ultimos afios y representarlo en un gr:ifico temporal. Sin embargo, el analisis detenido del problema podrfa plantear algunas preguntas. En primer lugar, observamos que los automoviles no son homogeneos, por 10 que es necesario definir con mas precision el tipo de automovil. Existe claramente una amplia variedad de Capitulo 19. Analisis de series temporales y predicci6n 765 precios y de calidades y la variacion del precio medio de todos los automoviles vendidos podrfa deberse meramente a un cambio de la pauta de compra: ~se venden automoviles de precio mas alto? En este caso, el precio medio subirfa, porque tenemos automoviles de precio mas alto. Otros cambios de la combinacion de mere ado podrfan provocar otras variaciones de la media. La Tabla 19.1 muestra un sencillo ejemplo hipotetico de un mercado en el que solo hay automoviles de precio bajo y automoviles de precio alto. Observese que el precio medio baja, pero que esta bajada se debe a que en la mezcIa hay mas automoviles de precio bajo y menos de precio alto. Esta forma de comparar el precio de los automoviles de dos afios diferentes no es especialmente uti!. Tabla 19.1. Datos hipoteticos sobre los precios y las ventas de automoviles. Automoviles pequeDos ADO 1 2 Precio (miles de dolares) 10 11 ) Automoviles de lujo Numero vendido (miles) Precio (miles de dolares) Ntimero vendido (miles) 5 15 30 33 IS 5 Todos los automoviles Precio medio (miles de dolares) 25,0 16,5 Otra solucion es caIcular el precio medio considerando un unico automovil de cada tipo, como en la Tabla 19.2. Este metoda tambien tiene problemas, porque tenemos un mercado en el que los automoviles pequefios son considerablemente mas populares que los de lujo. El precio de los primeros es el mismo en los dos afios, mientras que el de los segundos se duplica. Como consecuencia, la media calculada considerando un unico automovil de cada tipo es mucho mas alta en el segundo ano. Pero esta media no refJeja exactamente la situacion, ya que da el mismo peso a los dos tipos de automovil cuando, en realidad, los automoviles pequenos se compran mucho mas a menudo. Tabla 19.2. Datos hipoteticos sobre los precios y las ventas de autom6viles: igual ponderacion. Automoviles pequeDos ADO 1 2 Automoviles de lujo Todos los automoviles Precio (miles de dolares) Numero vendido (miles) Precio (miles de dotares) Numero vendido (miles) Precio medio de cada tipo de automovil (miles de dolares) 10 100 100 24 48 1 1 29 10 17 Estos ejemplos demuestran que, para hacernos una idea fiable de la pauta general de los precios a 10 largo del tiempo, hay que tener en cuenta las cantidades compradas en cada periodo. Veremos como pueden caIcularse medias ponderadas adecuadas. Se plantea el mismo problema si los compradores compran mas automoviles con mas extras el segundo ano que el primero. En ese caso, compran implfcitamente automoviles de mayor calidad que en el primer ano. Podrfamos exarninar solamente los precios de los automoviles sin extras para hacer una comparacion valida. Las mejoras tecnologicas plantean otra dificultad. No es sorprendente observar que los automoviles actuales consumen menos gasolina y duran mas que los que se fabricaban ha- 766 Estadfstica para administracion y economfa ce 20 0 30 afios. Por 10 tanto, los cambios de la calidad pueden influir mucho en las subidas de los precios. Es muy importante tenerlos en cuenta cuando se hacen comparaciones de precios, pero las tecnicas para analizar su influencia quedan fuera del alcance de este libro. Hemos puesto ejemplos de un unico producto para ilustrar el problema, pero esas comparaciones normalmente solo tienen interes para las personas relacionadas directamente con la compraventa de ese producto. Nos dedicaremos, pues, a comparar las variaciones de los precios de unos productos con las variaciones de los precios de otros. EI problema de numeros fndice que examinamos a continuacion tiene por objeto comparar las variaciones de los precios de un grupo de mercancfas. Por ejemplo, el precio de las acciones de empresas que cotizan en bolsa varfa en un meso Nos gustarfa desarrollar una medida de la variacion agregada de los precios. Los numeros fndice pretenden resolver esos problemas. Indice de precios de un unico articulo Comenzamos nuestro analisis de los numeros fndice con un sencillo caso. La Figura 19.1 es una hoja de calculo Excel que muestra el calculo de un fndice de precios de las acciones de Ford Motor Company en un periodo de 12 semanas. La segunda columna contiene el precio efectivo de las acciones. Es algo diffcil interpretar estos numeros, pero esta tarea puede simplificarse calculando un fndice de precios utilizando el precio de la primera semana como periodo base. En la tercera columna, vemos el fndice de precios calculado. Asf, el fndice de precios de la segunda semana es 100 ( 19875) 2~,25 = 98,1 basandose en el precio de la segunda seman a de 19,875. Los porcentajes calculados de esta forma se Haman numeros fndice del precio. La eleccion del periodo base es arbitraria. Podrfamos haber elegido cualquier otra semana como base y haber expresado todos los precios en porcentaje del precio de esa semana. La ventaja de utilizar aquf mimeros fndice reside en que es mas facil interpretar los numeros. Por ejemplo, en la Figura 19.1 vemos inmediatamente que el precio de las acciones de Ford Motor Company fue un 13,6 por ciento mas alto en la seman a 12 que en la 1. Figura 19.1. Precios e fndi ce de precios de las acciones de Ford Motor Company en 12 semanas. X Microsoft Excel Book1 Price Price Index 20.250 100.0 ' 19.000 19.750 20.250 19.875 19.375 ' 19625 21125 22.375 25.000 23000 93.8 97.5 100.0 98.1 95.7 96.9 1043 ' 110.5 : 123.5 1136 , 100(19.875J=98. 1 20.25 19875c:::JEIl.-"--L~=:....!..._-..l 4: 5' 6' 7 8 9' 10 ' 11 12 Capitulo 19. Analisis de series temporales y prediccion 767 Calculo de indices de precios de un unico articulo Supongamos que tenemos una serie de observaciones a 10 largo del tiempo del precio de un unico articulo. Para construir un indice de precios, elegimos como base un periodo de tiempo y expresamos el precio de cad a periodo en porcentaje del precio del periodo base. Por 10 tanto, si Po representa el precio del periodo base y P, el precio del segundo periodo, el indice de precios del segundo periodo es Indice de precios agregado no ponderado A continuacion, vemos como se representan las variaciones de los precios agregados de un grupo de artfculos. La Figura 19.2 es una hoja de calculo Excel que muestra los precios pagados a los agricultores estadounidenses, en dolares, pOl' quintal por el trigo, el mafz y la soja en 10 anos. La tabla tarribHm muestra una manera de lograr un fndice de precios agregada de estos cultivos. Calculamos el precio medio de cada ano y utilizamos esa media para construir un fndice de la media, utilizando el primer ano como base. Figura 19.2. Precios por quintal de tres cultivos en 10 anos: fndi ce de precios agregado no ponderado. .x NJClosoft [lICel , Flguro 11 1 Puc e Indell.xls I Med ia simple Es facil calcular el fndice de precios agregado no ponderado, como muestra la Figura 19.2. Expresa el precio medio de cada ano en porcentaje del precio medio del ano base. Sin embargo, no tiene en cuenta las diferencias entre las cantidades cultivadas de estos productos. La formu la de la Figura 19.2 indica la division de las sumas de los precios. Eso es, por supuesto, 10 mismo que dividir pOl' las medias de estos precios. Estas medias serfan el resultado de dividir las sumas del numerador y del denominador por 3. Un indice de precios no ponderado Supongamos que tenemos una serie de observaciones en el tiempo sobre los precios de un grupo de K articu los . Se elige como base un periodo de tiempo. EI indice de precios agregado no ponderado se obtiene calculando el precio medio de estos articulos en cada periodo de tiempo y calculando a continuaci6n un indice de estos preGios medios. Es decir, el precio medic de cada periodo se expresa en porcentaje del precio medio del periodo base. Sea POi el precio del i-esimo articulo en el periodo base y P'i el precio 768 Estadfstica para administracion y economfa de este articulo en el segundo periodo. EI indice agregado no ponderado de precios de este segundo periodo es K L Pli 100 indice de precios agregado ponderado En general, nos gustarfa ponderar los precios por alguna medida de la cantidad vendida. Una posibilidad es utilizar las cantidades medias de algunos de los periodos en cuesti6n 0 de todos. En muchos casos, es caro obtener cantidades, por 10 que los fndices se basan en cantidades de un unico periodo. Cuando estas cantidades proceden del periodo base, el fn dice resultante se llama indice de precios de Laspeyres. El fndice de Laspeyres compara, en efecto, el coste total de comprar las cantidades del periodo base en el periodo base con el coste total de comprar estas mismas cantidades en otros periodos. Para ilustrarlo, consideremos los datos de la Figura 19.2 sobre los precios de los cultivos con la informaci6n adicional de que la producci6n en el ano 1 fue de l.352 millones de quintales de trigo, de 4.152 millones de quintales de mafz y de l.127 millones de quintales de soja. Por 10 tanto, el coste, en mill ones de d6lares, de la producci6n total del ano 1 fue . (l.352)(1,33) + (4.152)(1 ,33) + (1.127)(2,85) = 10.532 En el ano 2, a los precios vigentes entonces, el coste total de comprar las cantidades del ano base habrfa sido (l.352)(1,34) + (4.152)(1,08) + (1.127)(3,03) = 9.711 El fndice de precios de Laspeyres del ano 2 es, pues, 9.7 11 ) 100 ( 10.532 = 92,2 La Figura 19.3 muestra el fndice completo correspondiente a estos datos ca!culado de esta forma. EI Indice de precios de Laspeyres Supongamos que tenemos un grupo de K mercancias de las cuales se dispone de informaci6n sobre los precios que ten ian en un periodo de tiempo. Se selecciona un peri odo como base del indice. EI Indiee de preeios de Laspeyres en cualqu ier periodo es el coste total de comprar las cantidades comerciadas en el periodo base a los precios del periodo de interes, en porcentaje del coste total de comprar estas mismas cantidades en el periodo base. Sea POi el precio y %i la cantidad comprada del i-esimo articulo en el periodo base. Si P1i es el precio del i-esimo articulo en el segundo periodo, el indice de precios de Laspeyres del periodo es 100 Capitulo 19. Analisis de series temporales y pred iccion Figura 19.3. fndice de precios de Laspeyres de tres cu ltivos. 769 X Microsoft Excel" Figure 17 1 Price Index. xl. 1I~ Eile !::dit 'liew Insert Fgrmat l ools Qata ~HStat ~indow Wji! 2!mulate tlelp ID~ !iii I ~ [9. ~ 1JI, i%ll @ 4 1\" . ~ ~+ ~, r .. ·1 t;, 1L f,. I U ~ ~ $ %0 J +.00 ,,0 •• _ _ _ Ea ! +. - .-",·,,·,,··-"".···-:",,·-,,·,,"""·"·--1-"·"··············,,"'''...,,'''' -.--.. E6 ,Y . " , = =SUlvlPRODUCT($B$4:$D$4 ,B6D6) -j'Ic;.-;;;--,,----,, • .10. 1B A . -J { ' _."."." B ,-~" C Iiii D .-----~ =- I E F G 2 3 4 5 6 7 B 9 10 11 12 13 14 15 16 . Yea'r VVhe'al' Corn Soybeans Total Cost' Year 1 , Production 1,352 4,152 ,127 Year Prices 1.33 1.33 1> 285 1 lO,532! 1.08 ' 2' 134 3.03 9,711 : 4.37 13,323 1,76 ' 3 1.57 4, 395 : 5.68 ' 2.55 22,329 5, 25,594 3. 03 6.64 : 4.09 ! 6 3.56 2.54 4.92 ' 20 ,904 ' 6.31 ' 20 ,293 7: 273 . 2.15 3: 2.33 18,773 2.02 : 6.42 ' 20,255 ' 2.97 2.25 6.12 ' 9: 10 3.73 2.52 6.28 22 ,651 Laspeyres Index 100 922 ' ~ 131I 212.0 : 243.0 ' 19B.5 ' 1927 i 178.2 ' 192.3 , 215.1 - JOo( 10,532 9,711 )= 92.2 17 Es util comparar la formula del indice de precios de Laspeyres con la del indice de precios agregado no ponderado. La diferencia es que, cuando se calcula el indice de Laspeyres, el precio de cada articulo se pondera por la cantidad comerciada en el periodo base. Vemos que el indice de precios de Laspeyres utiliza unicamente la informacion sobre la cantidad del periodo base. Eso es valioso cuando es diflcil obtener esa informacion de cada periodo. Podrfa ser un inconveniente si las cantidades del periodo base no fueran representativas de la serie temporal examinada. Por 10 tanto, el indice de precios podria quedarse anticuado. Este problema puede resolverse calculando un fndice de precios de Laspeyres movil, en el que el periodo base se cambia de vez en cuando obteniendo informacion sobre la cantidad de los nuevos periodos base. Muchos de los indices de precios oficiales que se publican, como el indice de precios de consumo, se calculan esencialmente de esta forma. Indice de cantidades agregado ponderado Los indices de precios constituyen una representacion de la evolucion de los precios agregados de un grupo de mercancfas. Tambien podriamos querer una representacion de la evolucion de las cantidades totales comerciadas. De nuevo, es probable que cualquier enfoque razonable de este problema de como resultado un indice de cantidades ponderado, ya que probablemente querriamos dar mas peso a un cambio de la cantidad comprada de un articulo muy caro que a un cambio de la misma cantidad comprada de un articulo barato. Un metoda para lograrlo es el Indice de cantidades de Laspeyres, que ilustramos con las cantidades producidas de trigo, maiz y soja de la Figura 19.4. El fndice de cantidades de Laspeyres pondera las cantidades por los precios del periodo base. Las ponderaciones de los precios son 1,33, 1,33 Y 2,85 en el caso del trigo, el maiz y la soja, 10 que da como resultado un valor total en el ano 1 de lO.532 millones de dolares . Para obtener un indice de cantidades del ano 2, 10 comparamos con el valor total de la produccion del ano 2, si hubieran estado vi gentes los precios del ano 1; es decir, (1.618)(1 ,33) + (5.641 )(1,33) + (1.1 76)(2,85) = 13.006 770 Estadfstica para administracion y economfa Figura 19.4. Produccion, en millones de quintales, e fndice de cantidades. E Microsoft Excel- Figure 17.1 Pnce Index _! ~ Wheat Year Corn Soybea ns Total Cost Laspeyre s Quant ity inde x Year 1 Pric es 1 2 3 10 1.33 1,352 1,61 8 1,545 1.105 2.122 2.142 2,026 1.199 2,134 2,370 1.33 4,152 5,641 5,573 5.647 5.829 6.266 6,357 7,082 7,933 6,648 2.85 1,127 1,176 1,271 1.547 1,547 1.288 1.116 1,843 2,268 1,817 10,532 13,0061 13,089 14 ,187 14.984 14 ,853 16,040 17,064 19,861 17,172 100( 13,006) = 123.5 10,532 1341 1423 141 .0 152.3 162.0 188.6 1GJ.0 El fndice de cantidades de Laspeyres del ano 2 es, pues, 13,006) 100 ( 10,532 = 123,5 La Figura 19.4 muestra las cantidades producidas y el indice de cantidades de un periodo de 10 anos, EI fndice de cantidades de Laspeyres Tenemos datos sobre la cantidad de un conjunto de artfculos recogidos durante un conjunto de K afios. Se selecciona un periodo como periodo base, Elindice de cantidades de Laspeyres en cualquier periodo es el coste total de las cantidades comerciadas en ese periodo, basado en los precios del periodo base y expresado en porcentaje del coste total de las cantidades del periodo base. Sean %i y POi la cantidad y el precio del i-esimo articulo en el periodo base y q1i la cantidad de ese articulo en el periodo de interes. EI indice de cantidades de Laspeyres de ese periodo es, pues, 100 Cambio del periodo base Las series oficiales de mimeros fndice se actualizan cambiando el periodo base por uno mas reciente. En estos casos, normalmente se calcula el valor del fndice original en el periodo que ahora se toma como base. Observese a modo de ilustraci6n el caIculo de la columna F de la Figura 19,5, que muestra los indices de precios del trigo, el mafz y la soja. La columna F muestra el indice de precios de los cultivos de los anos 1 a 6, utilizando el ano 1 como base comenzando por la fila 14 de la columna F. La columna H indica el fndice de precios de Laspeyres de los anos 6 a 10, utilizando el ano 6 como base, Estos indices se representan en la Figura 19.6, en la que es evidente la discontinuidad en el ano 6. Analisis de series temporales y predicci6n Capitulo 19. Figura 19.5. in dice de precios ag regado de Laspeyres utilizando diferentes anos base. X NtcfOloh ~ Excel · t" ,dO D (;i: FIQUIO ~ 17 1 P"co Indo. all 1"'''' '",mot look ~". " cit Cl>. ~' i ,1\ lib e <1 ;. , _.. _ _ WUI jJmuI.t. IjoIo 1 1W1~ 1 ~1Q,,1:JHE] .:l!fJ~ I .., . " , to '5' I 1: f· !l HI}. ~ ! 100% · 100 :1 10 . 1B I l l 8'. Oil $ % • :.8.~ \If t,e .-:= ~ .~ :_ *,-.:1 - ,, ~ fl1-;100/SF$1:' _. -- -- - ."'.~ -- .... -----. ;.~." . '-- -~u m: 771 ..L 2 .1::' Sphc~d 4 1 'ie;a r INheat (0111 1,352 4,152 So)'be-ans Tola! Co;~t Laspe yres Tot al Co:l L.lJs pey re s Inde x Inde x Year & 8 lse ('fecH G BasEl) ) ';- (11 '1 5 I PwJ!j.:tlon 6 ; \'e,ir 7 8 , 9 10 4 11 5 12 j 6 t lieal 6 Prices 133 1301 176 ' 3 95 · 4 09 356 1 33 108 157 255 303 254 -;4 21 42.00 626600 G 3.56 254 ;~ ~ li ffi l 19 ) m 2.73 233 297 215 202 225 2~ 13 : Produc tion 29 i 9 to( ~ , i , t. ! 1,1"27 3m IO.5 3 ~ 1000 " .U53 9.711 13.823 22 ,32'3 922 1;;,540 '16.5 1312 19.::36 31,755 66 1 1068 2120 2430 1985 25,~94 20 .904 504 35.m! 100.0 -243-.0) = 122.4 ( 198.5 11$300 .<j S,2 681 fi 42 61:' 6~ F19tJr€> 176 n,G7fJ 23,091 1000 94.0 · 667 94 9 107 O· I(\J G 940 867 94 9 1070 25 ,917 2<3,343 31,976 Yr" .. I"de, ,..._ ...... -,•.lr-.- -.., - _-. -_ -..-.., - -t.ll ,. - .-..-j - , - - - - - , , .4.. .. '_._ ~ _____ ~ _____,.",, __._ •. _ '.'.. '_'" _.' \,;!:~~,.I1,,! .A,.El.U4r.~.U,~ ,.A..!.W:U.?,-'!.Ji._~~!J:?,LA fiIJ UI· C I 't.!; A.fm~ ~eady . , 1--' i - - r'"I" . .~:~~~IJ..~.~:::'::~.::'?~.::.~.:..~.:.... ...i.!lr..~~::-*.,~~:l::'~:'.'~~.1:Jl~ Mic<a..ft E,ce! · fi!>< .. 'N(X>1 i :i:!l!li"·~·1 1I .~Ii.\! '. Examinando la Figura 19.6, es diffcil comprender claramente las pautas de precios de to do el periodo. Por 10 tanto, prefeririamos examinar un indice de precios enlazado que tuviera el ano 6 como ano base. En el Indice original bas ado en el ano 1, el Indice del ano 6 era 198,5 como se ve en la Figura 19.5. Para transformar el indice del ano 6 basado en el ano 1 en un fndice del ano 6 tomando como base el ano 6, dividimos por 198,5 y multiplicamos por 100. Tambien podemos converti r todos los demas indices cuya base es el ano 1 a una base del ano 6 dividiendo por 198,5 y multiplicando por 100. Por ejemplo, el nuevo Indice del ano 5 es 2430) 100,0 ' ( 198,5 Figura 19.6. Gr3fico temporal del indice de precios agregado de Laspeyres can los anos 1-6 (ana base 1) y los arios 6-10 (ano base 6). = 122,4 300,0 250,0 1/1 Q) 200,0 .!:a "C I: Q) (,) 150,0 .;: D.. ----.- 100,0 J / /\ -- ....... --- 50,0 0,0 o 2 4 6 Year 8 10 772 Estadfstica para administracion y economfa La Figura 19.7 representa el fndice enlazado que se obtiene utili zando co mo base el ano 6. Este gnifico es una representaci6n In:is clara de la pauta de vari aci6n de los precios en el periodo de 10 anos. Figura 19.7. fndice de precios agregado de Laspeyres enlazado del trigo, el marz y la soja (ano 6=100). 140,0 120,0 100,0 >< (1) "c 80,0 u .;: 60,0 (1) D.. 40,0 20,0 0,0 0 2 4 8 6 10 Year EJERCICIOS Ejercicios basicos Ejercicios aplicados 19.1. Suponga que esta analizando un mercado y en- Nota : los ejercicios 19.4 a 19.7 deben realizarse mediante el programa Excel. cuentra un fndice de precios de Laspeyres que se calculo utilizando el ano 2000 como periodo base. Interprete los resultados suponiendo que el fndice de 2003 es: a) 134,5 b) 97,4 c) 101,7 19.2. Vuelva a la Figura 19.4. Calcule el fndice de cantidades de Laspeyres revisado de los anos 1 a 6 suponiendo que los precios del ano 1 son 1,45 (trigo), 1,21 (mafz) y 2,98 (soja). 19.3. Las universidades tienen muchos costes, entre los cuales se encuentran los costes de la energfa, los libros, el laboratorio y demas equipo, el material de oficina y la mana de obra. Suponga que Ie piden que muestre como han variado los niveles de precios a los que se enfrenta su universidad en los 10 Ultimos anos. l,Que dificultades esperarfa encontrarse y como intentarfa resolverlas? 19.4. La tabla adjunta muestra el precio por accion del Banco de Nueva York, Inc., de 12 semanas. Semana Precio Semana Precio Semana Precio 2 3 4 35 357/8 346/8 343/8 5 6 7 8 35 347/8 35 346/8 9 10 11 12 346/8 35 2/8 38 6/8 37 1/8 a) Calcule un fndice de precios utilizando la semana 1 como periodo base. b) Calcule un fndice de precios utilizando la semana 4 como periodo base. 19.5. Un restaurante ofrece tres platos especiales: bistec, pescado y pollo. La tabla adjunta muestra sus precios medios (en dolares) en los 12 meses del ano pasado. Capitulo 19. Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Sepliembre Oclubre Noviembre Diciembre Bistec Pescado Polio 7,12 7,41 7,45 7,70 7,72 7,75 8,10 8,15 8,20 8,30 8,45 8,65 6,45 6,40 6,25 6,60 6,70 6,85 6,90 6,84 6,96 7.10 7,10 7,14 5,39 5,21 5,25 5,40 5,45 5,60 5,54 5,70 5,72 5,69 5,85 6,21 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Bistec Pescado Polio 123 110 115 101 118 100 92 87 123 131 136 149 169 160 18 1 152 140 128 129 130 164 169 176 193 243 25 1 265 231 263 237 221 204 293 301 327 35 1 773 19.6. La tabla adjunta muestra los salarios por hora de tres tipos de empleados de una pequena empresa en 6 anos. Aiio Obreros J 2 3 4 5 6 10,60 11 ,10 11 ,80 11,90 12,30 12,50 Administrativos Supervisores 8,40 8,70 9,10 9,20 9,60 9,70 16,40 19,50 19,90 18,80 19,00 19,30 Tome el ano 1 como base. Ese ano habia 72 obreros, 23 administrativos y 10 supervisores. a) Halle el fndice de salarios por hora no ponderado. b) Halle el fndice de salarios por hora de Laspeyres. La tabla adjunta muestra el nllmero mensual de pedidos de estos platos especiales. Tome enero como base. Mes Amilisis de series temporales y prediccion 19.7. La tabla adjunta muestra un indice de precios de un grupo de mercancfas en 6 anos. Calcule un fndice enlazado utilizando el ano 4 como base. Aiio 2 Mia base 1 Ano base 2 100 3 4 5 6 108,4 114,3 120,2 100 103,5 107,8 19.8. Explique por que es util desarrollar un fndice a) Halle el fndice de precios agregado no ponde- de precios de un grupo de productos, por ejemplo, un fndice de precios de la energfa. (,Cmlles son las ventajas de un fndice de precios ponderado? rado. b) Halle el fndice de precios de Laspeyres. c) Halle el fndice de cantidades de Laspeyres. 19.2. Un contraste no parametrico de aleatoriedad Para analizar datos de series temporales, hay que realizar en primer lugar un contraste de aleatoriedad de las series temporales. Presentamos el contraste de rachas, que es un contraste no parametrico especialmente facil de realizar. Para mostrar el contraste, examinaremos primero una serie de 16 observaciones diarias sobre un Indice del volumen de acciones negociadas en la bolsa. Los datos se muestran en la Tabla 19.3 y se representan en la Figura 19.8. En esta figura, se ha trazado una lfnea en la mediana. La mediana de un numero par de observaciones es la media del par central cuando las observaciones se ordenan en sentido ascendente. En este caso, es Mediana = 107 + 108 2 107,5 Si esta serie fuera aleatoria, el volumen negociado en un dia seria independiente del volumen negociado en cualquier otro dla. En concreto, un dla de un elevado volumen de 774 Estadfstica para administraci6n y economfa Tabla 19.3. Figura 19.8. Indice del volumen de acciones negociado seg un el dfa. fndice del volumen de acciones negociado. D1a VolumeD Dia VolumeD Dia VolumeD 1 2 3 4 98 93 82 103 5 6 7 113 9 10 114 107 130 III 104 103 8 11 III 12 109 Dia VolumeD 13 109 108 128 14 15 16 92 ~---------------, • 120 - • • c (1)110• ••• E 107,5 ... ......... ... ... .. .... ....... ........ ... .. . ::::l g 100 - • 90 80 • • • • -~ • • _ _ _-,~_ _ _. -_ _ _,-~ o 10 5 15 Dfa contrataciones no tendrfa mas probabilidades que cualquier otro dfa de ir seguido de otro dfa de un elevado volumen de contrataciones. EI contraste de rachas que presentamos aquf divide las observaciones en un subgrupo situado por encima de la mediana y un subgrupo situado por debajo de la mediana, como muestra la Figura 19.8; la mediana es 107,5 . Si + representa las observaciones situadas por encima de la mediana y - las observaciones situadas por debajo de la median a, observamos la siguiente pauta a 10 largo de los dfas consecutivos: -- - -++ - - +-+++++ Esta secuencia esta formada por una racha de cuatro « - », seguida de una racha de dos «+ », una racha de dos «- », una racha de un «+ », una racha de un «- », una racha de cinco «+» y, finalmente, una racha de un «- ». En total, hay, pues, R = 7 rachas. Si, como cabrfa sospechar aqu!, existe una relacion positiva entre las observaciones contiguas en el tiempo, serfa de esperar que hubiera relativamente pocas rachas. En nuestro ejemplo, nos preguntamos que probabilidad hay de observar siete rachas 0 menos si la serie es realmente aleatoria. Para eso es necesario saber cual es la distribucion del numero de rachas cuando la hipotesis nula de la aleatoriedad es verdadera. La Tabla 14 del apendice muestra los valores tabulados de la distribucion acumulada. En esa tabla vemos que, cuando 11 = 16 observaciones, la probabilidad segun la hipotesis nula de encontrar 7 rachas 0 menos es 0,214. Por 10 tanto, la hipotesis nula de la aleatoriedad solo puede rechazarse frente a la alternativa de una relacion positiva entre las observaciones contiguas al nivel de significacion del 21,4 por ciento. Este no es suficientemente pequeno para que sea razonable rechazar la hipotesis nula ni suficientemente grande para apoyar firmemente la hipotesis nula. No hemos encontrado simplemente pruebas contundentes para rechazarla. Los contrastes de aleatoriedad basados en muestras pequenas como esta tienen poca potencia. Capitulo 19. Analisis de series temporales y predicci6n 775 EI contraste de rachas Supongamos que tenemos una serie temporal de n observaciones. Representemos las observaciones situadas por encima de la media con el signo « + » y las observaciones situadas por debajo de la media con el signo « - ». Utilicemos estos signos para definir la secuencia de observaciones de la serie. Sea Rei numero de rachas que hay en la secuencia. La hipotesis nula es que la serie es un conjunto de variables aleatorias. La Tabla 14 del apendice indica el nivel de significacion mas bajo al que puede rechazarse esta hipotesis nula frente a la alternativa de una relacion positiva entre las observaciones contiguas, como una funcion de R y n. Si la alternativa es una hipotesis bilateral sobre la ausencia de aleatoriedad, el nivel de significacion debe duplicarse si es de menos de 0,5. Si el nivel de significacion a de la tabla es superior a 0,5, el nivel de significacion adecuado para el contraste frente a la alternativa bilateral es 2(1 - a). En el caso de las series temporales en las que n > 20> la distribuci6n normal es una buena aproximaci6n de la distribuci6n del numero de rachas segun la hipotesis nula. Puede demostrarse que segun la hip6tesis nula n R---l Z= 2 ---;::::;;:::::== n 2 - 2n 4(n - 1) sigue una distribucion normal estandar. Este resultado es un contraste de aleatoriedad. EI contraste de rachas: grandes muestras Dado que tenemos una serie temporal de n observaciones y n > 20, el numero de rachas, R, es el numero de secuencias que se encuentran por encima 0 por debajo de la mediana. Queremos contrastar la hipotesis nula Ho: la serie es aleatoria Los siguientes contrastes tienen un nivel de significacion a. 1. Si la hipotesis alternativa es una relacion positiva entre las observaciones contiguas, la regia de decision es n R - --l 2 Rechazar Ho si (19.1 ) 4(n - 1) 2. Si la hipotesis alternativa es una hipotesis bilateral de ausencia de aleatoriedad, la regia de decision es n n R- - - l Rechazar Ho si 2 2 n - 2n 4(n - 1) R - --l < 2 - Z(1./2 0 n2 - 2n 4(n - 1) > Z(1./2 (19.2) 776 Estadfstica para administraci6n y economfa EJEMPLO 19.1. Amilisis de los datos sobre las ventas (contraste de rachas) Le han pedido que averigiie si los 30 arios de ventas anuales siguen una pauta aleatoria de una observaci6n a la siguiente en una serie temporal. Solucion Pinkham Sales Data Los datos para realizar este estudio se encuentran en un fichero de datos Hamado Pinkham Sales Data y en el disco de datos. La Figura 19.9 es un gnifico de series temporales de los datos en el que se ha trazado la mediana. El examen de este grafico sugiere que las observaciones no son independientes, ya que parece que siguen una pauta. Los estadfsticos del contraste de rachas pueden calcularse utilizando el pragrama Minitab u atro paquete estadfstico. Realizando un amllisis por computador u observando la Figura 19.9, vemos que la serie tiene ocho rachas y que la hip6tesis nul a de una serie temporal aleatoria se rechaza con un p-valor = 0,0030. •• • 2500 • • (f) 2000 Q) ell • ..• .- 1.768,5 .-•• ~ •••••••••••••••••• 11 •••••••••••• • 1500 • • •• • • •• • •• • • 1000 ' r - - - _ , r - - - - - , - - - - - - - - . - - ' 1930 1940 1950 1960 Year Figura 19.9. Datos sobre las ventas de Lydia Pinkham a 10 largo del tiempo. Tambien podrfamos utilizar el numero de rachas y el estadfstico del contraste para calcular el valor de Z del contraste: n R -- -l Z= 2 n 2 - 2n 4(n - 1) 8 - 15 - 1 -2,97 )900 - 60 116 y en la Tabla 1 del apendice vemos que el p-valor resultante de un contraste de dos colas es 0,0030, Vemos, pues, que las pruebas a favor de la hip6tesis de que la serie no es aleatoria son abrumadoras. Capftulo 19. Analisis de series temporales y prediccion 777 EJERCICIOS Ejercicios aplicados Ejercicios basicos 19.9. Una serie temporal contiene 18 observaciones. i Cua! es la probabilidad de que el numero de rachas sea a) inferior a 5? b) superior all? c) inferior a a 8? 19.10. Una serie temporal contiene 50 observaciones. i Cual es la probabilidad de que el mimero de rachas sea a) inferior a 14? b) inferior a 17? c) superior a 38? 19.11. Una serie temporal contiene 100 observaciones. i Cua! es la probabilidad de que el numero de rachas sea a) inferior a 25? b) inferior a 41? c) superior a 90? 19.12. " •. 1} El fichero de datos Exchange Rate muestra un fndice del valor del dolar estadounidense frente a las monedas de sus socios comerciales durante 12 meses consecutivos. Utilice el contraste de rachas para hacer un contraste de aleatoriedad de esta serie. 19.13. I., El fichero de datos Inventory Sales muestra el cociente entre las existencias y las ventas de la industria y el comercio de Estados Unidos en un periodo de 12 afios. Realice un contraste de aleatoriedad de esta serie utilizando el contraste de rachas. 19.14. fi, El fichero de datos Stock Market Index muestra los rendimientos anuales de un fndice bursatil durante 14 afios. Realice un contraste de aleatoriedad utilizando el contraste de rachas. 19.15. (r .. El fichero de datos Gold Price muestra el precio del oro (en dolares) vigente a finales de afio de 14 afios consecutivos. Utilice el contraste de rachas para realizar un contraste de aleatoriedad de esta serie. 19.3. Componentes de una serie temporal ========~====================== En los apartados 19.3 a 19.5 presentamos algunos metodos descriptivos para analizar datos de series temporales. La serie de interes se representa por medio de Xl' Xb ... , X/l Y en el periodo t el valor de la serie es Xt. Un modelo convencional de la conduct a de las series temporales identifica varios componentes de la serie. Tradicionalmente, en la mayoria de las series temporales se representan cuatro componentes al menos en parte: 1. 2. 3. 4. Macro2000 El El El El componente componente componente componente tendencial estacional cfc1ico irregular Muchas series temporales muestran una tendencia a aumentar 0 a disminuir a un ritmo bastante continuo durante largos periodos de tiempo, 10 que indica la existencia de un componentc tendencial. Por ejemplo, los indicadores de la riqueza nacional, como el producto interior bruto, normalmente crecen con el paso del tiempo. Las tendeneias a menudo se mantienen y, en ese easo, este eomponente es importante para haeer predicciones. La Figura 19.10 muestra la serie temporal del producto interior bruto trimestral de mas de 50 alios procedente del fichero de datos Macro2000 que se eneuentra en el disco de datos. Esta pauta muestra c1aramente una fuerte tendencia ascendente que es mayor en unos periodos que en otros. Este grafieo temporal revela un notable componente tenden- 778 Estadfstica para administraci6n y economfa Figura 19.10. Evoluci6n del producto interior bruto a 10 largo del tiempo que indica la existencia de una tendencia. 8.000 0 ...2 .... ..Q 7.000 6.000 0 .;:: (l) ...- c 0 ...u ~ 5.000 4.000 3.000 "0 0 0:: 2.000 1.000 1950 1970 1960 1980 1990 2000 Tiempo (ano y trimestre) cial que es importante para el amllisis inicial y que normalmente va seguido de amllisis mas sofisticados, como mostramos en futuros apartados. Otro importante componente es la pauta estacional. La Figura 19.11 muestra los beneficios trimestrales por acci6n de una empresa. Los beneficios del cuarto trimestre son considerablemente mas altos y los del segundo trimestre son algo mas altos que los de los demas periodos. Observese que esta pauta continua repitiendose en el ciclo de cuatro trimestres que representa cada ano. Ademas del componente estacional, tam bien hay una notable tendencia ascendente en los beneficios por acci6n. Nuestro tratamiento de la estacionalidad depende de nuestros objetivos. Por ejemplo, si es importante predecir cada trimestre de la forma mas precisa posible, incluimos un componente de estacionalidad en nuestro modelo. En el apartado 14.2, por ejemplo, mostramos que pueden utilizarse variables ficticias para estimar un componente de estacionalidad en una serie temporal. Por 10 tanto, si prevemos que la pauta de estacionalidad continuara, debemos incluir la estimaci6n del componente de estacionalidad en nuestro modelo de predicci6n. Figura 19.11. Beneficios trimestrales por acci6n de una empresa que indican la existencia de un componente estacional. 3 - • ~p - u (l) • c (l) III 1 - • • • t;:: • • •• • • •• • • • • ••• ••• •• • • • • •• • o2 3 4 5 6 7 8 9 Ario y trimestre Para algunos otros fines, la estacionalidad puede ser una molestia. En muchas aplicaciones, el analista requiere una valoraci6n de las variaciones globales de una serie temporal, que no este contaminada por la influencia de factores estacionales. Supongamos, por ejemplo, que acabamos de recibir las cifras mas recientes de los beneficios del cuarto trimestre de la empresa de la Figura 19.11. Ya sabemos que estas seran probablemente mucho mas altas que las del trimestre anterior. Lo que nos gustarfa hacer es averiguar que Capitulo 19. Analisis de series temporales y predicci6n 779 parte de este aumento de los beneficios se debe a factores puramente estacionales y que parte representa un verdadero crecimiento subyacente. En otras palabras, nos gustarfa producir una serie temporal libre de la influencia estacional. Se dice que una serie de ese tipo esta desestacionalizada. En el apartado 19.5 nos extenderemos algo mas sobre el ajuste estacional. Las pautas estacionales en una serie temporal constituyen una forma de conducta oscilatoria regular. Ademas, muchas series temporales empresariales y economicas muestran pautas oscilatorias 0 cfclicas que no estan relacionadas con la conducta estacional. Por ejemplo, muchas series economicas siguen pautas cfcIicas ascendentes y descendentes. En la Figura 19.9 vemos una pauta cfcIica en los datos sobre las ventas de Lydia Pinkham. Observamos una disminucion de las ventas hasta un minimo en 1936, seguida de un aumento hasta un maximo a mediados de los afios 40 y, a partir de entonces, una disminucion contin ua. Esta pauta es una serie temporal cfcIica frec uente y podemos describir la conducta historica por medio de los movimientos cfcIicos. Sin embargo, no estamos sugiriendo que en esas pautas hist6ricas exista suficiente regularidad para poder hacer una prediccion fiable de los futuros maximos y mfnimos. De hecho, los datos de los que se dispone inducen a pensar que no es as!. Hemos analizado tres fuentes de variabilidad en una serie temporal. Si pudieramos caracterizar las series temporales pri ncipalmente por medio del componente tendencial, el estacional y el cfcIico, las series variarfan de una manera uniforme con el paso del tiempo y podrfamos hacer predicciones utilizando estos componentes. Sin embargo, los datos efectivos no se comportan de esa forma. La serie muestra, ademas de los principales componentes, componentes irregulares, inducidos por multitud de factores que influyen en la conducta de cualquier serie real y que muestran pautas que parecen impredecibles basandose en la experiencia anterior. Puede considerarse que estas pautas son simi lares al termino de error aleatorio de un modelo de regresion. En todos los ejemplos de componentes que hemos representado hasta ahora, podemos ver cIaramente el componente irregular aftadido a los componentes estructurales. Analisis de los componentes de las series temporales Una serie temporal puede describirse mediante modelos basados en los siguientes componentes: Tt Componente tendencial St Componente estacional Ct Componente ciclico Componente irregular 't Utilizando estos componentes, podemos decir que una serie temporal es la suma de sus componentes: Xl = T, + St + Ct + It En otras circunstancias , tambien podriamos decir que una serie temporal es el producto de sus componentes, representado a menudo como un modelo de suma logarftmica: No tenemos que limitarnos a estas dos formas estructurales. Por ejemplo, en algunos cas os podrfamos tener una combinaci6n de formas aditivas y multiplicativas. 780 Estadfstica para administraci6n y economfa Una gran parte de los primeros amllisis de series temporales trataban de aislar los componentes de una serie, 10 que permitfa expresar en cualquier momenta del tiempo el valor de la serie en funci6n de los componentes. Este enfoque, en el que a menudo se utilizaban medias m6viles, que analizamos en los dos apartados siguientes, se ha sustituido en gran parte por enfoques mas modernos. Una excepci6n es el problema de la desestacionalizaci6n, que requiere la extracci6n del componente estacional de la serie y que analizamos en el apartado 19.5. El enfoque mas moderno del analisis de series temporales implica la construcci6n de un modelo formal, en el que estan presentes, explicita 0 implicitamente, varios componentes, para describir la conducta de una serie de datos. Cuando se construyen modelos, hay dos formas posibles de tratar los componentes de una serie. Una es considerarlos fijos a 10 largo del tiempo, de tal manera que una tendencia podrfa representarse por medio de una lfnea recta. Este enfoque a menudo es uti! para ana!izar datos ffsicos, pero dista de ser adecuado en las aplicaciones empresariales y econ6micas, en las que la experiencia sugiere que cualquier regularidad aparentemente fija es con demasiada frecuencia ilusoria cuando se examina detenidamente. Para ilustrarlo, supongamos que examinamos solamente los datos de Lydia Pinkham correspondientes a los afios 1936-1943 . Vemos en la Figura 19.9 que en este periodo parece que hay una tendencia ascendente fija y continua. Sin embargo, si esta «tendencia» se hubiera proyectado hacia delante unos cuantos afios a partir de 1943, las predicciones resultantes de las futuras ventas habrfan sido muy inexactas. S610 mirando el grafico de los afios siguientes vemos 10 inadecuado que habrfa sido un modelo de tendencia fija. Cuando se trata de datos empresariales y econ6micos, es preferible tratar de otra forma los componentes regulares de una serie temporal. En lugar de considerar que son fijos permanentemente, suele ser mas sensato pensar que evolucionan continuamente con el tiempo. Por 10 tanto, no necesitamos estipular pautas tendenciales 0 estacionales fijas sino que podemos tener en cuenta la posibilidad de que estos componentes cambien con el tiempo. Examinaremos este tipo de modelos despues de haber analizado las medias m6viles. EJERCICIOS Ejercicios aplicados 19.16. ' , EI fichero de datos Housing Starts muestra las viviendas iniciadas por mil habitantes en Estados Unidos en un periodo de 24 aftos. a) Utilice la variante del contraste de rachas con gran des muestras para realizar un contraste de aleatoriedad de esta serie. b) Trace un gnifico temporal de esta serie y comente los componentes de la serie que revela este gnifico. 19.17. I~ EI fie hero de datos Earnings per Share muestra los beneficios por acci6n obtenidos por una empresa en un periodo de 28 aftos. a) Uti lice la variante del contraste de rachas con grandes muestras para realizar un contraste de aleatoriedad de esta serie. b) Trace un griifico temporal de esta serie y comente los componentes de la serie que revela este grafico. 19.4. Medias moviles El componente irregular de algunas series temporales puede ser tan grande que oculte las regularidades subyacentes y dificulte la interpretaci6n visual del grafico temporal. En estas circunstancias, el grafico real parecera bastante irregular y es posible que queramos suavi- Capitulo 19. Analisis de series temporales y predicci6n 781 zarlo para tener una imagen mas clara. Podemos reducir este problema utilizando una media movil. Podemos suavizar el grafico utilizando el metoda de las medias moviles, que se basa en la idea de que cualquier gran componente irregular en cualquier momento del tiempo ejercera un efecto menor si promediamos el punto con sus vecinos inmediatos. El metoda mas sencillo que podemos utilizar es una media movil centrada simple de (2m + 1) puntos. Es decir, sustituimos cada observacion X t por la media de sf misma y sus vecinas, de manera que m 1 x/ = 2m + 1 j =L- m Xl +j 2m + 1 Por ejemplo, si fijamos m en 2, la media movil de 5 puntos es Dado que la primera observacion es X I' la primera media movil serra Esta es la media de las cinco primeras observaciones. En el caso de los datos sobre las ventas de Lydia Pinkham del ejemplo 19.1, tenemos que en 1933 xj' = l.806 + 1.644 + l.814 + l.770 + l.518 5 = l.710,4 Asimismo, x~' es la media de la segunda a la sexta observacion, y asf sucesivamente. La Tabla 19.4 muestra la serie original y la serie suavizada. Observese que en el caso de las medias m6viles centradas perdemos la primera y la ultima m observaciones. Por 10 tanto, aunque la serie original va de 1931 a 1960, la serie suavizada va de 1933 a 1958. Medias m6viles centradas simples de (2m + 1) puntos Sean X 1 ' X2 , X3 , ... , Xn observaciones de una serie temporal de interes. Puede obtenerse una serie suavizada utilizando una media m6vil centrada simple de (2m + 1) puntos. 1 x/ = In L X 2m + 1 j=-m (t = m t+j + 1, m + 2, ... , n - m) (19.3) Las medias m6viles pueden hallarse utilizando el program a Minitab, como muestra la Figura 19.12. Vemos tanto la serie original como la serie suavizada -la serie de medias moviles de 5 puntos- representadas en relacion con el tiempo. Como puede observarse, la serie de medias moviles es de hecho mas suave que la serie original. Por 10 tanto, la serie de medias m6viles ha eliminado el componente irregular subyacente de la serie para mostrar mejor los componentes estructurales. 782 Estadfstica para administraci6n y economfa Tabla 19.4. Figura 19.12. Ventas anuales de Lydia Pinkham can la media m6vil centrada simple de 5 puntas. ADO Ventas 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1.806* 1.644* 1.814 1.770 1.518 1.103 1.266 1.473 1.423 1.767 2.161 2.336 2.602 2.518 2.637 Medial ADo Ventas Medial 1.710,4 1.569,8 1.494,2 1.426 1.356,6 1.406,4 1.618 1.832 2.057,8 2.276,8 2.450,8 2.454 2.370,8 1946 1.947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 2.177 1.920 1.910 1.984 1.787 1.689 1.866 1.896 1.684 1.633 1.657 1.569 1.390 1.387* 1.289* 2.232,4 2.125,6 1.955,6 1.858 1.847,2 1.844,4 1.784,4 1.753,6 1.747,2 1.687,8 1.586,6 1.527,2 1.458,4 Moving Average Media m6vi l centrada simple de 5 puntas de los datos sabre las ventas de Lydia Pinkham. 2700 • Actual .::.. Smoothed - Actual - Smoothed ",2200 ~ co (f) 1700 Moving Average length : MAPE: 1200 10 20 17 MAD: 316 MSD: 149873 30 Time El tipo de media m6vil que analizamos en este apartado no es mas que uno de los muchos que podrfan utilizarse. A menudo se considera deseable utilizar una media ponderada, en la que se da la mayor parte del peso a la observacion central y el peso de otros val ores disminuye conforme estan mas lejos de la observacion central. Por ejemplo, podrfamos utilizar una media ponderada como x - + 2X - l + 4x + 2x + + x + 2 2 t 1 x* = -t - -t - - - t- - - --t t 10 En to do caso, el objetivo al utilizar medias moviles es la eliminacion del componente irregular con el fin de tener una imagen mas clara de las irregularidades subyacentes en una serie temporal. La tecnica quiza sea mas valiosa con fines descriptivos, en la elaboracion de graficos como el de la Figura 19.12. Capitulo 19. Analisis de series temporales y prediccion 783 Extraccion del componente estacional por medio de medias moviles A continuaci6n, presentamos un metoda para utilizar medias m6viles con el fin de extraer los componentes estacionales de las series empresariales y econ6micas. Los componentes estacionales pueden ser molestos y el analista puede querer eliminarlos de la serie para apreciar mejor la conducta de otros componentes. Recuerdese tam bien que en el apartado 14.2 mostramos que pueden utilizarse variables ficticias para estimar y controlar los efectos estacionales. Consideremos una serie temporal trimestral que tiene un componente estaciona1. Nuestra estrategia para eliminar la estacionalidad es caIcular medias m6viles de cuatro puntos para reunir los valores estacionales en una unica media m6vil estacional. Por ejemplo, utilizando los datos de la Tabla 19.5 sobre los beneficios por acci6n, el primer miembro de la serie serfa 0,300 + 0,460 + 0,345 4 + 0,910 = 0,50375 y el segundo miembro serfa 0,460 + 0,345 + 0,910 + 0,330 4 = 0,51125 La Tabla 19.5 muestra la serie completa. Esta nueva serie de medias m6viles deberfa estar libre de estacionalidad, pero aun hay un problema. La localizaci6n en el tiempo de los miembros de la serie de medias m6viles no corresponde exactamente a la de los miembros de la serie original. EI primer termino es la media de las cuatro primeras observaciones y, por 10 tanto, podrfamos considerar que esta centrado entre la segunda observaci6n y la tercera: , X'" 2,5 + X2 + X3 + X4 = Xl --C.-_---=-_---=-_---' 4 Asimismo, el segundo termino podrfa expresarse de la forma siguiente: X* 3.5 + X3 + -X4 ---'+ X5 = X2 ---"------'--4 Este problema puede superarse centrando nuestra serie de medias m6viles de 4 puntos, 10 cual puede hacerse caIculando las medias de pares contiguos, que en el caso del primer valor es xl = X* 2,5 + x*3,5 2 0,50375 + 0,51125 2 = 0,5075 Este valor es la media m6vil centrad a correspondiente a la tercera observaci6n de la serie original. EI resto de la serie de medias m6viles centrad as esta en la primera columna de la Tabla 19.5. Observese de nuevo que con este metodo se pierden dos observaciones de cada extremo de la serie. La Figura 19.13 representa la serie de medias m6viles centradas, junto con laserie original. Es evidente que se ha eliminado el componente estacional. Ademas, como hemos 784 Estadfstica para administraci6n y economfa Tabla 19.5. Trimestre del ano Beneficios 1,1 1,2 1,3 1,4 2,1 2,2 2,3 2,4 3,1 3,2 3,3 3,4 4,1 4,2 4,3 4,4 5,1 5,2 5,3 5,4 6,1 6,2 6,3 6,4 7,1 7,2 7,3 7,4 8,1 8,2 8,3 8,4 0,3 0,46 0,345 0,91 0,33 0,545 0,44 1,04 0,495 0,68 0,545 1,285 0,55 0,87 0,66 1,58 0,59 0,99 0,83 1,73 0,6 1 1,05 0,92 2,04 0,7 1,23 1,06 2,32 0,82 1,41 1,25 2,73 Figura 19.13. Media m6vil centrada de 4 pu ntas y serie ori ginal de los benefi cios par acci6n de una empresa. Beneficios efectivos por acci6n de una empresa y media m6vil centrada de 4 puntos. Medias moviles de 4 puntos Medias moviles centradas de 4 puntos * * * * 0,50375 0,51125 0,53250 0,55625 0,58875 0,63000 0,66375 0,69000 0,75125 0,76500 0,81250 0,84125 0,91500 0,92500 0,95500 0,99750 1,03500 1,04000 1,05500 1,07750 1,15500 1,17750 1,22250 1,25750 1,32750 1,35750 1,40250 1,45000 1,55250 0,5075 0,5219 0,5444 0,5725 0,6094 0,6469 0,6769 0,7206 0,7581 0,7888 0,8269 0,8781 0,9200 0,9400 0,9763 1,0163 1,0375 1,0475 1,0663 1,1163 1,1663 1,2000 1,2400 1,2925 1,3425 1,3800 1,4263 1,5013 * * * Moving Average • Actual Smoothed .c. 2.5 - - Actual - Smoothed en OJ c E 1.5 ell w rv'bving Average Length : MAPE : 0.5 1930 19 40 1950 Time 196 0 28.27 19 MAD: 0.3353 MSD: 0.2361 Analisis de series temporales y prediccion Capitulo 19. 785 utilizado medias m6viles, tambien se ha suavizado el componente ilTegular. La imagen resultante nos permite, pues, juzgar las regularidades no estacionales de los datos. Vemos que en la serie suavizada domina un a tendencia ascendente. Un examen mas detenido muestra un crecimiento continuo de los beneficios en la primera parte de la serie, una parte central de crecimiento bastante mas lento y una reanudaci6n en la ultima parte del periodo de una pauta similar a la primera. Metoda de desestacionalizacion mediante medias moviles simples Sea X t (t = 1, 2, ..., n) una serie temporal estacional del periodo 5 (5 = 4 en el caso de los datos trimestrales y 5 = 12 meses en el caso de los datos mensuales). Se obtiene una serie de siguiendo estos dos pasos, en los que se supone medias m6viles centradas de 5 puntos, que s es par: x;, 1. Calcular las medias m6viles de 5 puntos: s/ 2 * _j I X t +O,5 - 2. Xt + j = - (s/ 2) + I S (t = ~, ~ + 1, ... , n - ~) (19.4) 2, ... , n - 2 s) (19.5) Calcular las medias m6viles centradas de s puntos: x* = X* {- 0,5 1 + x*1+ 0,5 2 ( 2s+ 2s+ t= 1, Hemos visto que la serie de medias m6viles centradas de s puntos pueden ser utiles para comprender la estructura de una serie temporal. Como esta libre en gran medida de la estacionalidad y se ha suavizado el componente inegular, es adecuada para identificar un componente tendencial 0 cfclico. Esta serie de medias m6viles tambien constituye la base de muchos metodos practicos de desestacionalizaci6n. EI me to do especffico depende de una serie de factores, entre los que se encuentran el grado de estabilidad que se supone que tiene la pauta estacional y si la estacionalidad se considera aditiva 0 multiplicativa. En el segundo caso, a menudo tomamos logaritmos de los datos. A continuaci6n, analizamos un metodo de desestacionalizaci6n que se basa en el supuesto implfcito de que la pauta estacional es estable a 10 largo del tiempo. EI metoda se conoce con el nombre de metoda del indice estacional. Suponemos que en cualquier mes 0 trimestre, en cada afio, el efecto de la estacionalidad es un aumento 0 una reducci6n de la serie en el rnismo porcentaje. Ilustraremos el metoda del indice estacional utilizando los datos sobre los beneficios de la empresa. La serie desestacionalizada se calcula en la Tabla 19.6. Las dos primeras columnas contienen la serie original y la media m6vil centrada de 4 puntos. Para evaluar la influencia de la estacionalidad, expresamos la serie original en porcentaje de la serie de medias m6viles centradas de 4 puntos. Asi, por ejemplo, en el caso del tercer trimestre del afio 1, tenemos que X ) = 100 100 ( .-2 xt (0345) = ' 0,5075 67,98 Estos porcentajes tambien se encuentran en la Tabla 19.7, en la que se muestra el caleulo del indice estacional. Para evaluar el efecto de la estacionalidad en el primer trimestre, observamos la median a de los siete porcentajes de ese trimestre. Este es el cuarto valor cuan- 786 Estadfstica para administraci6n y economfa Tabla 19.6. Trimestre del aDO Ajuste estacional de los beneficios por acci6n de una empresa mediante el metodo del fndice estacional. Xt 0,300* 0,460* 0,345 0,910 0,330 0,545 0,440 1,040 0,495 0,680 0,545 1,285 0,550 0,870 0,660 1,580 0,590 0,990 0,830 1,730 0,610 1,050 0,920 2,040 0,700 1,230 1,060 2,320 0,820 1,410 1,250* 2,730* 1,1 1,2 1,3 1,4 2,1 2,2 2,3 2,4 3,1 3,2 3,3 3,4 4,1 4,2 4,3 4,4 5,1 5,2 5,3 5,4 6,1 6,2 6,3 6,4 7,1 7,2 7,3 7,4 8,1 8,2 8,3 8,4 Tabla 19.7. x*t 100e~·) x"" Iodice estaciooal Serie ajustada 67,98 174,37 60,62 95,20 72,20 160,77 73,13 94,37 71,89 162,91 66,51 99,08 71 ,74 168,09 60,43 97,41 80,00 165,16 57,21 94,06 78,88 170,00 56,45 95,16 78,96 168,12 57,49 93,92 61,06 96,15 72,95 169,84 61,06 96,15 72,95 169,84 61,06 96,1 5 72,95 169,84 61,06 96,15 72,95 169,84 61,06 96,15 72,95 169,84 61,06 96,15 72,95 169,84 61,06 96,15 72,95 169,84 61,06 96,15 72,95 169,84 0,491.3 0,4784 0,4729 0,5358 0,5405 0,5668 0,6032 0,6123 0,8107 0,7072 0,7471 0,7566 0,9008 0,9048 0,9047 0,9303 0,9663 1,0296 1,1378 1,0186 0,9990 1,0920 1,26 11 1,20ll 1,1464 1,2793 1,4531 1,3660 1,3429 1,4665 1,7135 1,6074 t 0,5075 0,5219 0,5444 0,5725 0,6094 0,6469 0,6769 0,7206 0,7581 0,7888 0,8269 0,8781 0,9200 0,9400 0,9763 1,0163 1,0375 1,0475 1,0663 1,1163 1,1663 1,2000 1,2400 1,2925 1,3425 1,3800 1,4263 [,5013 Calculo del fndice estacional de los datos sobre los beneficios por acci6n de la empresa. Trimestre ADO 1 2 1 2 3 4 5 6 7 8 Mediana lndice estacional 60,62 73,13 66,51 60,43 57,21 56,45 57,49 60,43 61,06 95 ,20 94,37 99,08 97,41 94,06 95 , 16 93,92 95,16 96,15 3 4 67,98 72,20 71 ,89 71,74 80,00 78,88 78,96 174,36 160,77 162,91 168,09 165,16 170,00 168,12 72,20 72,95 168,09 169,84 Sumas 395,88 400 Capitulo 19. Analisis de series temporales y prediccion 787 do se ordenan en sentido ascendente, es decir, 60,43. Tambien hallamos la mediana de XI en porcentaje de x? para cada uno de los demas trimestres. Para calcular los indices estacionales, tambien ajustamos los indices de manera que su media sea 100. Vemos en la Tabla 19.7 que las cuatro medianas solo suman 395,88. Podemos calcular los indices finales --que tienen una media de 100- multiplicando cada mediana por (400/ 395,88). En el caso del primer trimestre tenemos que , Indice estacional = 400 ) 60,43 ( 395,88 = 61,06 Esta cifra estima que la estacionalidad reduce los beneficios del primer trimestre a un 61,06 pOI' ciento de los que se habrian obtenido en ausencia de factores estacionales. Los indices estacionales de la ultima fila de la Tabla 19.7 se encuentran en la quinta columna de la 19.6. Observese que se utiliza el mismo in dice para cualquier trimestre de cada ano. Por ultimo, obtenemos nuestro valor desestacionalizado: Valor original ) . I Valor ajustado = 100 ( 'd' In Ice estaclOna Por ejemplo, en el caso del tercer trimestre del ano 1, el valor desestacionalizado es 0345) 100 ( 7~,95 = 0,4729 La serie desestacionalizada completa que se obtiene de esta forma se muestra en la ultima columna de la Tabla 19.6 y se representa en la Figura 19.14. Observese que parece que sigue quedando una cierta estacionalidad en la ultima parte del periodo, 10 cual induce a pensar que podrfa ser deseable un enfoque mas elaborado, que tuviera en cuenta los cambios de las pautas estacionales. Figura 19.14. Beneficios ajustados estacionalme nte por cada acci6n de una empresa. co '0 co N 1,5 - co c 0 u co ..... (J) Q) (J) 1,0 - Q) '0 Q) .;:: Q) (j) 0,5 - • ~ , 2 ~ • • • • • • •• • • • •• •• • •• • 3 4 5 6 7 8 9 Trimestre del ario El metodo del fndice estacional aquf presentado es una sencilla solucion al problema de los indices. Muchas series temporales importantes -como el producto interior bruto y sus componentes, el empleo y el desempleo, los precios y los salarios- tienen un fuerte componente estacional. Generalmente, los organismos oficiales publican datos sobre esas cantidades tanto desestacionalizados con sin desestacionalizar. Los metodos oficiales de ajuste, aunque son mas complejos que el que hemos descrito aqui, normal mente se basan en me- 788 Estadfstica para administraci6n y economfa dias m6viles. El metoda de desestacionalizaci6n que se utiliza mas a menu do en las publicaciones oficiales de Estados U nidos es el metodo del Censo X-II. Se diferencia del metodo del fndice estacional en que tiene en cuenta el posible cambio de la pauta estacional a 10 largo del tiempo. Puede demostrarse que en su versi6n aditiva X-ll estima de una manera bastante aproximada el componente estacional de una serie temporal mensual por medio de donde siendo XI el valor original de la serie en el periodo t y xt* la media m6vil centrada de 12 puntos. Naturalmente, si se utiliza ese metodo, es necesario dar un tratamiento especial a los valores que se encuentran al final de la serie, ya que la expresi6n del factor estacional implica valores de la serie temporal que aun no han ocurrido. Una forma posible de lograr10 es sustituir los valores futuros desconocidos de la media m6vil por predicciones basadas en los datos de los que se dispone. EJERCICIOS Ejercicios aplicados 19.18. ~ ~ El fichero de datos Quarterly Earnings 19.18 muestra las ventas trimestrales realizadas por una empresa en un periodo de 6 afios. a) Trace un gnifico temporal de esta serie y analice sus caracterfsticas. b) Uti lice el metoda del fndice estacional para desestacionalizar esta serie. Represente gnificamente la serie desestacionalizada y analice sus caracterfsticas. 19.19. I.., El fichero de datos Quarterly Sales muestra las ventas trimestrales realizadas por una empresa en un periodo de 6 afios. a) Trace un gnifico temporal de esta serie y analice sus caracterfsticas. b) Utilice el metoda del fndice estacional para desestacionalizar esta serie. Represente gnlficamente la serie desestacionalizada y analice sus caracterfsticas. 19.20. ,. .. Calcule una serie de medias m6viles centradas simples de 3 puntos de los datos sobre el precio del oro del ejercicio 19.15. Represente la serie suavizada y analice el gnifico resultante. 19.21. ' . Calcule una serie de medias m6viles centradas simples de 5 puntos de los datos sobre la construcci6n de viviendas del ejercicio 19.16. Trace un gnifico temporal de la serie suavizada y comente sus resultados . 19.22. I. Calcule una serie de medias m6viles centradas si mples de 7 puntos de los datos sobre los beneficios de la empresa del ejercicio 19.17. Basandose en un grifico temporal de la serie suavizada, (',que puede decirse de sus componentes regulares? 19.23. Sea xl" 1 = 111 I X+ 2m + 1 j~-III t j una media m6vil centrada simple de (2m puntos. Demuestre que x* /+ 1 = x* f x/ + I1I + I - + 1) X' - m --'--'--"-'--'--'---_--'--"C. 2m + 1 (',C6mo podrfa utilizarse este resultado en el calculo eficiente de la serie de medias m6viles centradas? 19.24. f ~ EI fichero de datos Quarterly Earnings 19.24 muestra los beneficios por acci6n obtenidos por una empresa en un periodo de 7 afios. a) Trace un grafico temporal de estos datos. (',Sugiere su grafico la presencia de un fuerte componente estacional en esta serie de beneficios? b) Utilizando el metodo del fndice estacional, obtenga una serie de beneficios desestacionalizada. Represente gr:ificamente esta serie y comente su conducta. Capitulo 19. 19.25. a) Demuestre que la serie de medias m6viles centradas de s puntos del apartado 19.4 puede expresarse de la forma siguiente: X, _ (s/ 2) + 2(x,_ (s/ 2) + I + ... + x, + (s/2) - x/= I - X, + (s/2 ) 2s b) Demuestre que .* .\ , + I = ." X'" , + (s/2 ) + I + X t + (s/2) - Xt + -X't --'--'--'--- - - ' - ' - ' - -25 (s/2) + I '-'--'----- xt - (s/2) - - =--' Analisis de series temporales y prediccion 789 Analice las ventajas de esta f6rmula, desde el punto de vista del calculo, para desestacionalizar series temporales mensuales. 19.26. , ~ El fichero de datos Monthly Sales muestra las ventas mensuales de un producto en un periodo de 3 afios. Utilice el metodo del In dice estacional para obtener una serie desestacionalizada . 19.5. Suavizaci6n exponencial A continuaci6n analizamos algunos metodos para utilizar los valores actuales y pasados de una serie temporal para predecir sus valores futuros. Este problema, facil de formular, puede ser muy diffcil de resolver satisfactoriamente. Generalmente, se utiliza una amplia variedad de metodos de predicci6n y la elecci6n final de uno de ellos depende en gran medida del problema, de los recursos y de los objetivos del analista y de la naturaleza de los datos de los que dispone. Nuestro objetivo es utilizar las observaciones existentes, XI ' X2' " ., Xl' sobre una serie para predecir los valores futuros desconocidos Xt+]o X,+2, ". La predicci6n tiene una importancia fundamental en el mundo de la empresa como base racional para tomar decisiones. Por ejemplo, la predicci6n de las ventas mensuales de un producto es la base de la politic a de control de las existencias. Las predicciones sobre los futuros beneficios se utilizan cuando se toman decisiones de inversi6n. En este apartado, introducimos un metoda de predicci6n que se conoce con el nombre de suavizacion exponencial simple que da buen resultado en algunas aplicaciones. Constituye, ademas, la base de algunos metodos de predicci6n mas complejos. La suavizaci6n exponencial es adecuada cuando la serie no es estacional y no tiene una tendencia ascendente 0 descendente sistematica. En ausencia de tendencia y de estacionalidad, el objetivo es estimar el nivel actual de la serie temporal y utilizar esta estimaci6n para predecir los futuros valores. Nuestra posici6n es que nos encontramos en el periodo t, estamos observando retrospectivamente la serie de observaciones XI' XI - I ' X t - 2, .'" Y queremos tener una idea del nivel actual de la serie. Para empezar, consideramos dos posibilidades extremas. En primer lugar, podrfamos utilizar simplemente la observaci6n mas reciente para predecir todas las futuras observaciones. En algunos casos, como en el de los precios de los mercados especulativos, es posible que sea 10 mejor que podemos hacer, pero el resultado no tiene mucho exito. Sin embargo, en muchas series que tienen componentes irregulares, probablemente querrfamos utilizar algunas observaciones anteriores de la serie. Eso identificarfa las pautas que pudieran existir en la serie temporal y evitarfa utilizar solamente una fluctuaci6n aleatoria como base de nuestra predicci6n. En el extremo opuesto, podrfamos utilizar la media de todos los val ores pasados como estimaci6n del nivel actual. Basta una breve reflexi6n para pensar que a menu do eso no sena util, ya que todos los valores pasados se tratarfan por igual. Asf, por ejemplo, si intentaramos predecir las futuras ventas mediante este procedimiento, darfamos la misma importancia a las ventas de hace muchos arros que a las ventas recientes. Parece razonable que la experiencia mas reciente influya mas en nuestra predicci6n. 790 Estadfstica para administraci6n y economfa La suavizaci6n exponencial simple es una soluci6n intermedia entre estos extremos; hace una predicci6n basada en una media ponderada de los val ores actuales y de los pasados. Cuando se calcula esta media, se da mas peso a la observaci6n mas reciente, bastante menos al valor inmediatamente anterior, menos al valor anterior, y asf sucesivamente. Estimamos el nivel del periodo actual t de la siguiente manera: _ Xt ~ (1 - IX)XI + 1X(1 - donde rx es un numero comprendido entre predicci6n de las futuras observaciones es IX)Xt - 1 + IX 2 (1 - IX)X, - 2 + ... °y 1. Por ejemplo, suponiendo que IX = 0,5, la por 10 que en el d.lculo de las predicciones se aplica a las observaciones actuales y pasadas una media ponderada con un os pesos cada vez menores. En este modelo, vemos que la predicci6n de la serie en cualquier periodo t se estima de la siguiente manera: ~ _ Xt - (1 - IX)XI + 1X(l - IX)XI _ I + IX2(1 - IX)Xt - 2 + ... y, asimismo, el nivel del periodo anterior (t - 1) se estimarfa de la forma siguiente: Multiplicando por rx, tenemos que ~ IXX, _ I = 1X(1 - IX)Xt - 1 + rx 2(1 - rx)X t - 2 + rx 3 (1 - IX)Xt - 3 + ... Por 10 tanto, restando estas dos ecuaciones, tenemos que Y mediante una sencilla manipulaci6n, tenemos la ecuaci6n para calcular la predicci6n basada en la suavizaci6n exponencial simple: Xc = aXt - 1 + (1 - ()()XI para °< ()( < 1 Esta expresi6n es un util algoritmo recursivo para calcular predicciones. EI valor predicho, del periodo t es una media ponderada de la predicci6n del periodo anterior t - I Y la ultima observaci6n XI' Las ponderaciones dadas a cada uno dependen de la elecci6n de ()(, que es la constante de suavizaci6n. Observese que un elevado valor de IX da mas peso a t - I' que se basa en la historia pas ada de la serie, y un peso menor a xI' que representa los datos mas recientes. Podemos ilustrar el metodo utilizando los datos sobre las ventas de Lydia Pinkham suponiendo que el valor de ()( = 0,4. El proceso comienza fijando el primer elemento de la serie XI = X I = 1.806 x XI' x El segundo valor de la predicci6n serfa X2 = O,4x[ + 0,6X2 = (0,4)(1.806) + (0,6)(1.644) = 1.708,8 Capitulo 19. Analisis de series temporales y predicci6n 791 Y este proceso conti nua con toda la serie de manera que X3 = 0,4X2 + 0, 6X3 = (0,4)(1 .708,8) + (0,6)(1. 814) = 1.771,9 Predicci6n por medio de una suavizaci6n exponencial simple Sea X j , X2 , . . . , Xn un conjunto de observaciones de una serie temporal no estacional sin ninguna tendencia ascendente 0 descendente sistematica. EI metodo de suavizaci6n exponencial simple para hacer predicciones es el siguiente: 1. Se obtiene la serie suavizada xt : (0 < 2. IY. < 1; t = 2, 3, ... , n) (19.6) donde CI. es una con stante de suavizaci6n cuyo valor se fija entre 0 y 1. A partir del periodo n, se obtienen predicciones de los futuros valores, xn + h ' de la serie de la siguiente manera: (h = 1, 2, 3, ... ) Hasta ahora apenas nos hemos referido a la elecci6n de la constante de suavizaci6n, IY., en las aplicaciones practicas. En las aplicaciones, esta elecci6n puede basarse en razones subjetivas u objetivas. Una posibilidad es basarse en la experiencia 0 en el criterio personal. Por ejemplo, un analista que quiera predecir la demanda de un producto puede haber trabajado muchas veces con datos sobre lfneas de producto similares y puede basarse en esa experiencia para seleccionar el valor de IY.. La inspecci6n visual de un grafico de los datos de los que se dispone tambien puede ser uti! para elegir el valor de la constante de suavizaci6n. Si la serie parece que contiene un componente irregular considerable, no queremos dar demasiado peso unicamente a la observacion mas reciente, ya que podria no indicar que esperamos en el futuro. Eso sugiere que debemos elegir un valor relativamente alto para la con stante de suavizacion. Pero si la serie es bastante suave, darfamos un valor mas bajo a IY. para dar mas peso a la observacion mas reciente. Un enfoque mas objetivo es probar con diferentes valores y ver cual ha conseguido predecir mejor los movimientos historicos de la serie temporal. Por ejemplo, podrfamos calcular la serie suavizada con los valores de IY. de 0,2, 0,4, 0,6 y 0,8 y elegir el valor que predice mejor la serie historica. Calcularfamos el error de cada prediccion: ~ el=x, -x1 _ l Una posibilidad es calcular, para cada valor de errores: 11 sc IY. utilizado, la suma de los cuadrados de los 11 = "L. e12 = " L. (X t 1= 2 - ~)2 X1 - l 1=2 El valor de IY. que minimiza la suma de los cuadrados de los errores es el que se utilizara para hacer futuras predicciones. La suavizaci6n exponencial simple puede realizarse utilizando el programa Minitab. La Figura 19.15 muestra un grafico de la serie original y de la serie suavizada utilizando un valor de IY. = 0,1, que se ha elegido probando diferentes valores y hallando el que producfa un ajuste satisfactorio. El indicador MSD de la Figura 19.15 es la suma de los cuadrados de los errores dividida por el numero de observaciones. 792 Estadfstica para administraci6n y economfa Single Exponential Smoothing Figura 19.15. Datos sobre las ventas de Lydia Pinkham: valores originales y val ores suavizados siguiendo el metodo exponencial simple. 2700 • Actual " Smoothed - 2200 Actual - Smoothed en OJ ctI (f) 1700 Smoothing Constant Alpha: MAPE: 1200 MAD: 0.900 9.5 164.0 MSD: 43274.2 1930 1950 1940 1960 Time Cualquiera que sea el valor de la con stante de suavizacion que se uti lice, la ecuacion 19.6 puede considerarse un mecanismo de actualizacion. En el periodo (t - 1), el nivel de la serie se estima por medio de x/ _I ' En el siguiente periodo, se utiliza la nueva observacion x t para actualizar esta estimacion, por 10 que la nueva estimacion del nivel es una media ponderada de la estimacion anterior y la nueva observacion. Modelo de prediccion por medio de la suavizacion exponencial con el metoda Holt-Winters Muchos metodos de prediccion que se utilizan en el mundo de la empresa se basan en extensiones de la suavizacion exponencial simple. La suavizacion exponencial por medio del metodo de Holt-Winters tiene en cuenta la tendencia y posiblemente tambien la estacionalidad de una serie temporal. Consideremos, en primer lugar, una serie temporal no estacional. Queremos estimar no solo el nivel actual de la serie sino tambien la tendencia, que es la diferencia entre el nivel actual y el nivel anterior. Representamos el valor observado por medio de X t Y la estimacion del nivel por medio de La estimacion de la tendencia se representa por medio de Tr El principio en el que se basa la estimacion de estas dos cantidades es igual que el del algoritmo de la suavizacion exponencial simple. Las dos ecuaciones de estimacion son x/. x/ = 0:(x/ _ 1 Tt = fJTt - I + Tt - I) + (l - o:)xt + (l - fJ)(xt - xt - I) < 0: < 1) (0 < fJ < 1) (0 donde IX Y fJ son constantes de suavizacion cuyos valores se fijan entre 0 y 1. EI metoda de Holt-Winters, comparable ala suavizacion exponencial simple, utiliza estas ecuaciones para actualizar las estimaciones anteriores utiIizando una nueva observacion. La estimacion del nivel, XI - I' realizada en el periodo (t - 1), tomada junto con la estimacion de la tendencia, Tt - I , sugiere un nivel (X, _ I + Tt - I ) en el periodo t. Esta estimacion se modifica, a la luz de la nueva observacion, Xl' para obtener una estimacion actualizada del nivel, Xl' utilizando la ecuacion dada. Asimismo, se estima la tendencia en el periodo (t - 1) como TI _ I' Sin embargo, una vez que se dispone de la nueva observacion, Xl' la estimacion de la tendencia es la diferen- Capitulo 19. 793 Analisis de series temporales y predicci6n cia entre las dos estimaciones mas recientes del niveI. La tendencia estimada en el periodo t es, pues, la medi a ponderada indicada. Comenzamos los caIculos estableciendo que A continuaci6n, aplicamos las ecuaciones anteriores, para t = 3, 4, ... , n. Mostramos estos caIculos en el ejemplo 19.2. A continuaci6n, resumimos todo el procedimiento. Predicci6n con el metodo de Holt-Winters: series no estacionales Sea X1 , X2 , ... , Xn un conjunto de observaciones sobre una serie temporal no estacional. EI todo de Holt-Winters para realizar predicciones consiste en 10 siguiente. 1. Se obtienen estimaciones del nivel Xt = X2 T2 x y de la tendencia T de la forma siguiente: t t = X2 - Xl 1 + Tt - I ) + (1 - a)xt Tt = PTt - 1 + (1 - P)(Xt - Xt - 1) Xt = 2. me- a(xt - (0 < a < 1; t = 3, 4, ... , n) (0 < P< 1; t = 3, 4, ... , n) (19.7) donde IX Y (J son constantes de suavizaci6n cuyos valores se fijan entre 0 y 1. A partir del periodo n, se obtienen predicciones de los futures valores, xn + h' de la serie p~r medio de (19.8) donde h es el numero de periodos futuros. EJEMPLO 19.2. Predicci6n del credito al consumo (suavizaci6n exponencial con el metodo Holt-Winters) Se Ie ha pedido que haga una predicci6n del credito al consumo pendiente utilizando el metodo de suavizaci6n exponencial de Holt-Winters. Solucion Los calculos siguientes se bas an en los datos sobre el credito al con sumo de la Tabla 19.8, que tam bien contiene los caIculos del metodo de Holt-Winters. Las estimaciones iniciales del nivel y de la tendencia del ano 2 son y T2 = X2 - Xl = 155 - 133 = 22 Esta aplicaci6n de la suavizaci6n utiliza los valores de a Xt = 0,3(xt - 1 + T, Tt = O,4Tt - 1 I) + 0,6(xt = 0,3 y P = 0,4 y las ecuaciones + 0,7x, - Xt-I) 794 Estadfstica para administracion y economfa Tabla 19.8. Calculos del cn3dito al consumo pendiente basad os en el metodo de Holt-Winters (IX = 0,3, fJ = 0,4) y realizados a partir de la salida Minitab. ~ t 1 2 3 4 5 6 7 8 9 10 11 Xt xt Tt 133 155 165 171 194 231 274 312 313 333 343 155 169 175 192 223 266 309 324 338 347 22 17 11 14 25 36 40 25 18 13 Para t = 3, X3 = 0,3(X2 + T2) + 0,7X3 = (0,3)(155 + 22) + (0,7)(165) = 168,6 y, ademas, T3 = 0,4T2 + 0,6(X3 - X2) = (0,4)(22) + (0,6)(168,6 - 155) = 16,96 Para t = 4, X4 = 0,3(X3 + T3) = + 0,7X4 (0,3)(168,6 + 16,96) + (0,7)(171) = 175,4 y, ademas, T4 = 0,4T3 + 0,6(X4 - X3) = (0,4)(16,96) + (0,6)(175,4 - 168,6) = 10,86 Los calculos restantes se hacen de la misma forma, fijando t = 5, 6, ... , 11 . La Tabla 19.8 muestra los resultados de estos calculos. Utilicemos ahora estas estimaciones del nivel y de la tendencia para predecir las futuras observaciones. Dada una serie XI' Xz, ... , XIl' las estimaciones mas recientes del nivel y de la tendencia son t y T", respectivamente. En la realizaci6n de predicciones se supone que esta tendencia mas reciente se prolongara a partir del nivel mas reciente. Por 10 tanto, hacemos una predicci6n utilizando la relaci6n x XII + I = xn + TI1 Capitulo 19. Analisis de series temporales y predicci6n 795 y para el periodo siguiente = xn + 2T" Xn + h = xn + hTn X,,+2 y, en general, para h periodos venideros En la Tabla 19.8 vemos que las estimaciones mas recientes del nivel y de la tendencia son XII = 347 Las predicciones para los tres periodos siguientes son X/2 347 X13 = 347 XI4 = 347 = + 13 = 360 + (2)(13) = + (3)(13) = 373 386 EI metoda de Holt-Winters puede calcularse utilizando el programa Minitab y la Figura 19.16 muestra el grafico de series temporales y las predicciones. EI metoda del Minitab es algo distinto del que acabamos de describir. En primer lugar, las entradas del nivel y de la tendencia son NiveJ = 1 - IX Tendencia = 1 - f3 Double Exponential Smoothing for Credit 450 - ." 350 - /~. .-t= "CI Q) .... U 250 - 150 - / Actual " Predicted • Forecast - Actual - - Predicted - - - Forecast Smoothing Constants Alpha (leve l): 0.700 Gamma (trend): 0.600 -/1 ",,-" /' • MAPE: MAD: ~ 'T-----"-----,-----r o 5 10 15 MSD: 7.108 16.487 354.837 Time Figura 19.16. Credito al consumo pendiente observado y predicho. Ademas, el Minitab calcula una estimacion para el primer periodo utilizando el siguiente metodo: 1. 2. EI Minitab ajusta un modelo de regresion lineal a datos de series temporales (variable y) en relacion con el tiempo (variable x). La constante de esta regresion es la estimacion inicial del componente del niveJ; el coeficiente de la pendiente es la estimacion inicial del componente tendencial. 796 Estadfstica para administracion yeconomfa Como consecuencia, los val ores ca1culados con el programa Minitab, que se muestran en la Tabla 19.9, son algo distintos de los que figuran en la 19.8. EI me to do del Minitab generalmente hace predicciones algo mejores que el metodo mas simplificado que hemos mostrado. Si el \ector utiliza otros paquetes estadfsticos, compruebe los algoritmos especfficos utilizados para asegurarse de que comprende 10 que ca1cula. Normalmente, puede hacerse pulsando la opcion Ayuda. Tabla 19.9. Periodo 2 3 4 5 6 7 8 9 10 11 Caleulos del eredito al eonsumo pendiente (a = 0,3, f3 = 0,4) y realizados eon el programa Minitab. Credito al consumo observado Valor esperado del nivel Tendencia 133 155 165 171 194 231 274 312 313 333 343 l30 156 170 177 192 224 266 309 324 338 347 28 27 19 12 14 24 35 40 25 18 13 Predicciones 360 373 385 12 13 14 Predicci6n de series temporales estacionales A continuacion, examinamos una extension del metoda de Holt-Winters que tiene en cuenta la estacionalidad. En la mayorfa de los problemas practicos, el factor estacional se considera multiplicativo, por 10 que, por ejemplo, cuando se analizan cifras de ventas mensuales, se puede considerar que las ventas de enero son una proporcion de las ventas mensuales medias. Se supone, al igual que antes, que el componente tendencial es aditivo. Al igual que en el caso no estacional, utilizamos los sfmbolos X t , t y Tt para representar el valor observado y las estimaciones del nivel y de la tendencia, respectivamente, del periodo t. El factor estacional es F" por 10 que si la serie temporal contiene s periodos al ano, el factor estacional del periodo correspondiente del ano anterior es F t - s . En el modelo de Holt-Winters, las estimaciones del nivel, de la tendencia y del factor estacional se actualizan por medio de las tres ecuaciones siguientes: x donde lI., f3 y 'Y son constantes de suavizacion cuyos valores estan comprendidos entre 0 y 1. Capftulo 19. Analisis de series temporales y predicci6n 797 El termino (X' _I + T, _ I) es una estimaci6n del nivel del periodo t calculada en el periodo anterior t - 1. Esta estimaci6n se actualiza cuando se dispone de x,. Pero tambien eliminamos la influencia de la estacionalidad deflactandola por la estimaci6n mas reciente, Ft - s , del factor estacional de ese periodo. La ecuaci6n de actualizaci6n de la tendencia, T" es la misma que antes. Por ultimo, el factor estacional, F" se estima utilizando la tercera ecuaci6n. La estimacion mas reciente del factor, que es la del ano anterior, es F t - s . Sin embargo, dividiendo la nueva observaci6n, XI' por la estimacion del nivel, X,, se obtiene un factor estacional x/x,. La nueva estimacion del factor estacional es una media ponderada de estas dos cantidades. Predicci6n con el metodo de Holt-Winters: series estacionales Sean X1 , X2 , •.. , Xn un conjunto de observaciones sobre una serie temporal estacional del periodo s (siendo s = 4 en el caso de los datos trimestrales y s = 12 en el de los datos mensuales). EI metodo de Holt-Winters para realizar predicciones utiliza un conjunto de estimaciones recursivas a partir de la serie historica. Estas estimaciones utilizan una con stante del nivel, IX; una constante de la tendencia, fJ, y una con stante estacional multiplicativa, y. Las estimaciones recursivas se basan en las siguientes ecuaciones: (0 < ex < 1) (0 Ft = yFI - s + (1 Xl - y) :::- x, (0 < fJ < 1) (19.9) < y < 1) donde Xl es el nivel suavizado de la serie, Tt es la tendencia suavizada de la serie y Ft es el ajuste estacional suavizado de la serie. Los detalles del calculo son tediosos y 10 mejor es hacerlo por computador. Hemos mostrado el algoritmo que utiliza el programa Minitab, pero numerosos paquetes estadfsticos de cali dad emplean metodos parecidos. Estos metodos pueden diferir en la forma en que abordan la generacion de constantes para los periodos iniciales de una serie temporal observada y, por 10 tanto, debe consultarse la documentaci6n del programa para averiguar cual es exactamente el programa utilizado. Minitab utiliza un metodo de regresion mediante variables ficticias para obtener estimaciones de los periodos iniciales. Una vez que el metodo inicial genera las constantes del nivel, la tendencia y la estacionalidad a partir de una serie historica, podemos utilizar los resultados para predecir los futuros valores de h periodos futuros a partir de la ultima observacion, xn ' de la serie historica. La ecuacion de prediccion es (19.10) Observamos que el factor estacional, F, es el generado para el periodo de tiempo estacional mas reciente. El metoda que hemos desarrollado aqul puede aplicarse utilizando el procedimiento del Minitab Hamado «Winters method». Concretamente, eI metoda aqui descrito utiliza Ia opci6n «multiplicative». El me to do Winters empJea un componente del nivel , un componente tendencial y un componente estacional de cada periodo. Utiliza tres ponderaciones 0 parametros de suavizaci6n para actualizar los componentes de cada periodo. Los valores iniciales del componente del nivel y del componente tendencial se obtienen a partir de una regresion lineal con respecto al tiempo. Los val ores iniciales del componente estacional se obtienen a partir de una regresi6n mediante variables ficticias utilizando datos desestacio- 798 Estadfstica para administraci6n y econom fa nalizados. Las ecuaciones de suavizaci6n del metoda de Winters para el modelo multiplicativo son las antes utilizadas. Este me to do se mostrara utilizando los beneficios por acci6n de una empresa en el programa Minitab. En la Figura 19.17 se muestra un gnifico de los valores observados y ajustados, junto con predicciones para los cuatro periodos siguientes. Se realizan predicciones utilizando las estimaciones mas recientes de la tendencia y del nivel y se ajustan para tener en cuenta el factor estacional. Dada una estaci6n que contiene s periodos de ti empo, la predicci6n para un periodo en el futuro serfa Figura 19.17. Historia y Winter's Multiplicative Model for Earnings predicci6n de los beneficios de una empresa utilizando el metoda de Holt-Winters. :~ 3 .' .' \' (J) en c 2 c .... .'", ..." L\~":':. ~, ctl .",.... UJ ", .,' o I • Actual o Pred icted • - Forecast Actual - - Pred icted - - .. Fo recast Smoothing Constants A lpha (level): 0,500 Gamma (trend): 0.500 Delta (season): 0.700 MAPE: 13.539 1 MAD: 0.0902 '-r----~----,__------,------' MSD: o 10 20 0.0141 30 Time Los datos de nuestro ejemplo contienen 32 periodos de tiempo y un factor estacional s = 4, 10 que indica que son datos trimestrales. Por 10 tanto, para predecir la siguiente observaci6n despues del final de la serie, utilizamos la expresi6n Esta predicci6n es para el primer trimestre; por 10 tanto, utilizamos el factor estacional del primer trimestre mas reciente y es F 29 . En general, si estamos prediciendo h periodos en el futuro, realizamos la predicci6n de la siguiente manera: La predicci6n utiliza una constante del nivel, ex = 0,5, una constante de la tendencia, f3 = 0,5 y una constante estacional, y = 0,3. Por ultimo, en la Tabla 19.10 mostramos los resultados detail ados del calculo de los factores de la tendencia, del nivel y el factor estacional de cada periodo. Las predicciones efecti vas realizadas por medio del metodo de Holt-Winters dependen de los valores especfficos elegidos para las constantes de suavizaci6n. Al igual que en nuestro analisis anterior de la suavizaci6n exponencial, esta elecci6n podrfa basarse en cri- Capitulo 19. Tabla 19.10. Analisis de series temporales y prediccion Resultados de la aplicaci6n del metodo de suavizaci6n de Holt-Winters en Minitab. Valor Estimaci6n Estimaci6n Trimestre Beneficios del aDO de la empresa suavizado del nivel de la tendencia 1,1 1,2 1,3 1,4 2,1 2,2 2,3 2,4 3,1 3,2 3,3 3,4 4,1 4,2 4,3 4,4 5,1 5,2 5,3 5,4 6,1 6,2 6,3 6,4 7,1 7,2 7,3 7,4 8,1 8,2 8,3 8,4 9,1 9,2 9,3 9,4 799 0,300 0,460 0,345 0,9 10 0,330 0,545 0,440 1,040 0,495 0,680 0,545 1,285 0,550 0,870 0,660 1,580 0,590 0,990 0,830 1,730 0,610 1,050 0,920 2,040 0,700 1,230 1,060 2,320 0,820 1,410 1,250 2,730 0,043 0,360 0,433 1,055 0,450 0,498 0,389 1,028 0,424 0,671 0,518 1,269 0,550 0,758 0,623 1,514 0,666 0,916 0,697 1,767 0,714 1,047 0,782 1,795 0,741 1,238 0,988 2,131 0,799 1,419 1,172 2,531 0,387 0,562 0,609 0,631 0,584 0,619 0,672 0,696 0,770 0,801 0,843 0,869 0,886 0,964 1,019 1,067 1,032 1,077 1,193 1,215 1,150 1,1 47 1,246 1,354 1,355 1,370 1,433 1,519 1,572 1,597 1,671 1,765 0,242 0,208 0,128 0,075 0,014 0,024 0,039 0,031 0,053 0,042 0,042 0,034 0,025 0,052 0,053 0,051 0,008 0,026 0,071 0,047 -0,009 - 0,006 0,046 0,077 0,039 0,027 0,045 0,066 0,059 0,042 0,058 0,076 Estimaci6n estacional Predicci6n 0,713 0,851 0,628 1,529 0,609 0,872 0,646 1,505 0,633 0,856 0,646 1,486 0,624 0,888 0,648 1,482 0,588 0,910 0,681 1,441 0,548 0,914 0,721 1,487 0,526 0,902 0,734 1,515 0,523 0,889 0,744 1,537 0,963 1,705 1,48 3,18 terios subjetivos u objetivos. La experiencia del analista en el analisis de conjuntos de datos similares podrfa ayudarlo a dar valores adecuados a las constantes de suavizaci6n. Tambien podrfa probar diferentes conjuntos de valores posibles con los datos hist6ricos de que dispone y hacer las predicciones utilizando el conjunto de valores que dieran las mejores predicciones de esos datos. Esta estrategia es facil de poner en practica utilizando un paquete estadfstico, como muestra el ejemplo que hemos presentado con el programa Minitab. 800 Estadfstica para administracion y economfa EJERCICIOS Ejercicios aplicados 19.27. I~ Basandose en los datos del ejercicio 19.13, utilice el me to do de la suavizaci6n exponencial simple para hacer predicciones del cociente entre las existencias y las ventas de los 4 pr6ximos afios. Utilice una constante de suavizaci6n de a = 0,4. Represente graficamente la serie temporal y las predicciones. 19.28. , f Utilice el metoda de la suavizaci6n exponencial simple con una constante de suavizaci6n de a = 0,3 para predecir el precio que tendra el oro en los 5 pr6ximos afios, basandose en los datos del ejercicio 19.15. 19.29. ff 19.30. t Ii EI las mismas predicciones de todos los futuros valores de las series temporales. Dado que sabemos que todos los futuros valores no seran iguales, eso es absurdo». 19.34. " EI fichero de datos Industrial Production Canada muestra un fndice de producci6n industrial de Canada correspondiente a un periodo de 15 afios. Uti lice el metodo de Holt-Winters con las constantes de suavizaci6n a = 0,3 Y f3 = 0,5 para hacer predicciones para los 5 pr6ximos afios. 19.35. Utilizando los datos del ejercicio 19.16, utilice el metodo de la suavizaci6n exponencial simple con una con stante de suavizaci6n a = 0,5 para predecir la construcci6n de viviendas de los 3 pr6ximos afios. fichero de datos Earnings per Share 19.30 muestra los beneficios por acci6n que obtendra una empresa en un periodo de 18 afios . a) Utilizando las constantes de suavizaci6n a = 0,2, 0,4, 0,6 y 0,8, realice predicciones basandose en la suavizaci6n exponencial simple. b) l.Cual de las predicciones elegirfa? I, El fichero de datos Hourly Earnings muestra los ingresos por hora de la industria manufacturera de Estados Unidos correspondientes a un periodo de 24 meses. Uti lice el metodo de Holt-Winters con las constantes de suavizaci6n a = 0,3 Y f3 = 0,4 para hacer predicciones para los 3 pr6ximos meses. 19.36. tt~ El fichero de datos Food Prices muestra un fndice de los precios de los alimentos desestacionalizado de Estados Unidos correspondiente a un periodo de 14 meses. Uti lice el metodo de Holt-Winters, con las constantes de suavizaci6n a = 0,5 Y f3 = 0,5, para hacer predicciones para los 3 pr6ximos meses. 19.31. a) Si las predicciones se basan en una suavizaci6n exponencial simple y t representa el valor suavizado de la serie en el periodo t, demuestre que el error cometido en la predicci6n de x t ' realizada en el periodo (t - 1), puede expresarse de la forma siguiente: 19.37. 'Ii b) Por 10 tanto, demuestre que podemos escribir t = X t - ae t , donde vemos que se utiliza la observaci6n mas reciente y el enor de predicci6n mas reciente para calcular la predicci6n siguiente. 19.38. f J Uti lice el metodo estacional de Holt-Win- x x 19.32. Suponga que en el metodo de la suavizaci6n exponencial simple la constante de suavizaci6n a se fija en un valor igual a l. l.Que predicciones se obtendran? 19.33. Comente la siguiente afirmaci6n: «Sabemos que todas las series temporales empresariales y econ6micas muestran variabilidad a 10 largo del tiempo. Sin embargo, si se utiliza el metoda de la suavizaci6n exponencial simple, se obtienen El fichero de datos Profit Margins muestra los margenes porcentuales de beneficios de una empresa conespondientes a un periodo de 11 afios. Realice predicciones para los 2 pr6ximos afios utilizando el metoda de Holt-Winters con las constantes de suavizaci6n a = 0,6 y f3 = 0,6. ters para realizar predicciones de las ventas para dentro de ocho trimestres, basandose en los datos del ejercicio 19.18. Emplee las constantes de suavizaci6n a = 0,6, f3 = 0,5 y y = 0,4. Represente graficamente los datos y las predicciones. 19.39. If Utilice el metodo estacional de Holt-Winters para hacer predicciones de las ventas para dentro de ocho trimestres, basandose en los datos del ejercicio 19.19. Emplee las constantes de suavizaci6n a = 0,5, f3 = 0,4 y y = 0,3. Represente graficamente los datos y las predicciones. Capitulo 19. Analisis de series temporales y prediccion 801 19.6. Modelos autorre resivos En este apartado presentamos otro enfoque para hacer predicciones de series temporales. Este enfoque implica la utilizaci6n de los datos de los que se dispone para estimar panimetros de un modelo del proceso que podrfa haber generado la serie temporal. En este apartado examinamos un metoda muy utilizado, los modelos autorregresivos, que se basa en el enfoque de la construcci6n de modelos. En el apartado 14.3 introdujimos el uso de variables dependientes retardadas en los modelos de regresi6n multiple y ese enfoque es la base de los modelos que analizamos aqu1. La idea es esencialmente considerar las series temporales como series de variables aleatorias. A efectos pnicticos, a menudo podrfamos estar dispuestos a suponer que estas variables aleatorias tienen todas ell as las rnismas medias y las rnismas varianzas. Sin embargo, no podemos suponer que son independientes entre S1. Ciertamente, si consideramos una serie de ventas de un producto, es muy probable que las ventas de periodos contiguos esten relacionadas entre S1. Las pautas de correlaci6n como las que hay entre periodos contiguos a veces se conocen con el nombre de autocorrelaci6n. En principio, es po sible cualquier numero de pautas de autocorrelaci6n. Sin embargo, unas son considerablemente mas probables que otras. Se plantea una posibilidad especialmente atractiva cuando se exarnina una correlaci6n bastante estrecha entre observaciones contiguas en el tiempo, una correlaci6n menos estrecha entre observaciones separadas por dos periodos, una correlaci6n mas debil aun entre los valores separados por tres periodos, etc. Surge una sencilla pauta de autocorrelaci6n de este tipo cuando la correlaci6n entre valores contiguos es algun numero -por ejemplo, 4>,- que entre valores separados por dos periodos es 4>T, que entre valores separados por tres periodos es 4>f, y asf sucesivamente. Por 10 tanto, si XI representa el valor de la serie en el periodo t, tenemos en este modelo de autocorrelaci6n que (j = 1, 2, 3, ... ) Esta estructura de autocorrelaci6n da lugar a un modelo de series temporales de la forma donde y y 4>1 son parametros fijos y las variables aleatorias "'t tienen una media de 0 y una varianza fija para todo t y no estan correlacionadas entre S1. EI fin del parametro y es tener en cuenta la posibilidad de que la serie x t tenga alguna media distinta de O. Por 10 demas, este es el modelo que utilizamos en el apartado 14.7 para representar la autocorrelaci6n de los terminos de error de una ecuaci6n de regresi6n. Se llama modelo autorregresivo de primer orden. El modelo autorregresivo de primer orden expresa el valor actual, XI' de una serie en el valor anterior, xt _ " y una variable aleatoria no autocorrelacionada, "'t. Dado que la variable aleatoria "'t no esta autocorrelacionada, es impredecible. En el caso de las series generadas por el modelo autorregresivo de primer orden, las predicciones de los futuros valores s610 dependen del valor mas reciente de la serie. Sin embargo, en much as aplicaciones querrfamos utilizar mas de una observaci6n como base para hacer predicciones. Una extensi6n obvia del modelo serfa hacer depender el valor actual de la serie de las dos observaciones mas recientes. Por 10 tanto, podrfamos utilizar un modelo 802 Estadfstica para administraci6n y economfa donde Y, ¢l Y ¢2 son panimetros fijo s. Este modelo se llama modelo autorregresivo de segundo orden. En terminos mas generales, dado un entero positivo cualquiera p, el valor actual de la serie puede hacerse dependiente (Ii nealmente) de los p valores anteriores por medio del modelo autorregresivo de orden p: donde Y, ¢l Y ¢2> ... , ¢p son panimetros fij os. Esta ecuaci6n describe el modelo autorregresivo general. En el resto de este apartado, consideramos el ajuste de esos modelos Y su uso para predecir los val ores futuros. Supongamos que tenemos una serie de observaciones X l ' X2, . . . , XII" Queremos utilizarlas para esti mar los parametros desconocidos Y, ¢l ' ¢2' ... , ¢p para los que la suma de los cuadrados de las diferencias son II sc = I (X t - Y- ¢ IX t - 1 - ¢2Xt - 2 - . .. - ¢~t_ p)2 t=p+ l sea la menor posible. Por 10 tanto, la estimaci6n puede realizarse utilizando un program a de regresi6n multiple. Mostramos este metodo en el ejemplo 19.3 utilizando los datos sobre las ventas de Lydia Pinkham. Modelos autorregresivos y su estimacion Sea XI (t = 1, 2, ..., n) una serie temporal. Un modelo que puede utilizarse a menudo eficazmente para representar esa serie es el modele autorregresivo de orden p: (1 9.11) donde y, ¢1' ¢2' ... , ¢ son parametros fijos y las cf son variables aleatorias que tienen una media de 0 y una varian~a constante y que no estan correlacionadas entre sf. Los parametros del modele autorregresivo se estiman por medio de un algoritmo de minimos cuadrados, tal que los valores de y, ¢1' ¢2' ..., ¢p minimizan la suma de los cuadrados siguiente: n SC = I (X t - Y - ¢lXt - l - ¢ 2Xt - 2 - ... - ¢~t _ p)2 (19.12) t= p + 1 EJEMPLO 19.3. Predicci6n de los datos sobre las ventas (modelo autorregresivo) Pinkham Sales Data Se Ie ha pedido que desarrolle un modelo autonegresivo para predecir los datos sobre las vent as de Lydia Pinkham (vease el fichero de datos Pinkham Sales Data). Soluci6n Para utilizar un modelo autonegresivo que permita hacer predicciones de los futuros valores, es necesario fijar un valor para p, el orden de la autonegresi6n. Debemos elegir un valor de p 10 suficientemente alto para tener en cuenta toda la conducta importante de autoconelaci6n de la serie. Pero tampoco queremos que p sea tan grande que inc1uyamos parametros irrelevantes y que la estimaci6n de los parametros importantes sea Capitulo 19. Analisis de series temporales y prediccion 803 ineficiente como consecuencia. En general, se prefieren los model os «parsimomcos» -sencillos, pero suficientes para lograr el objetivo- para hacer buenas predicciones de datos de series temporales. Una posibilidad es fijar el valor de p arbitrariamente, quiza basandose en la experiencia anterior con conjuntos de datos similares. Otro enfoque es fijar un orden maximo, K, de la autolTegresion y estimar, a su vez, modelos de orden p = K, K - 1, K - 2, ... Se contrasta para cada valor de p la hipotesis nula de que el ultimo para metro de la autorregresion, ¢>p, del modelo es 0 frente a la altemativa bilateral. EI procedimiento concluye cuando hallamos un valor de p para el que esta hipotesis nula no se rechaza. Nuestro objetivo es, pues, contrastar la hipotesis nul a frente a la alternativa En el Capitulo 12 presentamos metodos para contrastar la hipotesis nula, Ho. Sabemos basicamente que el cociente entre la estimacion del coeficiente y la desviacion tfpica del coeficiente sigue una distribucion t de Student. La salida Minitab del analisis de regresion -y la salida del analisis de regresion de cualquier paquete estadfstico- incluye ese calculo de la t de Student y, ademas, la probabilidad de que la hipotesis nula sea verdadera -el p-valor de la hipotesis nula- dada la t de Student calculada. Predicci6n a partir de model os autorregresivos estimados Supongamos que tenemos las observaciones X1 , X2 , ... , xt de una serie temporal y que se ha ajustado un modele autorregresivo de orden p a estos datos. Expresamos el modelo estimado de la siguiente manera: (19.13) Partiendo del periodo guiente manera: n, hacemos predicciones de los futuros valores de la serie de la si(19.14) xn+ donde para j > 0, j es la prediccion de x t plemente el valor observado de xt + r + partiendo del periodo n, y para j ~ 0, xt + j j es sim- La Figura 19.18 muestra copias abreviadas de la salida Minitab del analisis de regresion para modelos autorregresivos utilizando los datos sobre las ventas de Lydia Pinkham y suponiendo que p = 1, 2, 3,4. Aplicaremos este metodo a los datos sobre las ventas de Pinkham utilizando un nivel de significacion del 10 por ciento para nuestros contrastes. Basandonos en los resultados de Ia Figura 19.18, comenzamos con la regresion suponiendo que p = 4. Observamos que el coeficiente de X t - 4 tiene un estadistico t de Student de - 1,39 y un p-valor de 0,180. Por 10 tanto, no podemos rechazar Ia hipotesis nula de que el coeficiente es 0 y pasamos a la regresion suponiendo que p = 3. En este caso, vemos que el coeficiente de Xt - 3 tiene un 804 Estadfstica para administraci6n y economfa Figura 19.18. Modelos autorregresivos para los datos sobre las ventas de Lydia Pinkham (salida Minitab). Regression with p = 1 Sales = 193 + 0.883 Salelag1 29 cases used 1 cases contain missing values Predictor Constant Salelag1 S = 207.0 Coef 193 . 3 0.8831 R-Sq = 73.4% StDev 189.0 0.1024 T P 1. 02 0.316 0.000 8.62 R-Sq(adj) = 72.4% Regression with p = 2 Sales = 314 + 1.18 Salelag1 - 0.358 Salelag2 28 cases used 2 cases contain missing values Predictor Constant Sale1ag1 Salelag2 S = 199.6 Coef 313.7 1.1801 -0 .3578 R-Sq = 76.9% StDev 192.5 0.1870 0.1914 T P 1. 63 0.116 0.000 0 . 073 6.31 -1 .87 R-Sq(adj) = 75.1 % Regression with p =3 Sales = 322 + 1.19 Sa1e1ag1 - 0.317 Salelag2 - 0.057 Salslag3 27 cases used 3 cases contain missing values Predictor Constant Salelag1 Sale1ag2 Salslag3 S =203.0 Coef 322.3 1.1881 -0.3168 -0.0574 R-Sq = 78 .1% StDev 215.7 0.2065 0.3081 0.2098 T 1. 49 5.75 -1.03 -0.27 P 0.149 0.000 0.315 0.787 R-Sq(adj) = 75.2% Regression with p = 4 Sales = 446 + 1.19 Salelag1 - 0.439 Sa1elag2 + 0.286 Salslag3 - 0.291 Salelag4 26 cases used 4 cases contain missing values Predictor Coef StDev T P Constant 446.2 232.8 1.92 0.069 Sale1ag1 1.1937 0.2108 5.66 0.000 Salelag2 -0.4391 0.3238 -1.36 0.190 Salslag3 0.2859 0.3174 0.90 0.378 Salelag4 -0.2914 0.2101 -1.39 0.180 S = 202.6 R-Sq = 80.1% R-Sq(adj) = 76.3% estadfstico t de Student igual a - 0,27 y un p-valor de 0,787. Una vez mas, no podemm rechazar la hip6tesis nul a de que este coeficiente es 0. En el caso del modelo de regresi6n en el que se supone que p = 2, vemos que el coeficiente de X t - 2 tiene un estadfstico t dE Student de - 1,87 Y un p-valor de 0,073. Por 10 tanto, podemos rechazar la hip6tesis nu12 de que el coeficiente de X t - 2 es 0. El modelo elegido es el modelo con dos valores retardados, p = 2. La ecuaci6n final es Xt = 313,7 + 1,1801xt _ 1 - 0,3578xt _ 2 Ahora que tenemos el modelo, queremos aplicarlo para hacer predicciones con los datm sobre las ventas de Lydia Pinkham. Comenzamos sefialando que los dos ultimos valores dE la serie de datos son y X29 = 1.387 X30 = 1.289 Analisis de series temporales y predicci6n Capitulo 19. 805 Ahora podemos predecir el siguiente valor X31: X31 = 313,68 + 1,l80X30 - 0,358x29 = 313,68 + (1,180)(1.289) - (0,358)(1.387) = 1.338,2 Reconocemos que el valor predicho del termino de error, 81' es O. Ahora podemos predecir el siguiente valor de la serie siguiendo el mismo procedimiento, con la salvedad de que ahora debemos utilizar el valor predicho de X31, es decir, Xt: X32 + 1,180X31 - 0,358x30 = 313,68 + (1,180)(1.338,2) - (0,358)(1.289) = 1.431,29 = 313,68 Estos calculos pueden realizarse directamente mediante el programa Minitab - 0 mediante cualquier otro buen paquete estadfstico- y los resultados se muestran en la Figura 19.19. Podemos continuar con este proceso y hacer predicciones para tantos periodos futuros como queramos. La serie temporal de ventas y las predicciones para seis periodos se muestran en la Figura 19.20. Figura 19.19. Valores predichos a partir de un modelo autorregresivo para los datos sobre las ventas de Pinkham (salida Minitab). Sales = 314 + 1.18 Salelag1 - 0.358 Salelag2 28 cases used 2 cases contain missing values Predictor Constant Salelag1 Salelag2 S = Coef 313.7 1.1801 -0.3578 199 .6 R-Sq StDev 192.5 0.1870 0.1914 = 76 . 9% T 1. 63 6 . 31 -1.87 R-Sq(adj) = P 0.116 0.000 0.073 75.1% Predicted Values Fit 1338.6 Figura 19.20. Ventas de Lydia Pinkham y predicciones basad as en el ajuste de un modelo autorregresivo de segundo orden. StDev Fit 63.5 95.0% CI 1207.7, 1469.4) 95.0% PI 907.1, 1770 . 1) Time Series Plot for Sales (with forecasts and their 95% confidence limits) 2500 2000 rJ) (]) co (/) 1500 1000 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 Time 806 Estadfstica para administraci6n y economfa EJERCICIOS Ejercicios aplicados 19.40. Basandose en los datos de la Tabla 19.10, estime un modelo autorregresivo de primer orden para calcular el fndice del volumen de acciones negociadas. Utilice el modelo ajustado para hacer predicciones para los 4 pr6ximos dfas. 19.41. (0 It) EI fichero de datos Trading Volume muestra el volumen de transacciones (en cientos de miles) de acciones de una empresa realizadas en un periodo de 12 meses. Estime con estos datos un modelo autorregresivo de primer orden y utilice el modelo ajustado para hacer predicciones del volumen para las 3 pr6ximas semanas. 19.42. 19.43. f, Basandose en el fichero de datos Housing Starts del ejercicio 19.16, estime modelos autorregresivos de 6rdenes 1 a 4. Utilice el metoda de este apartado para contrastar la hip6tesis de que el orden de la autorregresi6n es (p - 1) frente a la alternativa de que es p, con un nivel de significaci6n del 10 por ciento. Seleccione uno de estos model os y haga predicciones de 1a construcci6n de viviendas para los 5 pr6ximos afios. Trace un griifico temporal que muestre las observaciones originales junto con las predicciones. i,Serfan diferentes las predicciones si se utilizara un nivel de significaci6n del 5 por ciento para los contrastes del orden autorregresivo? t.9 Basandose en el fichero de datos Earnings per Share del ejercicio 19.17 sobre los beneficios por acci6n de una empresa, ajuste modelos autorregresivos de 6rdenes 1 a 4. Utilice el metodo de este apartado para contrastar la hip6tesis de que el orden de la autorregresi6n es (p - 1) frente a la alternativa de que el verdadero orden es p , con un nivel de significaci6n del 10 por ciento. Seleccione uno de estos modelos y haga predicciones de los beneficios por acci6n para los 5 pr6ximos afios. Trace un grafico que muestre las observaciones originales junto con las predicciones. i,Serfan diferentes los resultados si se utilizara un ni vel de significaci6n del 5 por ciento para los contrastes? 19.44. if., Vuelva al fichero de datos Earnings per Share 19.30 del ejercicio 19.30 sobre los beneficios por acci6n de una empresa. Ajuste modelos auton·egresivos de 6rdenes 1, 2 y 3. Utilice el metodo del apart ado 19.6 para contrastar la hip6tesis de que el orden de la autorregresi6n es (p - 1) frente a 1a alternativa de que es p, con un nivel de significaci6n del 10 por ciento y seleccione un valor para el orden autorregresivo. Utilice el modelo seleccionado para hacer predicciones de los beneficios por acci6n para dentro de 4 afios. Trace un grMico temporal de las observaciones y las predicciones. i,Serfan diferentes los resultados si se utilizara un nivel de significaci6n del 5 por ciento para los contrastes? 19.45. (if Y En la Figura 19.18, se muestran modelos autorregresivos ajustados de 6rdenes 1 a 4 para datos sobre las ventas anuales. A continuaci6n, seleccionamos un modele contrastando la hip6tesis nula de una autorregresi6n de orden (p - 1) frente a la alternativa de una autorregresi6n de orden p al nivel de significaci6n del 10 por ciento. Repita este procedimiento, pero haga un contraste al ni vel de significaci6n del 5 por ciento. a) i,Que modelo autorregresivo se selecciona ahora? b) Realice predicciones de las ventas para los 3 pr6ximos afios basandose en este modelo seleccionado. 19.46. Se ha observado que las ventas anuales de un producto podrfan muy bien describirse por medio de un modelo autorregresivo de tercer orden. EI modelo estimado es X,= 202+ I,lOX' - 1 - 0,48X' - 2 + 0,17X'-3 +£, En 1993, 1994 Y 1995, las ventas fueron de 867, 923 y 951, respectivamente. Calcule las predicciones de las ventas para los afios 1996 a 1998 . 19.47. En el caso de muchas series temporales, especialmente en el de los precios de los mercados especulativos, se ha observado que el modelo del pas eo aleatorio representa satisfactoriamente los datos efectivos. Este modelo es Demuestre que, si este modele es adecuado, las predicciones de XII + /" partiendo del periodo n, vienen dadas por Xn+h = Xn (h = 1,2,3, .. .) 19.48. ~ <1 Vuelva al fichero de datos Hourly Earnings del ejercicio 19.35, que muestra los beneficios de 24 meses. Sean x, (t = 1, 2, ... , 24) las Capitulo 19. observaciones. A continuaci6n, construya la serie de primeras diferencias: z, = X, - X'-i (t = 2, 3, ... , 24) Ajuste modelos autorregresivos de 6rdenes 1 a 4 a la serie Z,. Utilizando el metodo de este apartado para contrastar la hip6tesis de que el Analisis de series temporales y predicci6n 807 orden autorregresivo es (p - 1) frente a la alternativa de orden p, con un nivel de significaci6n del 10 por ciento, seleccione uno de estos modelos. Utilizando el modelo seleccionado, realice predicciones para Z" donde t = 25, 26 Y 27. Realice predicciones de los beneficios para los 3 pr6ximos meses. 19.7. Modelos autorregresivos integrados de medias m6viles En este apartado introducimos brevemente un metodo para hacer predicciones de datos de series temporales que se utiliza mucho en las aplicaciones empresariales. Los modelos que analizamos incluyen como caso especial los modelos autorregresivos que hemos estudiado en el apartado 19.6. En un libro ch'isico, George Box y Gwilyn Jenkins introdujeron una metodologfa 10 suficientemente versatil para que un usuario moderadamente habil obtenga buenos resultados en una amplia variedad de problemas de prediccion que se plantean en la practica (vease la referencia bibliografica 1). La esencia del metoda de Box-Jenkins es el examen de una amplia clase de modelos a partir de los cuales pueden realizarse predicciones, junto con una metodologfa para elegir, en funcion de las caracterfsticas de los datos de los que se dispone, un modelo adecuado para cualquier problema de prediccion. La clase general de modelos es la clase de modelos autorregresivos integrados de medias moviles (ARIMA). Son extensiones bast ante naturales de los modelos autorregresivos del apartado 19.6. Ademas, la suavizacion exponencial simple y los predictores de HoltWinters pueden obtenerse a partir de miembros especfficos de esta clase general, al igual que otros muchos algoritmos que se utilizan frecuentemente para hacer predicciones. Los modelos y las tecnicas de analisis de series temporales de Box-Jenkins pueden generalizarse para tener en cuenta la estacionalidad y tambien para analizar series temporales relacionadas, por 10 que es po sible predecir los futuros valores de una serie a partir de informacion no solo sobre su propio pasado sino tambien sobre el pas ado de otras series relevantes. Esta ultima posibilidad permite adoptar un enfoque para realizar predicciones que generaliza los metodos de regresion analizados en los Capftulos 12 a 14. No es posible en el espacio de que disponemos analizar exhaustivamente la metodologfa de Box-Jenkins (para una introduccion a esta metodologfa, vease la referencia bibliografica 3). Consta, esencialmente, de tres fases : 1. 2. 3. Basandose en estadfsticos sinteticos que son faciles de calcular a partir de los datos de que se dispone, el analista selecciona un modelo especffico de la clase general. No se trata simplemente de seguir automaticamente una serie de reglas sino que hace falta un cierto grado de criterio personal y de experiencia. Sin embargo, el analista no se compromete para siempre a seguir el modelo elegido en esta fase sino que puede abandonarlo en favor de otro en una fase posterior si parece deseable. EI modelo especffico elegido tiene casi invariablemente algunos coeficientes desconocidos. Estos deben estimarse a partir de los datos de los que se dispone utilizando tecnicas estadfsticas eficientes, como mfnimos cuadrados. Por ultimo, hay que averiguar si el modelo estimado es una representacion adecuada de los datos de series temporales de los que se dispone. Cualquier indicio de 808 Estadfstica para administracion y economfa que no 10 es en esta fase puede sugerir alguna especificaci6n alternativa y el proceso de selecci6n del modelo, de estimaci6n de los coeficientes y de comprobaci6n del modelo se repite hasta que se encuentra uno satisfactorio. EI enfoque de Box-Jenkins para hacer predicciones tiene la gran ventaja de la flexibili- dad: existe una amplia variedad de predictores y la elecci6n entre ellos se basa en los datos. Ademas, cuando se ha comparado este enfoque con otros metodos, utilizando series temporales econ6micas y empresariales efectivas, normalmente se ha observado que funciona muy bien. Por 10 tanto, puede decirse que ha superado la prueba de fuego: jen la practica, funciona! Para concluir este breve analisis, observese que existen programas informaticos para realizar analisis de series temporales ajustando a los datos modelos ARIMA, incluido un conjunto de procedimientos del programa Minitab. Sin embargo, el metodo tiene un inconveniente en comparaci6n con otros mas sencillos analizados en apartados anteriores de este capitulo. Como hay flexibilidad para elegir un modelo adecuado de la clase general, el enfoque de Box-Jenkins es mas caro que los metodos que imponen una unica estructura del modelo a todas las series temporales porque debe ser utilizado por personas cualificadas. RESUMEN Este capftulo es una introduccion al amilisis de los datos de series temporales . Hemos presentado, en primer lugar, los nllmeros In dice como medida estandarizada de las variaciones a 10 largo del tiempo . En el resto del capItulo, hemos mostrado algunos utiles metodos para predecir datos de series temporales. Los numeros Indice constituyen una base coherente a 10 largo del tiempo para representar precios, cantidades y otras medidas importantes. Los numeros Indice simples son una medida del cambio can respecto a un periodo de tiempo fijo. Los numeros Indice ponderados, como el fndice de Laspeyres, parten de proporciones de bienes constantes e indican como influyen las variaciones de los precios de cada bien en el precio agregado de la cesta de mercado. Hemos comenzado la prediccion de datos de series temporales con un amilisis de los principales componentes de las series temporales: tendencial, cfclico, estacional e irregular. A continuacion, hemos presentado una serie de instrumentos aplicados que han demostrado ser eficaces para hacer predicciones. Hemos mostra- do algunas versiones de los modelos de medias moviles ponderadas y los modelos exponenciales. Hemos visto como pueden utilizarse algunas variantes de estos metodos para controlar y estimar el efecto de los principales componentes. Hemos introducido los model os autorregresivos para ilustrar el enfoque estocastico de las predicciones de datos de series temporales. En ese enfoque, estimamos parametros de un modelo que podrfan haber generado la serie temporal. Un enfoque consiste en utilizar modelos autorregresivos en los que se plantea que una medida en el periodo t es una funcion lineal de las observaciones pasadas mas un termino de error aleatorio. EI desarrollo del modelo implica la especificacion del modelo, la estimacion y a continuacion la realizacion de un contraste para averiguar la eficacia del modele para hacer predicciones. Por ultimo, hemos ofrecido una vision panoramica de los modelos integrados autorregresivos de medias moviles, que son la base de una amplia variedad de especificaciones de model os, dependiendo de la estructura que se crea que tiene el proceso. TERMINOS CLAVE aniilisis de los componentes de las series temporales, 779 calculo de fndices de precios de un lmico articulo, 767 cambio del periodo base, 770 contraste de rachas, 775 contraste de rachas: grandes muestras, 775 fndice de cantidades agregado ponderado, 769 fndice de cantidades de Laspeyres, 770 fndice de precios agregado ponderado, 768 fndice de precios enlazado, 771 fndice de precios de Laspeyres, 768 fndice de precios no ponderado, 767 Capitulo 19. Analisis de series temporales y predicci6n numeros fndice, 764 predicci6n con el metodo de Holt-Winters: series estacionales, 797 predicci6n con el metoda de Holt-Winters: series no estacionales, 793 predicci6n a partir de modelos autOlTegresivos estimados, 803 mcd ias moviles centradas simples de (2m + 1) puntos, 781 metodo de desestacionalizaci6n med iante medias m6viles simples, 785 modelos ARIMA, 807 modelos autOlTegresivos y su estimaci6n, 802 809 predicci6n por medio de la suavizaci6n exponencial simple, 791 series temporales, 777 suavizaci6n exponencial simple, 789 EJERCICIOS V APLICACIONES DEL CAPITULO 19.49. I" Vuelva al ejercicio 19.35 y al fichero de datos Hourly Earnings, que muestra los ingresos mensuales por hora de la industria manufacturera. a) Calcule un fndice con el mes I como base. b) Calcule un fndice con el mes 5 como base. 19.50. , . Una biblioteca compra Iibros y revistas. La tabla adjunta y el fichero de datos Library Purchases muestran los precios medios (en d6lares) pagados por cada uno y las cantidades compradas en un periodo de 6 anos. Utilice el ano 1 como base. Libros Revistas ADO Precio Cantidad Precio Cantidad 1 2 3 4 5 6 20,4 22,3 23,3 24,6 27,0 29,2 694 723 687 731 742 748 30,1 33,4 36,0 39,8 45,7 50,7 155 159 160 163 160 155 a) Halle el fndice de precios agregado no ponderado. b) Halle el fndice de precios de Laspeyres. c) Halle el fndice de cantidades de Laspeyres. 19.51. Explique la afirmaci6n de que puede considerarse que una serie temporal esta formada por varios componentes. Ponga ejemplos de series temporales empresariales y econ6micas en las que es de esperar que sean importantes determinados componentes. 19.52. En much as aplicaciones empresariales, las predicciones de los futuros valores de las series temporales, como las ventas y los beneficios, se hacen exclusivamente con informaci6n pasada sobre la serie temporal en cuesti6n. i,Que caracterfsticas de la conducta de las series temporales se explota en la producci6n de esas predicciones? 19.53. Una persona encargada del control de las existencias solicita predicciones mensuales de las ventas de varios productos para los 6 pr6ximos meses. Esta persona tiene datos sobre las ventas mensuales de cada uno de estos productos de los 4 ultimos aftos. Decide utilizar como predicciones para cada uno de los 6 pr6ximos meses las ventas mensuales medias de los 4 ultimos anos. i,Cree que es una buena estrategia? Explique su respuesta. 19.54. i,Que se entiende por ajuste estacional de una serie temporal? Explique pOI' que los organismos oficiales realizan muchos esfuerzos para desestacionalizar las series temporales econ6micas. 19.55. I .. EI fichero de datos US Industrial Production muestra un fndice de producci6n industrial de Estados Unidos de 14 aftos. a) Realice un contraste de aleatoriedad de esta serie utilizando el contraste de rachas. b) Trace un grMico temporal de estos datos y analice las caracterfsticas que revela el grMico. c) Calcule la serie de medias m6viles centradas simples de 3 puntos. Represente grMicamente esta serie suavizada y anal ice su conducta. 19.56. " EI fichero de datos Product Sales muestTa 24 observaciones anuales sobre las ventas de un producto. a) Uti lice la variante del contraste de rachas para grandes muestras para hacer un contraste de aleatoriedad de esta serie. b) Trace un grMico temporal de los datos y analice las caracterfsticas de la serie mostra da en este grMico. c) Calcule la serie de medias m6viles centradas simples de 5 puntos. Represente graficamente esta serie suavizada y anal ice su conducta. 810 Estadistica para administraci6n y economia 19.57. t,.) El fichero de datos Quarterly Earnings 19.57 muestra los beneficios trimestrales por accion de una empresa en 7 afios. a) Represente gr<'ificamente estos datos. i,Sugiere este gr<'ifico la presenci a de un fuerte componente estacional? b) Utilice el metodo del fndice estacional para obtener una serie desestacionalizada. 19.58. f., El fichero de datos Price Index muestra 15 val ores mensuales del fndice de precios de una mercancfa. a) Calcule la serie de medias moviles centradas simples de 3 puntos . b) Trace un gr<'ifico temporal de la serie suavizada y comente sus caracterfsticas. 19.59. ~; Vuelva al ejercicio 19.56 y al fichero de datos Product Sales. Uti lice la suavizacion exponencial simple con una constante de suavizacion rx = 0,5 para hacer predicciones de las ventas para los 3 proximos afios. 19.60. ( ) Vuelva al ejercicio 19.58 y al fichero de datos Price Index. Utilice el metoda de HoltWinters con las constantes de suavizacion rx = 0,3 y f3 = 0,4 para hacer predicciones del Indice de precios para los 4 proximos meses. 19.61. ( ) Vuelva al ejercicio 19.57 y al fichero de datos Quarterly Earnings 19.57. Utilice el metodo estacional de Holt-Winters con las constantes de suavizacion rx = 0,4, f3 = 0,4 y y = 0,2 para hacer predicciones de esta serie de beneficios por accion para los cuatro proximos trimestres. 19.62. 0' ,) Basandose en el fichero de datos Product Sales del ejercicio 19.59, estime modelos autorregresivos de ordenes 1 a 4 para las ventas del producto. Utilizando el metodo del apartado 19.6 para contrastar la hipotesis de que el orden autorregresivo es (p - I) frente a la alternativa de que el orden es p , con un nivel de significacion del 10 por ciento, elija uno de estos modelos. Haga predicciones para los 3 proximos afios a partir del modelo elegido. Bibliografla 1. 2. 3. Box, G. E. P. Y G. M. Jenkins, Time Series Analysis, Forecasting, and Control, San Francisco, Holden-Day, 1970. Granger, C . W. Y P. Newhold, Forecasting Economic Time Series, Orlando, Fl, Academic Press, 1986, 2.a ed. Newbold, P. y T. Bas, Introductory Business Forecasting, Cincinnati , OH, South-Western, 1994, 2.a ed.