Maestría en Marketing Métodos y técnicas de análisis cuantitativo y cualitativo Modelos para series temporales • Referencia: D. Caps 2-5. PR Cap 11. Otoño 2004 Problemas a tratar • Nos focalizaremos en variables que evolucionan en el tiempo. • Queremos saber si podemos describir de alguna manera cómo se comportó esta variable históricamente, y si podemos sistematizar esta manera de describir •Tambien queremos ver si podemos pronosticar el comportamiento futuro de la variable, y que tan buena es nuestra predicción. Métodos y técnicas de análisis cuantitativo y cualitativo 1 1 2800 90 80 2400 70 2000 60 50 1600 40 1200 30 20 800 10 400 0 1991 1992 1993 HOUSE 7 1970 1994 1975 1980 1990 SALES 200000 6 1985 190000 5 180000 4 170000 3 2 160000 1 150000 0 140000 -1 86 88 90 92 94 96 98 00 1989 1990 1991 1992 1993 RTRR AIRCA 1994 2 Primera aproximación: • La primera descripción de una serie temporal proviene de la observación gráfica de la misma. •Hay dos cosas que debemos distinguir: • El comportamiento promedio (tendencia) • La evolución de la varianza • Cuando una serie no tiene tendencia y su varianza no depende del momento del tiempo en el que la miremos, entonces diremos que la serie es estacionaria. Métodos y técnicas de análisis cuantitativo y cualitativo 3 2 Enfoque clásico • El enfoque clásico propone descomponer las series en tres componentes, la tendencia, la estacionalidad, y una parte irregular. Yt = Tt + Et + I t • Lo que haremos es definir cada uno de sus componentes y ver como podemos caracterizarlos. Métodos y técnicas de análisis cuantitativo y cualitativo 4 Tendencia • La tendencia de una serie es el comportamiento promedio (suave) de la misma 200000 480000 470000 190000 460000 180000 450000 170000 440000 430000 160000 420000 150000 410000 140000 400000 1989 1990 1991 1992 1993 1994 1989 1990 RTRR Métodos y técnicas de análisis cuantitativo y cualitativo 1991 1992 1993 1994 VENTAS 5 3 Tendencia. Caracterización • No solo nos interesa ver el signo de la tendencia, sino tambien caracterizarla. • Utilizaremos dos alternativas para caracterizar tendencias: • Lineal: Yt = α + βt + ut • Cuadrática: Yt = α + β1t + β 2t 2 + ut Métodos y técnicas de análisis cuantitativo y cualitativo 6 Tendencia. Caracterización • La pregunta relevante es cómo elegir entre las dos especificaciones. Alternativas: • Test de significatividad individual del componente cuadrático • R2 ajustado • Criterio de Akaike • Criterio de Schwartz Métodos y técnicas de análisis cuantitativo y cualitativo 7 4 Tendencia. Ejemplos 480000 Dependent Variable: VENTAS Method: Least Squares Sample: 1989:01 1994:12 Included observations: 72 470000 460000 450000 Variable Coefficient Std. Error t-Statistic Prob. 440000 TIME TIME2 C 430000 420000 410000 400000 1989 1990 1991 1992 1993 1994 VENTAS 490000 998.00 -0.0193 9.9996 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 368.67 0.4146 81811.5 0.995921 0.995802 1358.704 127000000 -620.060 1.678 2.7125 0.0000 0.0001 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 0.0084 0.9980 0.8999 444510.000 20971.270 17.307 17.402 8422.731 0.000 Dependent Variable: VENTAS Method: Least Squares Sample: 1989:01 1994:12 Included observations: 72 480000 470000 460000 Variable 450000 440000 Coefficient TIME C 430000 420000 410000 400000 1989 1990 1991 1992 VENT AS 1993 1994 VENT ASF Std. Error 998.00 9.9996 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.995921 0.995862 1348.964 127000000 -620.060 1.678 368.67 81811.5 t-Statistic Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Métodos y técnicas de análisis cuantitativo y cualitativo Prob. 2.7125 0.0001 0.0084 0.9911 444510.000 20971.270 17.279 17.343 17089.600 0.000 8 4000 3000 2000 1000 0 -1000 -2000 -3000 -4000 1989 1990 1991 1992 1993 1994 VENTAS Residuals Métodos y técnicas de análisis cuantitativo y cualitativo 9 5 Tendencia. Ejemplos 200000 Dependent Variable: RTRR Method: Least Squares Sample(adjusted): 1955:01 1994:12 Included observations: 480 after adjusting endpoints 160000 120000 Variable Coefficient 80000 TIME C 361.0375 -18177.14 40000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.900853 0.900645 16631.13 1.32E+11 -5345.224 0.004445 0 55 60 65 70 75 80 85 90 RT R R 200000 Std. Error 5.478371 1520.583 t-Statistic Prob. 65.90234 -11.95406 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 0.0000 0.0000 68652.38 52762.81 22.2801 22.29749 4343.119 0 Dependent Variable: RTRR Method: Least Squares Sample(adjusted): 1955:01 1994:12 Included observations: 480 after adjusting endpoints 160000 Variable 120000 80000 40000 0 55 60 65 70 75 RTRR 80 85 90 RTRRF Coefficient TIME TIME2 C -97.61614 0.953542 18668.03 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.997372 0.997361 2710.596 3.50E+09 -4473.949 0.158805 Std. Error 3.578537 0.007204 372.7156 t-Statistic Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Métodos y técnicas de análisis cuantitativo y cualitativo Prob. -27.27823 132.354 50.08654 0.0000 0.0000 0.0000 68652.38 52762.81 18.65396 18.68004 90508.38 0.00000 10 6000 4000 2000 0 -2000 -4000 -6000 1989 1990 1991 1992 1993 1994 RTRR Residuals Métodos y técnicas de análisis cuantitativo y cualitativo 11 6 Tendencia. Pronóstico • Supongamos que estimamos utilizando una muestra de T períodos, y queremos estimar para períodos mayores (T+1, T+2, etc.). Para esto haremos lo siguiente: • De la estimación conservamos los valores estimados de los coeficientes (αˆ y βˆ ) • Luego, el valor estimado para T+1 es YˆT +1 = αˆ + βˆ (T + 1) Métodos y técnicas de análisis cuantitativo y cualitativo 12 Tendencia. Pronóstico • Notemos que como el pronóstico es una función de los parámetros estimados (que son variables aleatorias) entonces el valor estimado tambien será una variable aleatoria. Luego, entre otras cosas, podríamos calcularle el desvío estandar. • Una vez que tenemos el desvío estandar, podemos calculara un intervalo de confianza para el verdadero valor IC0.95 = Yˆ ± 1.96 SYˆ T • Luego, uno de los usos que le podemos dar a los intervalos de confianza el la precisión esperada sobre al estimación. Métodos y técnicas de análisis cuantitativo y cualitativo 13 7 Tendencia. Pronóstico • Otro uso para el intervalo de confianza es analizar expost que tan buena fue la predicción. • Con probabilidad muy alta, no lograremos acertar exactamente el valor futuro, pero lo que diremos es que si el verdadero valor cayó dentro del intervalo de confianza, entonces la predicción estuvo razonablemente bien. Métodos y técnicas de análisis cuantitativo y cualitativo 14 Tendencia. Pronostico. Ejemplo 200000 200000 190000 190000 180000 170000 Sales Sales 180000 170000 160000 150000 140000 160000 130000 120000 150000 1990 1991 1992 1993 1994 110000 1990 1991 Time Métodos y técnicas de análisis cuantitativo y cualitativo 1992 1993 1994 Time 15 8 Estacionalidad • Algunas series tiene un comportamiento que depende del tiempo, pero que no es suave si no que se repite períodicamente. Este comportamiento que se repite según la frecuencia de los datos es lo que llamamos estacionalidad 7 2800 6 2400 5 2000 4 3 1600 2 1200 1 800 0 -1 86 88 90 92 94 96 98 00 400 1970 1975 AIRCA 1980 1985 1990 SALES Métodos y técnicas de análisis cuantitativo y cualitativo 16 Estacionalidad. Caracterización • Por ejemplo, si los datos son mensuales, las estacionalidad para un mes es que en ese mes la variable toma un valor distinto, en promedio, con respecto a los otros sólo por el hecho de que es ese mes. • Este esquema es compatible con la utilización de variables binarias para medirlo. Por ejemplo, incluyendo como regresor una variable binaria para el mes de enero, el coeficiente capturaría la diferencia promedio de la variable de interés en relación a los otros meses. Métodos y técnicas de análisis cuantitativo y cualitativo 17 9 Estacionalidad. Caracterización • Lo que debemos hacer es incluir tantas variables binarias (menos una) como frecuencia de datos tengamos. • Luego, la interpretación de cada uno de los coeficientes que acompañen a estas variables será la diferencia promedio con respecto a la categoría (mes, trimestre, etc) que excluyamos Métodos y técnicas de análisis cuantitativo y cualitativo 18 Estacionalidad. Ejemplo Dependent Variable: HOUSE Method: Least Squares Sample: 1990:01 1993:11 Included observations: 47 90 Variable 80 70 60 50 40 30 20 10 0 1991 1992 HOUSEF1 1993 HOUSE 1994 Coefficient D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 C 9.226329 10.031060 31.935800 45.015530 47.120260 49.675000 41.254730 38.909470 32.039200 38.168940 15.773670 18.191930 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.668044 0.563715 12.81162 5744.817 -179.6289 0.417936 Std. Error Métodos y técnicas de análisis cuantitativo y cualitativo 9.785037 9.785037 9.785037 9.785037 9.785037 9.785037 9.785037 9.785037 9.785037 9.785037 9.785037 7.396793 t-Statistic Prob. 0.942902 1.025143 3.263738 4.600446 4.815543 5.076629 4.216104 3.976425 3.274306 3.900745 1.61202 2.459435 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 0.3522 0.3123 0.0025 0.0001 0.0000 0.0000 0.0002 0.0003 0.0024 0.0004 0.1159 0.0190 48.75789 19.39631 8.154421 8.626799 6.403249 0.000011 19 10 40 30 20 10 0 -10 -20 -30 1991 1992 1993 HOUSE Residuals Métodos y técnicas de análisis cuantitativo y cualitativo 20 Estacionalidad. Pronóstico 100 80 60 40 20 0 -20 1990 1991 1992 1993 Métodos y técnicas de análisis cuantitativo y cualitativo 1994 21 11