PREDICCIÓN DE SERIES CORTAS CON ESTACIONALIDAD ESTABLE USANDO DISTRIBUCIONES A PRIORI INFORMATIVAS AUTOR 1 ROJO GARCÍA, JOSÉ LUIS e-mail: [email protected] AUTOR 2 SANZ GÓMEZ, JOSÉ ANTONIO e-mail: [email protected] Departamento de Economía Aplicada UNIVERSIDAD DE VALLADOLID Área temática: Métodos cuantitativos. Resumen En un reciente artículo de Mendoza y de Alba (2006) se introduce un método bayesiano jerárquico para predecir una serie acumulada (flujo) a partir de su acumulación parcial, suponiendo estacionalidad estable en términos estocásticos. En las aplicaciones prácticas propuestas por dichos autores emplean distribuciones a priori no informativas (neutrales en sentido de Jeffreys). Este método resulta de especial utilidad en la predicción de series cortas, para las que los métodos clásicos resultan poco eficientes debido al reducido número de observaciones. Nuestro trabajo explora la posibilidad de mejorar el procedimiento anterior mediante la utilización de distribuciones a priori informativas relacionadas con la “historia” de la serie o bien con una serie “proxy” a la serie a estimar. El procedimiento se ilustra a partir de la serie española de desempleados tomada de la Encuesta de Población Activa. Palabras clave: Análisis Bayesiano, Series temporales, Estacionalidad estable. Abstract In a recent paper, Mendoza and de Alba (2006) propose a Hierarchical Bayes model to make an estimate of the accumulated value of a positive and continuous variable for which some partially accumulated data has been observed. They assume stable seasonality, which is specified in stochastic terms, and use a noninformative prior for the parameters involved in the model. The proposed method comes in hand, especially when a short series is to be predicted, because the classical methods cannot be applied due to the reduced number of observations. In our paper, the possibility of an improvement to the method is presented. To that end, the use of informative priors is suggested, and either the ‘historical’ (past) values of the series or a ‘proxy’ one are considered in order to compute reasonable values for the parameters involved in the prior distributions. An example is considered by using the Unemployed Persons series from the Spanish Economically Active Population Survey (E.P.A.) provided by the National Statistics Institute (I.N.E.) Key words: Bayesian Analysis, Time series, Stable seasonality 1. Introducción La predicción de series cortas (series para las que se dispone de un número pequeño de observaciones) es una necesidad en el análisis de la coyuntura económica. Los frecuentes cambios de base de las series, obligan a esperar un número prudencial de periodos antes de proceder, bien al enlace de las series, o bien a la utilización de la nueva serie para la predicción. A veces, los Institutos de Estadística proporcionan un enlace adecuado, pero con frecuencia ello no es así. Por otro lado, existen series que son “intrínsecamente cortas”, debido a que resultan de mediciones económicas referentes a nuevas unidades (por ejemplo, nuevas empresas o nuevas mancomunidades provenientes de agregaciones municipales). Poca atención se ha dedicado en la literatura a la predicción de series de tiempo cortas. Yu y Schwartz (2006), utilizando series anuales de entradas de turistas, comparan dos métodos complejos (Fuzzy time series y Grey theory) con métodos más sencillos (doble media móvil y alisado exponencial doble). La conclusión es que no parece que los modelos complejos proporcionen resultados más ajustados que los más simples. Mandel (2004) utiliza el denominado “Método de los Análogos” que combina el uso de información objetiva y juicios subjetivos. Mazzi y Savio (2005) comparan la calidad de X-12-Regarima y Tramo-Seats en el ajuste estacional de series cortas, si bien no abordan problemas de predicción. Concluyen que ambos procedimientos se deterioran cuando las series se acortan, especialmente en el paso de series largas a series de longitud media. Asimismo, señalan que X12 funciona algo mejor que Tramo-Seats, debido a la inestabilidad de los enfoques basados en modelos cuando se va perdiendo información. Mendoza y de Alba (2006) se plantean predecir un valor acumulado anual de una variable positiva y continua cuando sólo están disponibles sumas parciales y se puede aceptar la hipótesis que denominan de “estacionalidad estable”. Como puede verse, se trata de una predicción coyuntural, en el sentido de que sólo trabaja en el año “corriente” esto es, el año en que disponemos de datos parciales. 2 Obviamente, sin más que redefinir el concepto de año, puede aplicarse a periodos más prolongados. Además, aunque el procedimiento sólo predice el acumulado anual, calculando diferencias y redefiniendo convenientemente el año, podría utilizarse para predecir los valores de los meses consecutivos al último conocido. El modelo que proponen es un modelo bayesiano jerárquico normal-gamma que conduce a una solución explícita y no iterativa que puede implementarse sin dificultad en un ordenador personal. Queda por resolver la asignación de valores a los parámetros que intervienen en las distribuciones a priori. Los autores del trabajo proponen la utilización de distribuciones a priori no informativas, neutrales en el sentido de Jeffreys (véase, p. ej., Box y Tiao, 1973). Sugieren para ello dos argumentos; primero, que distribuciones a priori informativas dominarían a las inferencias, haciendo relativamente irrelevantes los datos muestrales. En segundo lugar, la distribución no informativa correspondiente (Bernardo y Smith, 1994) sería el límite de distribuciones normal-gamma y, en consecuencia, no se apartaría de la línea de razonamiento de los autores. Nuestra propuesta, en la línea de Rojo y Sanz (2004, 2005) intenta completar el trabajo de Mendoza y de Alba, mediante la utilización de distribuciones a priori informativas. En efecto, a veces se dispone de valores anteriores de la misma magnitud, no enlazables por haberse producido un cambio de base contable. Otras veces, cuando la serie no dispone de “historia”, se conoce una serie vicaria o “proxy” que puede ser válida a los efectos de determinar los parámetros de las distribuciones a priori. En estos casos, ciertamente la información a priori modificará la proporcionada por la verosimilitud, pero ayudará a evitar que las irregularidades de los datos, caso de presentarse, constituyan la única información disponible. 2. El modelo de Mendoza y de Alba Resumamos el modelo de Mendoza y de Alba. Se supone que para los n primeros años (aquí la palabra año sirve para denominar a la baja frecuencia, pero podría tratarse de un trimestre, un mes o una semana) conocemos los valores anuales de una magnitud flujo 3 positiva y continua, X 1 ,K , X n , y que, para cada uno de los años 1,2, K, n, n + 1 , conocemos el valor acumulado en una parte inicial, α , del año, Yiα , i = 1,2,K, n, n + 1 , donde 0 < α < 1 . Por ejemplo, si el año es un año natural y los periodos de alta frecuencia son los meses, tomaremos α = 3 / 12 = 0.25 si conocemos los datos correspondientes a los tres primeros meses. El objetivo es la estimación de X n +1 , el acumulado anual del año incompleto. La técnica propuesta utiliza datos acumulados, esto es, sirve para variables flujo. No obstante, puede emplearse también para variables-nivel, como veremos en la aplicación descrita posteriormente. La brillante idea de los autores consiste en escribir, condicionado por Yiα = yi , i =1,2,K, n, n + 1 (que son cantidades conocidas), ⎧ X − yi ⎫ X i = yi ⎨1 + i ⎬ = yi (1 + Wi ) , i = 1,2,K, n + 1 yi ⎭ ⎩ donde Wi es el cociente de la parte de X i no observada sobre la observada. La hipótesis de estacionalidad estable se concreta en la aceptación de que las variables Wi , i =1,2,K, n, n + 1 son independientes e idénticamente distribuidas. Mendoza y de Alba proponen entonces, a la vista de la naturaleza positiva de las variables una distribución log-normal. En concreto, si llamamos U i = ln Wi , i =1,2,K, n, n + 1 , suponemos que U i a NIID( µ ,τ ) , i =1,2,K, n, n + 1 , esto es, la distribución de X i condicionada por Yiα = yi , es una ( X i | Yiα = yi ) a log − NIID( µ + ln yi ,τ , yi ) log-Normal de tres parámetros, donde yi es el parámetro de umbral (Johnson et al., 1994, capítulo 14). 4 La estimación bayesiana propuesta por los autores, supone una distribución a priori normal-gamma para ( µ ,τ ) , esto es1, π (τ ) a γ (a, b) y π ( µ | τ ) a N (m, kτ ) , donde kτ es la precisión, con lo que π ( µ , τ ) = π ( µ | τ ) ⋅ π (τ ) ∝ τ 1 / 2 e − ( k τ / 2 )( µ − m ) ⋅τ a − 1e − b τ 2 siendo a , b , k y m constantes conocidas. Desde ahí, y teniendo en cuenta la verosimilitud normal se obtiene p( µ ,τ | u ( n ) ) = p( µ | τ , u ( n ) ) p (τ | u ( n ) ) ∝ (k*τ )1 / 2 e − ( k*τ / 2 )( µ − m* ) ⋅τ a* −1e −b*τ 2 donde u( n ) = (u1 ,K, un ) es una realización de U ( n ) = (U1 ,K,U n ) , y donde m* = km + nu , k +n y siendo u = 1 n ∑ ui n i =1 k* = k + n , n , 2 a* = a + b* = b + Suu kn(u − m) 2 + 2 2(k + n) [1] n y Suu = ∑ (ui − u ) 2 . i =1 Mendoza y de Alba obtienen, en consecuencia, la distribución predictiva de U n +1 , p(un +1 | u( n ) ) a Student (un +1 | m* ,τ * ,2a* ) donde τ * = k* a* y los parámetros de la distribución de Student son la posición, 1 + k* b* precisión y grados de libertad, respectivamente. Obsérvese que la distribución predictiva para Wn −1 es una log-Student, que no posee momentos. La estimación de X n +1 se realiza entonces mediante la mediana de la distribución. Para el correspondiente intervalo se utilizan entonces los correspondientes cuantiles de la distribución. Véase Mendoza y de Alba (2006), pág. 785 para los detalles. 1 Consideraremos τ → γ ( a, b) entonces π (τ ) ∝τ a −1 e−bτ , para τ > 0 . 5 3. Asignación de valores a los parámetros de las distribuciones a priori El problema planteado a Mendoza y de Alba es la asignación de valores a los parámetros implicados en las distribuciones a priori. En concreto, se trataría de asignar valores a a , b , k y m . Los autores optan por la selección de una distribución neutral a priori no informativa, esto es, a tomar π ( µ ,τ ) ∝ τ −1 Si comparamos esta expresión con la distribución a priori conjunta obtenida anteriormente, la opción tomada equivale a utilizar k = 0 , b = 0 , a = −1 / 2 y m igual a un valor cualquiera. En definitiva, se trata de sustituir las expresiones de [1] por m* = u , k* = n , a* = n −1 , 2 b* = Suu 2 donde ahora los grados de libertad de la t de Student que constituye la distribución predictiva son n − 1 y τ * = n n −1 . n + 1 Suu Los autores justifican esta elección en aras de evitar que la información inicial domine a la verosimilitud, más aún ante la escasa información muestral disponible. Nuestra propuesta consiste en que, como dijimos en la Introducción, con frecuencia disponemos de una serie que puede servir de proxy para la que se quiere predecir, al menos en cuanto a que puede aceptarse que reproduce la estacionalidad estable de la serie a predecir. Esta serie puede ser la misma anteriormente a un cambio de sistema de referencia, o bien la existente para otra desagregación geográfica (por ejemplo, la serie existente en el ámbito nacional, cuando la serie en estudio corresponda al ámbito regional o provincial). 6 Una ventaja de este procedimiento es la posibilidad de introducir información relevante sobre los valores aceptables de los parámetros a través de la asignación de valores a las cuatro cantidades implicadas. Otra ventaja reside en que, con nuestra propuesta, mantenemos el modelo bayesiano jerárquico en la familia normal-gamma. En efecto, los valores a = −1 / 2 y b = 0 no son aceptables para la distribución a priori de τ (una distribución gamma exige valores positivos para a y b ) ni el valor k = 0 puede aceptarse para la distribución a priori π (µ | τ ) . Veamos cómo concretar nuestro procedimiento. Puesto que la distribución a priori de τ es una gamma, es conocido (véase, por ejemplo, Broemeling (1985) o Zellner (1971)) que los momentos principales para τ −1 son [ ] Eπ τ −1 = b (a > 1) a −1 y Varπ (τ −1 ) = b2 (a > 2) (a − 1) 2 (a − 2) [2] Por otro lado, obtengamos la distribución marginal de u ( n ) . La distribución conjunta de (u( n ) , µ ,τ ) es ⎧ ⎩ π (u( n ) , µ ,τ ) ∝ τ a +1/ 2−1+ n / 2 exp ⎨−bτ − kτ τ ⎫ ( µ − m) 2 − ∑ (ui − µ ) 2 ⎬ 2 2 ⎭ que puede escribirse como (km + nu ) 2 ⎤ ⎪⎫ ⎪⎧ τ ⎡ π (u( n ) , µ ,τ ) ∝ τ a + n / 2−1/ 2e−bτ ⋅ exp ⎨− ⎢ km 2 + ∑ ui2 − ⎥⎬⋅ ⎩⎪ 2 ⎣ k +n ⎦ ⎭⎪ 2 ⎧⎪ τ (k + n) ⎛ km + nu ⎞ ⎫⎪ µ ⋅ exp ⎨− − ⎜ ⎟ ⎬ 2 ⎝ k + n ⎠ ⎪⎭ ⎩⎪ Integrando dicha expresión en µ , la integral de la última exponencial es proporcional a τ −1 / 2 , de donde 7 ⎧⎪ τ ⎡ (km + nu )2 ⎤ ⎫⎪ π (u( n ) ,τ ) ∝ τ a + n / 2−1e−bτ exp ⎨− ⎢ km2 + ∑ ui2 − ⎥⎬ k+n ⎪⎩ 2 ⎣ ⎦ ⎭⎪ que, integrando en τ resulta π (u( n ) ) ∝ 1 ⎡ (km + nu ) 2 ⎤ 2 2 2 + + − b km u ∑i ⎢ k + n ⎥⎦ ⎣ a+n / 2 Simplificando esta expresión se comprueba sin dificultad que es una distribución de Student n-variante2, con 2a grados de libertad, matriz de posición m ⋅ ι y matriz de covarianzas Cov(u( n ) ) = 1 ⎤ b ⎡ I n + ⋅ ιι '⎥ ⎢ a −1 ⎣ k ⎦ donde ι = (1,K,1)' es una matriz columna de dimensión n e I n es la matriz identidad. Se deduce, por tanto, que E [ui ] = m , i = 1,K , n [3] (hecho que hubiera podido derivarse de que, como E[u( n ) | τ ] = m , se cumple que E[u( n ) ] = Eτ ⎣⎡ E[u( n ) | τ ]⎦⎤ = m ) y que Var ( ui ) = b ⎛ 1⎞ ⎜1 + ⎟ , a −1 ⎝ k ⎠ i = 1,K , n (este hecho también hubiera podido derivarse de que Var (ui ) = Eτ [Var (ui | τ )] + Varτ ( E [ui | τ ] sustituyendo las expresiones correspondientes). 8 [4] Las expresiones [2], [3] y [4] permitirán asignar valores razonables a los parámetros implicados en las distribuciones a priori ( a , b , k y m ) siempre que dispongamos de información “histórica”. Supongamos, en concreto, que conocemos r valores, u1h , K , urh , donde el superíndice “h” quiere decir “histórico”. Pueden ser valores calculados a partir de una serie proxy, tal vez valores de la misma serie en otra base metodológica diferente, o de una serie con la misma definición, construida para un espacio geográfico con similar comportamiento tendencial y estacional. Obtenemos s muestras con reemplazamiento de tamaño r mediante bootstrap (véase Efron y ( ) h ( ) Tibshirani, 1993), y para cada una de ellas obtenemos sus varianzas, τˆ −1 ,K, τˆ −1 1 h s . ) La media de estos valores es una asignación o estimación de E ⎡⎣τ −1 ⎤⎦ , E ⎡⎣τ −1 ⎤⎦ , y su ) cuasi-varianza es una asignación o estimación de Var τ −1 , Var τ −1 . Ello permite ( ) ( ) asignar valores a a y b utilizando la expresión [2], en concreto, ) E 2 ⎡⎣τ −1 ⎤⎦ a = 2+ ) Var τ −1 ( ) y ) b = (a − 1) ⋅ E ⎡⎣τ −1 ⎤⎦ Por otro lado, si llamamos cuasi varianza, sch = 2 u h a la media de los valores históricos, u h = ( ) 1 r h u y sch2 a su ∑ j =1 j r 2 h 1 h h u − u , podemos asignar ∑ j r − 1 j =1 m = uh y k= b (a − 1)sch2 − b utilizando, en este caso, las expresiones [3] y [4]. 4. Una aplicación del procedimiento En este apartado presentamos una aplicación del procedimiento. Tomaremos como serie a estimar el total de parados nacional proporcionado por la Encuesta de Población 2 Tomaremos la definición propuesta por Zellner, 1971, pp. 383. 9 Activa (E.P.A.) del INE. Se trata de una serie trimestral, para la que se dispone de datos desde para el periodo (1996:1, 2008:1). Los datos de paro desde el primer trimestre de 2001 en adelante reflejan la nueva definición de parado establecida en el Reglamento 1897/2000 de la CE por lo que la serie homogénea cubre sólo el periodo (2001:1, 2008:1). La ilustración que presentamos en este epígrafe propone estimar el paro medio en el año 2008. Obsérvese que la serie es un nivel, y no un flujo, lo que no obsta para la aplicación del procedimiento, ya que el paro medio es la cuarta parte de la suma, por lo que el método (preparado para flujos) puede utilizarse. Figura 1 4000 3000 2000 1000 La Figura 1 muestra la ruptura en la serie entre 2000:4 y 2001:1 Por ello, las estimaciones deben realizarse teniendo en cuenta únicamente el periodo homogéneo, (2001:1, 2008:1). En la Figura 2 se muestran siete curvas, una para cada año i de este periodo, en las que se representan los cocientes Yiα / X i para las abscisas 1 ( α = 1 / 4 ), 2 ( α = 2 / 4 ), 3 ( α = 3 / 4 ) y 4( α = 1 ). Puede verse que, aunque no es objeto de contraste, la figura permite apreciar que aproximadamente se cumple la denominada “estacionalidad estable”, esto es, las curvas no son muy diferentes. 10 Figura 2 1,2 1,0 0,8 0,6 0,4 0,2 0,0 1 2 3 4 Para la asignación de valores a los parámetros de las distribuciones a priori, utilizaremos la “historia” de la serie, anteriormente al cambio metodológico, esto es, el periodo (1996:1, 2000:4). Con las notaciones del apartado 3, disponemos de cinco valores, α ⎛ ⎞ h h X −Y u1996 ,K, u2000 , donde uih = ln ⎜ i α i ⎟ para cada uno de los años históricos. ⎝ Yi ⎠ Hacemos 200 réplicas de tamaño 5 con reposición, y de acuerdo con la expresión [2], asignamos valores a los parámetros a priori. Obtenemos como estimación del paro medio en 2008, xˆ2008 = 2013.77 , muy similar al obtenido con las distribuciones neutrales a priori del trabajo de Mendoza y De Alba (2103.80 desempleados), si bien los intervalos al 95% son diferentes ([2011.26, 2202,13] en nuestro caso, y [1934,17, 2294,12] con las a priori neutrales). 11 Si se trabaja a más corto plazo, el procedimiento permite estimar valores en los sucesivos trimestres. Por ejemplo, podemos estimar el paro total en el segundo trimestre de 2008, sin más que tomar como años los dos primeros trimestres de cada año natural y repetir el procedimiento. Obtendríamos la suma (o la media) de ambos trimestres para 2008, y puesto que la estimación está condicionada por el valor del primer trimestre, por diferencias obtenemos el correspondiente al segundo así como el intervalo al 95%. El resultado obtenido es de xˆ 2008:II = 2076.57 (2075.24 para el procedimiento de Mendoza y De Alba) con intervalo al 95% [1983.33, 2174.20] ([1977.47, 2177.84] para dichos autores). Finalmente, hemos realizado una réplica del procedimiento para 2007, año en el que los valores anuales son conocidos. La réplica se realiza con nuestro procedimiento y con el de Mendoza y De Alba, en tres situaciones, según que el último trimestre conocido fuera el primero, segundo o tercero. Tabla 1 Último Rojo y Sanz Mendoza y De Alba Trimestre q q conocido 0.025 1 1710.73 2 1730.41 3 1781.90 Valor observado =1833.90 0.5 0.975 0.025 0.5 0.975 1789.76 1782.49 1800.07 1873.79 1837.84 1819.00 1630.00 1662.04 1759.73 1789.78 1782.80 1800.07 1971.46 1922.81 1844.39 La Tabla 1 muestra los resultados que, para nuestro procedimiento se ilustran en la Figura 3. 12 Figura 3 1900 1800 1700 1 2 Media2007 q=0.5 3 q=0.025 q=0.975 En esta figura, la línea continua representa nuestra estimación, mientras que las discontinuas presentan el intervalo. Incluimos una horizontal de trazo más grueso con el valor medio (conocido) del año 2007. Puede verse que, si bien la precisión de la estimación aumenta cuando la información trimestral es mayor, se produce un cierto sesgo que conduce a que el intervalo no incluya el valor medio conocido. Este hecho se debe, por un lado, al alto nivel de confianza (de credibilidad) adoptado, pero también a irregularidades en la estabilidad de la estacionalidad. 5. Conclusiones En este trabajo hemos estudiado la mejora en el método de Mendoza y De Alba (2006) para estimar totales anuales de series cuando sólo se conocen acumulados parciales. El método exige la aceptación de la hipótesis de “estacionalidad estable”, y propone un modelo bayesiano jerárquico normal-gamma con distribuciones a priori no informativas en el sentido de Jeffreys. 13 Nuestra propuesta permite utilizar distribuciones a priori informativas cuando la serie haya sido objeto de un cambio de base o, en general, cuando se disponga de una serie proxy o vicaria de la que se quiere estimar. En esas situaciones, pueden asignarse valores adecuados a los parámetros incluidos en las distribuciones a priori. La consecuencia de ello es la mejora en las estimaciones y, especialmente en su precisión. El trabajo concluye con la utilización de la serie española de Desempleados totales proveniente de la E.P.A. del I.N.E. En el año 2001 se modificó la definición de desempleados, especialmente en relación con la búsqueda activa de empleo. Ello ocasionó una ruptura metodológica de la serie, con lo que las predicciones del Total de Desempleados debían apoyarse en una serie excesivamente corta. Nuestra aplicación estima el número medio de desempleados en 2008 a partir de los datos del primer trimestre, y lo compara con los resultados de aplicar el método de Mendoza y De Alba. En este caso, la introducción de una distribución a priori informativa no modifica básicamente la estimación, aunque mejora sustancialmente la precisión para un mismo nivel de riesgo (valor de α ). La aplicación muestra asimismo cómo utilizar el procedimiento para análisis más coyunturales, en concreto, para estimar el Total de Desempleados en el segundo trimestre, en lugar del promedio anual. Bibliografía Bernardo, J.M. y Smith, A.F. (1994): Bayesian theory. New York: Wiley. Box, G.E.P. y Tiao, G.C. (1973): Bayesian Inference in Statistical Analysis Addison Wesley, Reading, Mass. Broemeling, L.D. (1985): Bayesian Analysis of linear Models, Marcel Dekker, Inc. New York. Efron, B. y Tibshirani, R.J. (1993): An Introduction to the Bootstrap. Monographs on Statistics and Applied Probability 57. Chapman and Hall: New York. Johnson, N.L., Kotz, S. y Balakrishnan, N. (1994): Continuous univariante distributions (2nd ed.). New York: Wiley & sons. Mandel, A.S. (2003): “Method of Analogs in Prediction of Short Time Series: An Expert-statistical Approach” en Automation and Remote Control MAIK Nauka, Vol 65, nº 4, pp. 634-641. 14 Mazzi, G.L. y Savio, G. (2005): “The Seasonal Adjustment of Short time series” en Working Papers and Studies, European Commission. Mendoza, M. y de Alba, E. (2006): “Forecasting an accumulated series based on partial accumulation II: A new Bayesian method for short series with stable seasonal patterns”. International Journal of Forecasting, Vol. 22, pp. 781-798 Rojo, J.L. y Sanz, J.A. (2004): “Desagregación espacial para pequeñas áreas: un modelo bayesiano normal-gamma”. Estudios de Economía aplicada. 22-III, pp. 487-516. Rojo, J.L. y Sanz, J.A. (2005): “A Bayesian benchmarking method with applications to the Quarterly National Accounts”. Luxembourg: Office for Official Publications of the European Communities (ISSN 1725-4825; Cat. No. K3-DT-05-013-EN-N). European Communities, 2005. Yu, G. y Schwartz, Z. (2006): “Forecasting Short Time-Series Tourism Demand with Artificial Intelligence Models”, en Journal of travel Research 2006; 45; 194. Zellner, A. (1971): An Introduction to Bayesian Inference in Econometrics, J. Wiley & Sons, Inc. N. York. 15