Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica Experiencia: Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends TEMAS CLAVE Servicios (Big Data). PALABRAS CLAVE Economía, Indicadores Sectoriales, Google Trends, Servicios, Big Data, Información, Previsión, Nowcast LOCALIDAD, PAÍS REGIÓN Colombia, Suramérica ENTIDADES PARTICIPANTES Ministerio de Hacienda y Crédito Público: Entidad Nacional, Sector Gobierno ESTADO Implementación http://www.minhacienda.gov.co/HomeMinhacienda/ politicafiscal/reportesmacroeconomicos/Google_Trends FECHA DE INICIO IMPLEMENTACION 2013 Los indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) se elaboran con el apoyo de análisis de Big Data provenientes de Google Trends y otras variables exógenas, logrando pronósticos de mayor calidad, por ejemplo en la estimación de tendencias en el crecimiento del PIB Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 2 Justificación, población, objetivo y contexto LA OPORTUNIDAD QUE SE DESEABA APROVECHAR: Para el diseño de la política económica es deseable contar con estadísticas confiables que permitan monitorear constantemente, y en tiempo real, la actividad sectorial. En Colombia el Sistema de Cuentas Nacionales sigue siendo la principal herramienta para esta tarea pues, en efecto, permite hacer un seguimiento periódico a las 49 ramas en que se descompone la actividad económica nacional. Sin embargo, la publicación de los indicadores de actividad con los que el Departamento Administrativo Nacional de Estadística (DANE)1 construye el PIB por el lado de la oferta tiene un rezago promedio de diez semanas. 1 Dada esta importante limitación, hay una necesidad de contar con indicadores líderes que permitan hacer un seguimiento de las tendencias de corto plazo de la actividad económica sectorial. En Colombia se contaba con metodologías para el cálculo de indicadores líderes que se anticipan a la publicación del PIB nacional y a las variables monetarias y crediticias directamente relacionadas2, pero se carecía de un mecanismo análogo para el caso sectorial. establecer solo mucho después de generada la actividad3. POBLACIÓN QUE SE BUSCABA IMPACTAR Políticos, empresarios, inversores, economistas, analistas, periodistas, y en general, cualquier persona o entidad que requiera de información actual del comportamiento de la actividad económica sectorial en Colombia para diseñar una política o estrategia, tomar una decisión, realizar una acción, hacer un análisis, etc. Esto, principalmente, porque la información secundaria sobre las ramas de actividad económica es muy escasa, ya que la compilación de la información en los sectores reales como la industria, el comercio, la construcción y la minería se pueden EL DANE es la Entidad Nacional encargada de esta DANE del indicador del PIB, y el ALI de la Asociación 3 Nacional de Instituciones Financieras (ANIF), que analiza el monetarias, cambiarias y crediticias, que en general Estos indicadores son el IMACO que mensualmente comportamiento de información del sector real y de proceden de sistemas de información que reportan en medición. 2 El rezago en la publicación de las cifras oficiales dificulta la toma de decisiones y retrasa la ejecución de políticas que responden al comportamiento económico. publica el Banco Central de Colombia (Banco de la variables monetarias y crediticias. Caso contrario a lo que sucede con las variables tiempo real el desempeño de los mercados. República) y se anticipa 6 meses a la publicación oficial del Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 3 FACTORES IMPULSORES La herramienta Google Trends, creada por Google Labs produce estadísticas diarias y semanales sobre el volumen de búsquedas en los diversos temas, desde el año 2004. Los reconocidos economistas Hal Varian y Hyunyoung Choi4 han señalado en diferentes estudios, desde el año 2009, que los datos de Google Trends sobre el volumen de búsquedas relacionadas con diversas industrias, pueden correlacionarse con el nivel actual de la actividad económica en determinadas industrias y por lo tanto pueden ser útiles para el pronóstico de la situación presente (lo que denominan nowcast, en contraste con el término forecast)5. Los primeros pasos El Ministerio de Hacienda y Crédito Público de Colombia, se interesó en los hallazgos y la propuesta de los economistas de Google, y encargó, en el año 2013, a la Dirección General de Política Macroeconómica de este Ministerio, que analizara y explorara la posibilidad de aplicabilidad en la generación de indicadores líderes en Colombia sobre la actividad económica sectorial, adelantándose a las cifras oficiales del DANE. En 2011 estos autores publicaron una metodología para este tipo de análisis y han realizado predicción en tiempo real a varios sectores como el de ventas de automóviles. El primer paso de los investigadores fue observar la representatividad de la información de Google Trends. La gran utilidad de las estadísticas, brindadas por Google Trends, radica en que pueden ser comparables y generalizables para un conjunto amplio de sectores y además su disponibilidad es inmediata, con un nivel mínimo de rezago. 4 5 A diciembre del 2012 el 83,8% de las búsquedas por Internet en el mundo se realizaron a través de Google, en Colombia, esta proporción ascendió a 96,1% en este mismo período6. Es decir, prácticamente todas las palabras que describen lo que se busca actualmente por Internet en el país pasan a través de este buscador. Google guarda toda la información de búsquedas y la indexa, por lo que ha ido volumen de consultas de cierto bien en particular durante No afirman que haciendo uso de Google Trends se pueda de ese mes para ese producto. predecir el futuro, sino predecir el presente. Por ejemplo, el Los analistas concluyeron entonces que este gran volumen de información podía permitir monitorear en tiempo real las tendencias de diversos mercados nacionales . El proyecto estuvo a cargo del Director General de Política Macroeconómica y contó con la participación de varios de los economistas que conforman el equipo de esta Dirección. Economista en Jefe y Economista Senior de Google Inc., respectivamente. consolidando quizás la fuente de información comercial más grande que existe. un mes, puede ser útil para predecir el informe de ventas 6 Estadísticas del sistema NetMarketShare de Net Applications. Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 4 Diseño, desarrollo y difusión EL PROCESO LLEVADO A CABO Y LA SOLUCIÓN Para el desarrollo del proyecto, lo primero que se hizo fue buscar ejemplos puntuales de la relación de Google Trends y la actividad económica colombiana. Esta relación se analizó a partir de la relación entre las búsquedas de palabras clave7 y el comportamiento de la actividad económica de algún sector específico. Los resultados fueron muy interesantes, por ejemplo, se puede encontrar una relación importante y directa entre la palabra “cine” o la palabra “Chevrolet” y el comportamiento del sector comercio minorista. Detrás de estas relaciones está la posible explicación de que, por un lado, uno de los sectores que generan más dinamismo al comercio minorista es el cine, dado que se asocia a un gasto en entretenimiento que impulsa el consumo interno. 7 Google Trends brinda índices de frecuencia de búsqueda de determinadas palabras en Google durante un lapso de tiempo específico y en una determinada zona geográfica, como proporción del total de búsquedas realizadas con las Por otro lado, la búsqueda de Chevrolet, la marca de automóviles nuevos más vendidos en Colombia, se relaciona con la compra de vehículos, estimulando el comercio automotriz. Teniendo en cuenta que el uso de Internet en Colombia, alcanza al 50% de la población, la información extraída sobre lo que es más buscado en la red, es un indicador importante de la percepción de los consumidores. La población cubierta es incluso mayor a la utilizada para las estimaciones del DANE y la información se obtiene de manera más acelerada, por lo que se encontró que Google Trends podría permitir hacer pronósticos acertados en el país. Se identificó que para los sectores de agricultura, industria, comercio, construcción y transporte sí era relevante la información de Google Trends. Como se requería hacer un cubrimiento de todos los sectores se identificaron variables exógenas que permiten aproximarse, con poco rezago, al desempeño de los sectores de minería; servicios financieros; servicios personales; provisión de electricidad, gas y agua; impuestos. Para los cinco sectores identificados, se construyeron series de tiempo de variables que permiten describirlos (series de búsquedas en Google de palabras relacionadas con la actividad)8. Como segundo paso, se establecieron los sectores susceptibles de estimar haciendo uso de Google Trends, pues algunos sectores no tienen una relación lógica con un sistema de búsquedas. A partir de este punto, se obtuvieron los Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) en cada una de las ramas de la actividad económica. mismas características de espacio y tiempo (los valores del 8 índice de búsqueda de cada palabra van de 0 a 100 donde del sector, gremios y actividades relacionadas, las cuales 100 es la máxima frecuencia de búsqueda). pueden afectar positiva o negativamente el desempeño del Las palabras se refieren a marcas de insumos o productos sector. Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 5 Estos indicadores permiten monitorear el comportamiento que en cada momento del tiempo presenta el PIB sectorial, específicamente, son una medida del crecimiento del PIB mensualizado de cada sector. Los indicadores ISAAC tienen dos funciones principales: por un lado, señalar cuál es el crecimiento puntual esperado para cada sector y, por otro, identificar el momento del tiempo en el cual se presenta un cambio (quiebre) en la tendencia del crecimiento. Para comprobar el cumplimiento de estas funciones, en primera instancia, se hizo una comparación en retrospectiva entre las estimaciones de los indicadores ISAAC, utilizando este método, y el del crecimiento del PIB sectorial observado. La comparación se hizo para cada sector, dependiendo de la disponibilidad de la información, entre los años 2006 – 2009. Los resultados muestran que los indicadores ISAAC reflejan de manera satisfactoria las tendencias y los quiebres del PIB de cada sector. Se concluyó que los ISAAC revelan, en tiempo real y sin ningún rezago, la tendencia de corto plazo del PIB sectorial, y por lo tanto, permiten prever quiebres en la tendencia y los comportamientos inesperados. real un cambio en el comportamiento de corto plazo de la economía colombiana. En segunda instancia, se realizaron estimaciones trimestrales (a partir del cuarto trimestre de 2012) del PIB sectorial y se comparó con el PIB observado, para evaluar el desempeño predictivo de los ISAAC para cada sector. Finalmente, se realizaron distintas pruebas de robustez y una comparación con otros indicadores líderes en el país. Se encontró que la diferencia entre el pronóstico y el valor observado parece ser importante, aunque los pronósticos sí capturan la tendencia de la serie, así como los puntos de quiebres. Adicionalmente, se construyó un indicador para el PIB total (denomino ISAAC+), haciendo uso de los ISAAC sectoriales estimados a partir de Google Trends y de los estimados con variables exógenas. La estimación del ISAAC+ se hizo desde el 2009 y al compararlo con el PIB observado se encontró que el primero efectivamente refleja la tendencia de crecimiento del PIB y, más relevante aún, que captura los puntos de quiebre. Este hallazgo evidencia el buen desempeño predictivo de este indicador. Se concluyó que el ISAAC+ permite anticipar casi en tiempo Se encontró un buen desempeño comparativo del ISAAC, mostrando que es un indicador que está al mismo nivel de otros indicadores líderes, con la gran ventaja de que permite obtener información económica desagregada por sector. Es así, como a partir del tercer trimestre de 2013, el Ministerio de Hacienda y Crédito Público de Colombia, logra poner a disposición del público, tan pronto termina cada trimestre, indicadores de la tendencia de cada uno de los sectores de la economía y un pronóstico sobre el resultado del PIB sectorial, donde se puede apreciar si el crecimiento del sector fue superior, similar o inferior al trimestre anterior. La contrastación posterior con los valores observados del PIB muestra cómo, cada trimestre, este pronóstico ha venido mejorando Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 6 Impacto, evolución y aprendizajes PRINCIPALES LOGROS Esta experiencia tiene un alto grado de novedad al ser la primera vez que se hace una aplicación en Colombia a partir del buscador Google Trends, que es una herramienta que brinda un gran volumen de información valiosa y permite hacer un seguimiento de bajo costo y en tiempo real de la producción de una economía. Es una muestra del aprovechamiento del potencial del Big Data9, para analizar grandes volúmenes de información, producidas a gran velocidad, en la obtención de conocimiento de gran utilidad e impacto social. A partir del ISAAC ahora se cuenta en Colombia, con un mecanismo para hacer seguimiento de las tendencias de corto plazo de la actividad económica sectorial, generando predicciones en un corto espacio de tiempo, lo que facilita el diseño oportuno de la política económica. 9 ISAAC ha llamado la atención de la prensa económica nacional y latinoamericana. Los prestigiosos investigadores de Google, que inspiraron este desarrollo, se han mostrado interesados en conocer de cerca los resultados. Los investigadores de este proyecto fueron invitados principales en una conferencia del Banco Mundial, como ejemplo de uso pionero de Big Data en una institución oficial. También fueron invitados por Google Inc. a presentar el indicador en la sede de la empresa en Mountain View, California, EEUU. LO QUE SIGUE HACIA EL FUTURO La estimación de los ISAAC se continuará realizando y, en la medida en que se avance en la masificación del uso de Internet en el país, el análisis de pronóstico mediante Google Trends hará que los ISAAC sean cada vez más relevantes. PRINCIPALES APRENDIZAJES Uno de los obstáculos encontrados en el proceso de desarrollo de esta experiencia consiste en que varios de los sectores de la economía no son predecibles a partir de la información de búsquedas que brinda Google Trends. Sin embargo, afortunadamente se encontraron variables exógenas que permiten tener información actualizada sobre el desempeño de estos sectores con muy poco rezago. Uno de los problemas con los que se encontró el equipo que desarrolló este proyecto fue la lectura inadecuada que hizo la prensa al presentar como dato puntual una de las estimaciones realizadas. Frente a esto, el equipo insiste en señalar que los ISAAC predicen principalmente tendencias y puntos de quiebre inesperados, estando ahí su gran valor, y no, datos puntuales. El concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 7 COMPARTIENDO LA EXPERIENCIA El uso de Google Trends tiene un gran potencial en el análisis del comportamiento de cualquier economía. Algunos países latinoamericanos, como Perú, han conocido la experiencia de Colombia y se han planteado replicar la metodología. Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 8 Información adicional CONTACTE CON LOS PROMOTORES Santiago Pulido, Asesor de la Dirección General de Política Macroeconómica, Ministerio de Hacienda y Crédito Público de Colombia, (571) 381 1700 Extensión: 4318, [email protected]. FUENTES: Mejía, Luis Fernando; Monsalve, Daniel; Parra, Yesid; Pulido, Santiago; Reyes, Ángela, María (2013): “Indicadores ISAAC: Siguiendo la actividad sectorial a partir de Google Trends”, Notas Fiscales 22, Noviembre, Centro de Estudios Fiscales, Dirección General de Política Macroeconómica, Ministerio de Hacienda y Crédito Público, Bogotá. Pulido, Santiago (2014). Indicadores ISAAC: Siguiendo la actividad sectorial a partir de Google Trends. Presentación realizada en el marco del e-xperience 2014. Cartagena de Indias, diciembre 05 del 2014. ANEXOS: Anexo 1: Mejía, Luis F. et. al. (2013): “Indicadores ISAAC: Siguiendo la actividad sectorial a partir de Google Trends”. Notas Fiscales 22. Anexo 2: Pulido, Santiago (2014). Indicadores ISAAC: Siguiendo la actividad sectorial a partir de Google Trends. Presentación realizada en el marco del e-xperience 2014. Indicadores Sectoriales Adelantados de Actividad en Colombia (ISAAC) siguiendo la actividad sectorial a partir de Google Trends Uso de Big Data para la Previsión a Corto plazo de la Actividad Económica 9