DATAWAREHOUSE Qué es Desde un punto de vista de empresa, un sistema Datawarehouse es un tipo especial de sistema para soporte de decisiones de negocio, basado en algunas de las más modernas tecnologías de bases de datos. Quizás lo más novedoso del concepto está en que rompe con el paradigma hasta ahora imperante de que lo importante en cuanto a la gestión de datos en una compañía es acumularlos, y lo transforma en el sentido de que resulta esencial ponerlos a disposición de los usuarios. Desde un punto de vista más técnico podríamos decir que un sistema Datawarehouse es el que transforma los datos orientados a las aplicaciones en datos de soporte a las decisiones, y donde los datos que se incorporan vienen tanto de los diversos sistemas de información de la empresa como de fuentes externas. Como ocurre con toda tecnología en boga, no faltan desarrollos más o menos estándar aplicables a cualquier empresa. Y no sólo a las grandes. Ejemplos de lo que está pasando los podemos encontrar en el hecho de que en que en estos últimos días, Hewlett Packard ha lanzado al mercado una solución integral de Datawarehouse que incluye hardware y software, a un precio claramente enfocado a PYMES, o en que una gran parte de los usuarios de SQL Server de Microsoft están implementando sistemas de este tipo. Pero aunque comienzan a aparecer soluciones claramente enfocadas a Datawarehouse, es importante tener claro que DataWarehousing es mucho más un proceso de elaboración de la información que un producto comercial específico, porque esta confusión será el comienzo de un fracaso. Qué elementos lo componen Vista la definición anterior, para hablar de un Datawarehouse en sentido estricto, estaríamos ante un sistema que conjugara como mínimo los siguientes elementos: 1. Archivos de Bases de datos residentes en el sistema que soporta la gestión de la compañía, o procedentes de fuentes externas a la empresa. Pueden ser tanto los provenientes de un mainframe que soporte un esquema de transacciones en línea, como los datos externos adquiridos por un departamento de Marketing, etc. 2. Herramientas que efectúen las labores de extracción de datos desde las fuentes y ayuden a su transformación y reorganización, como pasos previos a su depósito en el “repositorio” o “Target”, que, para entendernos, será el almacén donde se vuelquen los datos una vez preparados. 3. Un repositorio de datos sobre un servidor, entendiendo por tal no una determinada arquitectura de máquina, sino simplemente un ordenador que maneje una base de datos, y que sea capaz de poner los datos a disposición de las personas que posteriormente los analizan. Si habláramos de modelo cliente-servidor, sería el “Back-end” o parte trasera de la aplicación. 4. Herramientas Front-End, utilizadas por los profesionales en negocios, para el acceso y análisis de los datos. Habitualmente, muy sencillas de operar por los usuarios de negocio, y desarrolladas en entorno gráfico. Para una gran mayoría de potenciales usuarios estaríamos hablando de algo tan sencillo como Microsoft Excel y sus Tablas Dinámicas. ¿Qué aportan? En una época donde comenzamos a considerar que una de las principales ventajas competitivas puede estar en el manejo eficiente de la información, la respuesta es sencilla: aportan facilidad e inmediatez en el manejo de la información por parte de quien realmente la necesita, que es el ejecutivo que debe tomar las decisiones. Cuando un sistema de este tipo está correctamente diseñado, no hay necesidad de reuniones con el Director de Sistemas de Información para solicitarle una información que nunca estuvo prevista, que colapsará a su personal, y que llegará, en el mejor de los casos, varios días después de haber sido solicitada. Este tipo de caóticos escenarios se observan a diario en empresas que viven de la información que le es proporcionada por un sistema de información tradicional, donde lo que está previsto es aquello que afecta a la operación del negocio y poco más. Cuando el Director de Marketing quiere saber cuantos productos del tipo A se vendieron en las cinco divisiones geográficas de la compañía durante un periodo de tiempo específico, la respuesta es la cara de horror del responsable de Sistemas de Información, que comienza a tener pesadillas donde se ve a sí mismo organizando turnos de noche para poder volcar los datos del ordenador central y convertirlos en algo mínimamente comprensible para un Departamento que no es el suyo, y donde los usuarios no conocen otras cosas que la microinformática. Si por el contrario, la empresa en cuestión tuvo el buen tino de instalar a tiempo un sistema de Datawarehouse, el Director de Marketing, el Financiero, o cualquier otro ejecutivo que necesite información estará en una posición idílica de independencia con respecto al Departamento de Sistemas. Le bastará encender su PC, y hacer desde su mesa la pregunta que necesite, obteniendo respuesta inmediata del sistema. En definitiva, las ventajas son dos: facilidad de acceso a la información que soporta la toma de decisiones de negocio, e independencia del usuario final frente al Departamento de Sistemas. ¿Qué precauciones tomar? A juicio de Inmon, que es el creador del término, la clave con respecto a estos sistemas está en el denominado Data Storage Environment o entorno de almacenamiento de los datos, que absorbe en torno al 80% del esfuerzo necesario. Si optamos por una solución que no incluya la automatización de los procesos de mantenimiento, puede que obtengamos un coste inicial menor, pero es seguro que el coste de administración se disparará a medida que aumente el volumen de información gestionada por el sistema. Para seleccionar adecuadamente las herramientas de soporte y automatizar los procesos del sistema, deberemos tener en cuenta como mínimo que: El volumen de información procesada crecerá constantemente. Deberemos tener prevista la incorporación de nuevos datos y la absorción de los posibles cambios en los datos fuentes. Debemos implementar el sistema sobre tecnologías abiertas y motores de bases de datos relacionales, aun cuando las fuentes no lo sean. Cumpliendo con estas mínimas precauciones estaremos mucho más cerca de un sistema ideal, que será: Escalable y capaz de absorber crecimientos en la información. De fácil acceso por los usuarios, y flexible en sus respuestas. Que no interfiere en los procesos transaccionales que soportan el negocio.