Datawarehouse

Anuncio
DATAWAREHOUSE
Qué es
Desde un punto de vista de empresa, un sistema Datawarehouse es un tipo especial de sistema
para soporte de decisiones de negocio, basado en algunas de las más modernas tecnologías de
bases de datos. Quizás lo más novedoso del concepto está en que rompe con el paradigma
hasta ahora imperante de que lo importante en cuanto a la gestión de datos en una compañía
es acumularlos, y lo transforma en el sentido de que resulta esencial ponerlos a disposición de
los usuarios.
Desde un punto de vista más técnico podríamos decir que un sistema Datawarehouse es el
que transforma los datos orientados a las aplicaciones en datos de soporte a las decisiones, y
donde los datos que se incorporan vienen tanto de los diversos sistemas de información de la
empresa como de fuentes externas.
Como ocurre con toda tecnología en boga, no faltan desarrollos más o menos estándar
aplicables a cualquier empresa. Y no sólo a las grandes. Ejemplos de lo que está pasando los
podemos encontrar en el hecho de que en que en estos últimos días, Hewlett Packard ha
lanzado al mercado una solución integral de Datawarehouse que incluye hardware y software,
a un precio claramente enfocado a PYMES, o en que una gran parte de los usuarios de SQL
Server de Microsoft están implementando sistemas de este tipo.
Pero aunque comienzan a aparecer soluciones claramente enfocadas a Datawarehouse, es
importante tener claro que DataWarehousing es mucho más un proceso de elaboración de la
información que un producto comercial específico, porque esta confusión será el comienzo de
un fracaso.
Qué elementos lo componen
Vista la definición anterior, para hablar de un Datawarehouse en sentido estricto, estaríamos
ante un sistema que conjugara como mínimo los siguientes elementos:
1. Archivos de Bases de datos residentes en el sistema que soporta la gestión de la compañía,
o procedentes de fuentes externas a la empresa. Pueden ser tanto los provenientes de un
mainframe que soporte un esquema de transacciones en línea, como los datos externos
adquiridos por un departamento de Marketing, etc.
2. Herramientas que efectúen las labores de extracción de datos desde las fuentes y ayuden a
su transformación y reorganización, como pasos previos a su depósito en el “repositorio” o
“Target”, que, para entendernos, será el almacén donde se vuelquen los datos una vez
preparados.
3. Un repositorio de datos sobre un servidor, entendiendo por tal no una determinada
arquitectura de máquina, sino simplemente un ordenador que maneje una base de datos, y
que sea capaz de poner los datos a disposición de las personas que posteriormente los
analizan. Si habláramos de modelo cliente-servidor, sería el “Back-end” o parte trasera de
la aplicación.
4. Herramientas Front-End, utilizadas por los profesionales en negocios, para el acceso y
análisis de los datos. Habitualmente, muy sencillas de operar por los usuarios de negocio, y
desarrolladas en entorno gráfico. Para una gran mayoría de potenciales usuarios estaríamos
hablando de algo tan sencillo como Microsoft Excel y sus Tablas Dinámicas.
¿Qué aportan?
En una época donde comenzamos a considerar que una de las principales ventajas
competitivas puede estar en el manejo eficiente de la información, la respuesta es sencilla:
aportan facilidad e inmediatez en el manejo de la información por parte de quien realmente la
necesita, que es el ejecutivo que debe tomar las decisiones. Cuando un sistema de este tipo
está correctamente diseñado, no hay necesidad de reuniones con el Director de Sistemas de
Información para solicitarle una información que nunca estuvo prevista, que colapsará a su
personal, y que llegará, en el mejor de los casos, varios días después de haber sido solicitada.
Este tipo de caóticos escenarios se observan a diario en empresas que viven de la información
que le es proporcionada por un sistema de información tradicional, donde lo que está previsto
es aquello que afecta a la operación del negocio y poco más. Cuando el Director de Marketing
quiere saber cuantos productos del tipo A se vendieron en las cinco divisiones geográficas de
la compañía durante un periodo de tiempo específico, la respuesta es la cara de horror del
responsable de Sistemas de Información, que comienza a tener pesadillas donde se ve a sí
mismo organizando turnos de noche para poder volcar los datos del ordenador central y
convertirlos en algo mínimamente comprensible para un Departamento que no es el suyo, y
donde los usuarios no conocen otras cosas que la microinformática.
Si por el contrario, la empresa en cuestión tuvo el buen tino de instalar a tiempo un sistema de
Datawarehouse, el Director de Marketing, el Financiero, o cualquier otro ejecutivo que
necesite información estará en una posición idílica de independencia con respecto al
Departamento de Sistemas. Le bastará encender su PC, y hacer desde su mesa la pregunta que
necesite, obteniendo respuesta inmediata del sistema.
En definitiva, las ventajas son dos: facilidad de acceso a la información que soporta la toma
de decisiones de negocio, e independencia del usuario final frente al Departamento de
Sistemas.
¿Qué precauciones tomar?
A juicio de Inmon, que es el creador del término, la clave con respecto a estos sistemas está
en el denominado Data Storage Environment o entorno de almacenamiento de los datos, que
absorbe en torno al 80% del esfuerzo necesario. Si optamos por una solución que no incluya
la automatización de los procesos de mantenimiento, puede que obtengamos un coste inicial
menor, pero es seguro que el coste de administración se disparará a medida que aumente el
volumen de información gestionada por el sistema.
Para seleccionar adecuadamente las herramientas de soporte y automatizar los procesos del
sistema, deberemos tener en cuenta como mínimo que:


El volumen de información procesada crecerá constantemente.
Deberemos tener prevista la incorporación de nuevos datos y la absorción de los
posibles cambios en los datos fuentes.

Debemos implementar el sistema sobre tecnologías abiertas y motores de bases de
datos relacionales, aun cuando las fuentes no lo sean.
Cumpliendo con estas mínimas precauciones estaremos mucho más cerca de un sistema ideal,
que será:



Escalable y capaz de absorber crecimientos en la información.
De fácil acceso por los usuarios, y flexible en sus respuestas.
Que no interfiere en los procesos transaccionales que soportan el negocio.
Descargar