DATAWAREHOUSING JAVIER REYES PACHECO DEFINICION • Un Data Warehouse es una colección de datos en la cual se encuentra integrada la información de la Institución y que se usa como soporte para el proceso de toma de decisiones gerenciales.Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un Data Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales QUE BUSCA • Aumentar el rendimiento de las acciones comerciales y mercadotecnia. • Aumentar los servicios proporcionados. • Mantener la fidelidad de la clientela. LOS DATOS • Mientras las necesidades de los datos operacionales se enfocan normalmente hacia una sola área, los datos para el soporte de decisiones, con frecuencia, toma un número de áreas diferentes y necesita cantidades grandes de datos operacionales relacionadas. Estos son sistemas sobre los se basa la tecnología data warehousing. CARACTERISTICAS DE DW • Orientación al tema • Datos integrados • Datos historiados ó de tiempo variante • Datos no volátiles ESTRUCTURA DEL DW Un Data Warehouse se estructura en cuatro clases de datos organizadas según un eje histórico y un eje sintético • Datos altamente resumidos • Datos resumidos • Datos detallados • Datos detallados historicos FIGURA ESTRUCTURA DW ARQUITECTURAS DEL DATA WAREHOUSE Para implementar un Data Warehouse, son posibles tres tipos de arquitecturas : • Arquitectura real • Arquitectura virtual, y • Arquitectura remota 1. ARQUITECTURA REAL • La arquitectura real es generalmente la arquitectura elegida para los sistemas de decisión. El almacenamiento de los datos del Data Warehouse se realiza en un SGBD separado del sistema de producción. Este SGBD se alimenta por extracciones periódicas 2. ARQUITECTURA VIRTUAL • En una arquitectura virtual, los datos del Data Warehouse residen en el sistema de producción. Se hacen visibles por productos middleware o por gateways. En esta arquitectura no hay coste de almacenamiento suplementario y el acceso se hace en tiempo real. 3 ARQUITECTURA REMOTA • La arquitectura remota es una combinación de los dos tipos de arquitecturas descritas anteriormente. El objetivo es implementar físicamente los niveles agregados (los niveles de datos utilizados más a menudo ) a fin de facilitar el acceso y conservar el nivel de detalle en los sistemas de producción dando acceso por medio de middleware o de gateways. Esta arquitectura se utiliza también muy raramente. ELEMENTOS DE UNA ARQUITECTURA DE DATA WAREHOUSE 1. Nivel de base de datos externo 2. Nivel de acceso a la información 3. Nivel de acceso a los datos 4. Nivel de directorio de datos (Metadata) 5. Nivel de gestión de proceso 6. Nivel de mensaje de la aplicación 7. Nivel de data warehouse 8. Nivel de organización de datos 9. Base de datos operacional / Nivel de base de datos externo CONSIDERACIONES PARA LA CONSTRUCCIÓN DEL DATA WAREHOUSE 1. Integra datos de producción con datos externos y gestiona historiales 2. Contiene las informaciones útiles, las hace legibles y manipulabas 3. Agrupa datos de calidad (coherentes, actualizados, documentados) 4. Ofrecer un acceso directo a los usuarios 5. Aumentar el número de accesos a los datos 6. Ofrecer una flexibilidad que apoya el crecimiento, tanto desde el punto de vista del número de usuarios, de las herramientas utilizadas o de los volúmenes a tratar. CONSTRUCCIÓN DEL DATA WAREHOUSE 1. Ensamblar las materias primas (los datos de diferentes fuentes), 2. Según instrucciones específicas (el metamodelo), 3. Para realizar un producto terminado (los datos analíticos), 4. Almacenado en un almacén de datos (el Data Warehouse), 5. Para su disponibilidad fácil de cara a los Clientes (los usuarios finales) LOS COMPONENTES FUNCIONALES 1. La adquisición de los datos, • La extracción, • La preparación, y • La carga. 2. Su almacenamiento, y 3. El acceso por parte de los usuarios finales. ESTRATEGIA DE ELABORACIÓN DEL DATA WAREHOUSE Un proyecto de Data Warehouse puede ser descompuesto en 4 etapas. • La primera etapa, titulada «descubrir y definir las iniciativas», es a nivel de empresa - esta etapa permitirá definir el porqué del Data Warehouse • La segunda etapa llamada «determinación de la infraestructura» permitirá definir la infraestructura técnica y organizativa del Data Warehouse. • La tercera etapa, conocida como «implementación de las aplicaciones» implementará las aplicaciones, una por una, y las desplegará. • La cuarta y última etapa nombrada «evaluación de resultados» la cual se refiere a evaluar los resultados obtenidos, en términos de costos y beneficios, por la implementación del Data Warehouse.