Subido por Thea Aguilar

Datawarehousing presentacion

Anuncio
DATAWAREHOUSING
JAVIER REYES PACHECO
DEFINICION
• Un Data Warehouse es una colección de datos en la cual se encuentra
integrada la información de la Institución y que se usa como soporte para el
proceso de toma de decisiones gerenciales.Aunque diversas organizaciones y
personas individuales logran comprender el enfoque de un Data Warehouse, la
experiencia ha demostrado que existen muchas dificultades potenciales
QUE BUSCA
• Aumentar el rendimiento de las acciones comerciales y mercadotecnia.
• Aumentar los servicios proporcionados.
• Mantener la fidelidad de la clientela.
LOS DATOS
• Mientras las necesidades de los datos operacionales se enfocan
normalmente hacia una sola área, los datos para el soporte de decisiones, con
frecuencia, toma un número de áreas diferentes y necesita cantidades grandes
de datos operacionales relacionadas. Estos son sistemas sobre los se basa la
tecnología data warehousing.
CARACTERISTICAS DE DW
• Orientación al tema
• Datos integrados
• Datos historiados ó de tiempo variante
• Datos no volátiles
ESTRUCTURA DEL DW
Un Data Warehouse se estructura en cuatro clases de datos organizadas según un eje
histórico y un eje sintético
• Datos altamente resumidos
• Datos resumidos
• Datos detallados
• Datos detallados historicos
FIGURA ESTRUCTURA DW
ARQUITECTURAS DEL DATA WAREHOUSE
Para implementar un Data Warehouse, son posibles tres tipos de arquitecturas :
• Arquitectura real
• Arquitectura virtual, y
• Arquitectura remota
1. ARQUITECTURA REAL
• La arquitectura real es generalmente la arquitectura elegida para los
sistemas de decisión. El almacenamiento de los datos del Data Warehouse se
realiza en un SGBD separado del sistema de producción. Este SGBD se
alimenta por extracciones periódicas
2. ARQUITECTURA VIRTUAL
• En una arquitectura virtual, los datos del Data Warehouse residen en el
sistema de producción. Se hacen visibles por productos middleware o por
gateways. En esta arquitectura no hay coste de almacenamiento suplementario
y el acceso se hace en tiempo real.
3 ARQUITECTURA REMOTA
• La arquitectura remota es una combinación de los dos tipos de
arquitecturas descritas anteriormente. El objetivo es implementar físicamente
los niveles agregados (los niveles de datos utilizados más a menudo ) a fin de
facilitar el acceso y conservar el nivel de detalle en los sistemas de producción
dando acceso por medio de middleware o de gateways. Esta arquitectura se
utiliza también muy raramente.
ELEMENTOS DE UNA ARQUITECTURA DE DATA
WAREHOUSE
1.
Nivel de base de datos externo
2.
Nivel de acceso a la información
3.
Nivel de acceso a los datos
4.
Nivel de directorio de datos (Metadata)
5.
Nivel de gestión de proceso
6.
Nivel de mensaje de la aplicación
7.
Nivel de data warehouse
8.
Nivel de organización de datos
9.
Base de datos operacional / Nivel de base de datos externo
CONSIDERACIONES PARA LA CONSTRUCCIÓN
DEL DATA WAREHOUSE
1.
Integra datos de producción con datos externos y gestiona historiales
2.
Contiene las informaciones útiles, las hace legibles y manipulabas
3.
Agrupa datos de calidad (coherentes, actualizados, documentados)
4.
Ofrecer un acceso directo a los usuarios
5.
Aumentar el número de accesos a los datos
6.
Ofrecer una flexibilidad que apoya el crecimiento, tanto desde el punto de vista del
número de usuarios, de las herramientas utilizadas o de los volúmenes a tratar.
CONSTRUCCIÓN DEL DATA WAREHOUSE
1.
Ensamblar las materias primas (los datos de diferentes fuentes),
2.
Según instrucciones específicas (el metamodelo),
3.
Para realizar un producto terminado (los datos analíticos),
4.
Almacenado en un almacén de datos (el Data Warehouse),
5.
Para su disponibilidad fácil de cara a los Clientes (los usuarios finales)
LOS COMPONENTES FUNCIONALES
1.
La adquisición de los datos,
• La extracción,
• La preparación, y
• La carga.
2.
Su almacenamiento, y
3.
El acceso por parte de los usuarios finales.
ESTRATEGIA DE ELABORACIÓN DEL DATA
WAREHOUSE
Un proyecto de Data Warehouse puede ser descompuesto en 4 etapas.
• La primera etapa, titulada «descubrir y definir las iniciativas», es a nivel de empresa - esta etapa
permitirá definir el porqué del Data Warehouse
• La segunda etapa llamada «determinación de la infraestructura» permitirá definir la infraestructura
técnica y organizativa del Data Warehouse.
• La tercera etapa, conocida como «implementación de las aplicaciones» implementará las
aplicaciones, una por una, y las desplegará.
• La cuarta y última etapa nombrada «evaluación de resultados» la cual se refiere a evaluar los
resultados obtenidos, en términos de costos y beneficios, por la implementación del Data Warehouse.
Descargar