Capitulo 1 - DSpace de la Universidad Catolica de Cuenca

Anuncio
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 1
Sistemas de información
1.1.
Visión de los sistemas de información.
La empresa puede ser vista como un sistema, es decir, como un
“conjunto
de
elementos
interdependientes,
como
un
conjunto
organizado, como partes que interactúan formando un todo unitario y
complejo” utilizando.
El conjunto empresa puede ser desagregado en partes o
subsistemas, existiendo varias formas de efectuar tal descomposición.
 Institucional: Conformado por la misión, creencias y valores de
la organización;
 Gestión: Comprende el proceso de gestión, divido en las
etapas de planeamiento, ejecución y control.
 Organización:
Se refiere a la estructura organizacional
adoptada y a la delegación de autoridad resultante.
 Psico-socio-político-cultural: Refleja el comportamiento de los
integrantes de la organización, considerando sus factores
personales y comporta mentales.
 Producción
físico-operacional:
Donde
ocurren
las
transacciones.
Tnlg. Cristian Paul Peñaloza Salamea.
1
Universidad Católica de Cuenca
Sistemas OLAP
 Información: Instrumento de suporte al proceso de gestión
concebido a la luz de las directivas y políticas emanadas de
este proceso.
La información adecuada para el cumplimiento de los objetivos
depende, por tanto, no solamente de la disponibilidad de datos, sino
también de como son colectados, almacenados e interpretados y en
este proceso tenemos tecnología y personas involucradas.
1.2
Clasificación de los sistemas de información.
Los sistemas de información se han dividido de acuerdo al siguiente
esquema:
Sistemas
Estratégicos:
Orientados
a
soportar
la
toma
de
decisiones, facilitan la labor de la dirección, proporcionándole un
soporte básico, aportando mejor información para la toma de
decisiones. Se caracterizan porque son n sistemas sin carga
periódica de trabajo, es decir, su utilización no es predecible, en
contraposición a los que se utilizan en forma periódica. Se
destacan entre estos sistemas: los Sistemas de Información
Gerencial (MIS), Sistemas de Información Ejecutivos (EIS), Sistemas
de Información Georeferencial (GIS), Sistemas de Simulación de
Negocios (BIS y que en la práctica son sistemas expertos o de
Inteligencia Artificial (AI).
Tnlg. Cristian Paul Peñaloza Salamea.
2
Universidad Católica de Cuenca
Sistemas OLAP
Sistemas Tácticos: Diseñados para soportar las actividades de
coordinación de actividades y manejo de documentación,
definidos para facilitar consultas sobre información almacenada
en el sistema, proporcionar informes y en resumen, facilitar la
gestión, independiente de la información por parte de los niveles
intermedios de la organización. Se destacan entre ellos: los
Sistemas Ofimáticos (OA), Sistemas de Transmisión de Mensajería
(Correo electrónico y Servidor de fax), coordinación y control de
tareas (Work Flow) y tratamiento de documentos (Imagen, Trámite
y Bases de Datos Documentales).
Dentro de este grupo encontramos a los mencionados sistemas
OLAP.
Sistemas
Técnico:
Operativos,
que
cubren
el
núcleo
de
operaciones tradicionales de captura masiva de datos (Data
Entry) y servicios básicos de tratamiento de datos, con tareas
predefinidas
(contabilidad,
facturación,
almacén,
costos,
presupuesto, personal y otros sistemas administrativos). Estos
sistemas están evolucionando con la irrupción de censores,
autómatas, sistemas multimedia, bases de datos relacionales más
avanzadas y datawarehousing.
Tnlg. Cristian Paul Peñaloza Salamea.
3
Universidad Católica de Cuenca
Sistemas OLAP
Sistemas Interinstitucionales: Este último nivel de sistemas de
información recién está surgiendo. Es consecuencia del desarrollo
organizacional orientado a un mercado de carácter global, el
cual obliga a pensar e implementar estructuras de comunicación
más estrechas entre la organización y el mercado (Empresa
Extendida,
Organización
Inteligente
e
Integración
Organizacional), todo esto a partir de la generalización de las
redes informáticas de alcance nacional y global (INTERNET), que
se convierten en vehículo de comunicación entre la organización
y el mercado, no importa dónde esté la organización (INTRANET),
el mercado de la institución (EXTRANET) y el mercado (Red
Global).
Cuadro No 1: Clasificación de los Sistemas de Información
Tnlg. Cristian Paul Peñaloza Salamea.
4
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 2
Datawarehouse
2.1
¿Qué es un datawarehouse (Almacén de Datos)?
Un datawarehouse (almacén de datos) es una colección de
datos en la cual se encuentra la información de la organización en
forma integrada, clasificada por atributos, variante en el tiempo y no
volátil, que se usa como soporte para el proceso de toma de decisiones
gerenciales.
Aunque
diversas
empresas
y
personas
individuales
logran
comprender el enfoque de un datawarehouse, la experiencia ha
demostrado que existen muchas dificultades potenciales.
Reunir los elementos de datos apropiados desde diversas fuentes
de aplicación en un ambiente integral centralizado, simplifica el
problema de acceso a la información y en consecuencia, acelera el
proceso de análisis, consultas y el menor tiempo de uso de la
información.
Las aplicaciones para soporte de decisiones basadas en un
datawarehousing, pueden hacer más práctica y fácil la explotación de
datos para una mayor eficacia del negocio, que no se logra cuando se
usan sólo los datos que provienen de las aplicaciones operacionales
(que ayudan en la operación de la empresa en sus operaciones
Tnlg. Cristian Paul Peñaloza Salamea.
5
Universidad Católica de Cuenca
Sistemas OLAP
cotidianas), en los que la información se obtiene realizando procesos
independientes y muchas veces complejos.
Un datawarehouse se crea al extraer datos desde una o más
bases de datos de aplicaciones operacionales. La data extraída es
transformada para eliminar inconsistencias y resumir si es necesario y
luego cargadas en el datawarehouse.
El proceso de transformar, crear el detalle de tiempo variante,
resumir y combinar los extractos de datos, ayudan a crear el ambiente
para el acceso a la información institucional. Este nuevo enfoque ayuda
a las personas individuales, en todos los niveles de la empresa, a
efectuar su toma de decisiones con más responsabilidad.
La innovación de la Tecnología de Información dentro de un
ambiente datawarehousing puede permitir a cualquier organización
hacer un uso más óptimo de los datos, como un ingrediente clave para
un proceso de toma de decisiones más efectivo. Las organizaciones
tienen que aprovechar sus recursos de información para crear la
información de la operación del negocio, pero deben considerarse las
estrategias tecnológicas necesarias para la implementación de una
arquitectura completa de datawarehouse.
2.2
¿Ventajas de los datawarehouse?
Hay muchas ventajas por las que es recomendable usar un
Datawarehouse. Algunas de ellas son:
Tnlg. Cristian Paul Peñaloza Salamea.
6
Universidad Católica de Cuenca

Sistemas OLAP
Los almacenes de datos (Datawarehouse) hacen más fácil el
acceso a una gran variedad de datos a los usuarios finales.

Facilitan el funcionamiento de las aplicaciones de los sistemas de
apoyo a la decisión tales como informes de tendencia', por
ejemplo: obtener los ítems con la mayoría de las ventas en un
área en particular dentro de los últimos dos años; informes de
excepción, informes que muestran los resultados reales frente a los
objetivos planteados a priori.

Los almacenes de datos pueden trabajar en conjunto y, por lo
tanto, aumentar el valor operacional de las aplicaciones
empresariales, en especial la gestión de relaciones con clientes.
2.3
¿Inconvenientes de los datawarehouse?
Utilizar
almacenes
de
datos
también
plantea
algunos
inconvenientes, algunos de ellos son:

A lo largo de su vida los almacenes de datos pueden suponer
altos costos. El almacén de datos no suele ser estático. Los costos
de mantenimiento son elevados.

Los
almacenes
de
datos
se
pueden
quedar
obsoletos
relativamente pronto.
Tnlg. Cristian Paul Peñaloza Salamea.
7
Universidad Católica de Cuenca

Sistemas OLAP
A veces, ante una petición de información estos devuelven una
información subóptima, que también supone una pérdida para la
organización.

A menudo existe una delgada línea entre los almacenes de datos
y sistemas operativos. Hay que determinar qué funcionalidades de
estos se pueden aprovechar y cuáles se deben implementar en el
datawarehouse, resultaría costoso implementar operaciones no
necesarias o dejar de implementar alguna que sí vaya a
necesitarse.
2.4
¿Función de un datawarehouse?
En un datawarehouse lo que se quiere es contener datos que son
necesarios o útiles para una organización, es decir, que se utiliza como
un
repositorio
de
datos
para
posteriormente
transformarlos
en
información útil para el usuario. Un almacén de datos debe entregar la
información correcta a la gente indicada en el momento óptimo y en el
formato adecuado. El datawarehouse da respuesta a las necesidades
de usuarios expertos, utilizando Sistemas de Soporte a Decisiones (DSS),
Sistemas de información ejecutiva (EIS) o herramientas para hacer
consultas o informes. Los usuarios finales pueden hacer fácilmente
consultas sobre sus almacenes de datos sin tocar o afectar la operación
del sistema.
Tnlg. Cristian Paul Peñaloza Salamea.
8
Universidad Católica de Cuenca
Sistemas OLAP
En el funcionamiento de un almacén de los datos son muy importantes
las siguientes ideas:

Integración de los datos provenientes de bases de datos
distribuidas por las diferentes unidades de la organización y que
con
frecuencia
tendrán
diferentes
estructuras
(fuentes
heterogéneas). Se debe facilitar una descripción global y un
análisis comprensivo de toda la organización en el almacén de
datos.

Separación de los datos usados en operaciones diarias de los
datos usados en el almacén de datos para los propósitos de
divulgación, de ayuda en la toma de decisiones, para el análisis y
para operaciones de control. Ambos tipos de datos no deben
coincidir en la misma base de datos, ya que obedecen a
objetivos muy distintos y podrían entorpecerse entre sí.
Periódicamente, se importan datos al almacén de datos de los
distintos sistemas de planeamiento de recursos de la entidad (ERP) y de
otros sistemas de software relacionados con el negocio para la
transformación posterior (OLAP). Es práctica común normalizar los datos
antes de combinarlos en el almacén de datos mediante herramientas
de extracción, transformación y carga (ETL). Estas herramientas leen los
datos
primarios,
realizan
el
proceso
de
transformación
al
datawarehouse y escriben en el almacén.
Tnlg. Cristian Paul Peñaloza Salamea.
9
Universidad Católica de Cuenca
2.5
Sistemas OLAP
Objetivos del Datawarehouse
 Minimizar costos a la hora de tomar decisiones.
Se suprime el despilfarro de tiempo que se podía producir al
intentar ejecutar consultas de datos largas y complejas con bases
de
datos
que
estaban
diseñadas
específicamente
para
transacciones más cortas y sencillas.
 Mejorar la flexibilidad ante el entorno.
El DW convierte los datos operacionales en información
relacionada y estructurada, que genera el "conocimiento"
necesario para la toma de decisiones. Esto permite establecer
una base única del modelo de información de la organización,
que puede dar lugar a una visión global de la información en
base a los conceptos de negocio que tratan los usuarios. Además,
aporta una mejor calidad y flexibilidad en el análisis del mercado,
y del entorno en general.
 Proveer una visión única de los clientes en toda la empresa.
Esta visión global puede conllevar también la obtención de
otras ventajas competitivas, al identificar determinados costes
que con los sistemas anteriores podían permanecer ocultos.
 Realzar el servicio al cliente.
Todo lo que hemos dicho en el punto anterior implica una
importante mejora en la calidad de gestión, lo que también
repercute en la relación con el cliente, que es, como sabemos,
uno de los pilares básicos en los que descansa cualquier
organización ajustada. De hecho, el que un DW implique una
mayor flexibilidad ante el entorno tiene una consecuencia directa
Tnlg. Cristian Paul Peñaloza Salamea.
10
Universidad Católica de Cuenca
Sistemas OLAP
en una mayor capacidad para responder a las necesidades de
los clientes.
 Rediseñar los procesos.
Ofrecer a los usuarios una capacidad de análisis de la
información de su negocio que tiende a ser ilimitada y permite
con frecuencia obtener una perspectiva más profunda y clara de
los procesos de negocio propiamente dichos, lo que a su vez
permite obtener ideas renovadoras para la rediseño de los
mismos.
 Predecir compras de productos.
Se logra llevar un control exacto de los productos, así como
su comercialización.
 Poner tanta información comercial como sea posible.
La información de la institución es clara y bien recabada,
de manera que nuestros proveedores, directamente puedan
lograr
conocer
las
necesidades
de
la
empresa
y
la
comunicación entre clientes fluya sin problema alguno.
2.6
¿Cómo trabaja el Datawarehouse?
Cualquier empresa, independientemente de su tamaño, cuenta
con un conjunto de aplicaciones de procesamiento transaccional que
mecanizan los procesos operativos, muy estructurados y repetitivos, que
Tnlg. Cristian Paul Peñaloza Salamea.
11
Universidad Católica de Cuenca
Sistemas OLAP
vienen a constituir las funciones básicas de la entidad, tales como la
facturación, contabilidad, nóminas, etc.
El datawarehouse constituye el subsistema de información
operativo o transaccional, en él se procesan de manera automática,
grandes volúmenes de datos referentes a las actividades rutinarias, que
se almacenan en bases de datos operativas. De ellas se puede extraer
información, fundamentalmente válida para las transacciones del día a
día, es decir, sirven para apoyar y ejecutar las decisiones operativas que
conducen las actividades básicas, pero no sirven para realizar análisis
más avanzados, incluso de tipo estratégico, ya que no están diseñadas
para apoyar este tipo de tareas.
A partir de los datos almacenados en estas bases de datos
operativas, las cuales suelen ser inconsistentes en la manera en que
representan los datos (por ejemplo, distintas bases de datos pueden
estar utilizando unidades de medidas diferentes para los mismos
atributos), Se extrae un cúmulo de conocimientos o informaciones que
aporten un valor añadido a la gestión adecuada de la empresa.
Datawarehouse es el proceso de extraer y filtrar datos de las
operaciones comunes de la empresa, procedentes de los distintos
subsistemas operacionales, para transformarlos, integrarlos, sumariarlos y
almacenarlos en un depósito o repositorio, para poder acceder a ellos
cada que se necesite.
Tnlg. Cristian Paul Peñaloza Salamea.
12
Universidad Católica de Cuenca
Sistemas OLAP
Luego concentra la información de interés para toda la
organización y distribuye dicha información por medio de diversas
herramientas de consulta y de creación de informes orientadas a la
toma de decisiones.
Con esta tecnología se convierten los datos operacionales de una
organización en una herramienta competitiva, que permite a los
usuarios finales examinar los datos de modo más estratégico, realizar
análisis y detección de tendencias, seguimiento de medidas críticas,
producir informes con mayor rapidez, un acceso más fácil, más flexible y
más intuitivo a la información que se necesite en cada momento.
De esta manera el datawarehouse reúne y consolida las bases de
datos diferentes, que se mantienen en los diferentes departamentos o
áreas funcionales de la empresa como subsistemas de información
independientes, en una gran base de datos, recogiendo datos muy
dispares y, muchas veces infrautilizados, procedentes de fuentes
internas repartidas por toda la organización.
También
recogerá
datos
o
informaciones
externas,
que
rutinariamente se recibe sobre las diferentes entidades u objetos de
información, es decir, clientes, proveedores, productos y servicios,
canales, estructura organizativa, competencia, mercado, coyuntura
económica, etc...
Tnlg. Cristian Paul Peñaloza Salamea.
13
Universidad Católica de Cuenca
Sistemas OLAP
Todo ello, con el objetivo preciso de convertir los datos
operacionales en información relacionada y estructurada
2.7
¿En qué se lo puede usar?
o
Manejo de relaciones de marketing.
Mejora la producción de sistemas que pueden manejar
cientos o miles de usuarios, al datawarehouse acceda un limitado
conjunto
de
usuarios
en
cualquier
tiempo
determinado.
Ahorrando dinero y esfuerzo a cualesquier institución.
o
Análisis de rentabilidad.
Investiga la situación actual de la empresa, recopilando
información de lo más profundo, para comparar con datos
verídicos de años pasados, visualizando informes relativamente
cuantitativos, que ayudará al ejecutivo a la toma de decisiones
casi en cien por ciento confiables y productivas a corto plazo.
o
Reducción de costos.
Debido a la necesidad de investigar tendencias y evaluar
las relaciones entre muchas clases de datos, las consultas al
datawarehouse permiten acceder a volúmenes muy grandes
tanto de datos detallados como resumidos. Permitiendo disponer
de menor número de personal, acortando precios a la hora de su
producción.
Tnlg. Cristian Paul Peñaloza Salamea.
14
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 3
OLTP
3.1
Introducción
OLTP es la sigla en inglés de Procesamiento de Transacciones En
Línea (Online Transaction Processing) es un tipo de sistemas que facilitan
y administran aplicaciones transaccionales, usualmente para entrada
de datos y recuperación y procesamiento de transacciones (gestor
transaccional). Los paquetes de software para OLTP se basan en la
arquitectura cliente-servidor ya que suelen ser utilizados por empresas
con una red informática distribuida.
El término puede parecer ambiguo, ya que puede entenderse
"transacción" en el contexto de las "transacciones computacionales" o
de las "transacciones en bases de datos". También podría entenderse en
términos de transacciones de negocios o comerciales. OLTP también se
ha utilizado para referirse a la transformación en la que el sistema
responde de inmediato a las peticiones del usuario. Un Cajero
automático de un banco es un ejemplo de una aplicación de
procesamiento de transacciones comerciales.
La tecnología OLTP se utiliza en innumerables aplicaciones, como
en
banca
electrónica,
procesamiento
de
pedidos,
comercio
electrónico, supermercados o industria.
Tnlg. Cristian Paul Peñaloza Salamea.
15
Universidad Católica de Cuenca
3.2
Sistemas OLAP
Beneficios
El procesamiento de transacciones en línea tiene dos claros beneficios:
la simplicidad y la eficiencia.
Sobre la simplicidad:

La reducción de la documentación y la obtención de previsiones
de ingresos y gastos de forma más rápida y precisa son ejemplos
de cómo OLTP hace las cosas más simples para las empresas.

También proporciona una base concreta para la estabilidad de
una organización gracias a las actualizaciones oportunas.

Otro factor es que la simplicidad de permitir a los consumidores la
elección de la forma en que desean pagar, por lo que es mucho
mas atractivo que la de hacer transacciones.
Sobre la eficiencia
3.3

OLTP amplia la base de consumidores para la organización.

Los procesos individuales se ejecutan mucho más rápido.
Inconvenientes
OLTP es una gran herramienta para cualquier organización, aunque en
su utilización hay algunas cuestiones en las que se debe pensar ya que
Tnlg. Cristian Paul Peñaloza Salamea.
16
Universidad Católica de Cuenca
Sistemas OLAP
pueden suponer un problema: la seguridad y los costes económicos o
de tiempo.
Sobre la seguridad:

Una de las ventajas de OLTP es también un posible problema. La
disponibilidad a todo el mundo que estos sistemas ofrecen a las
empresas hacen a sus bases de datos mucho más susceptibles a
los intrusos y hackers.
Sobre los costes:

En las transacciones B2B, las empresas deben ir fuera de línea
(offline) para completar ciertos
pasos
de algún proceso,
causando que los compradores y proveedores pierdan algunos
de los beneficios de eficiencia que el sistema proporciona.

Tan simple como es un sistema OLTP, la más simple perturbación
en el sistema tiene el potencial de causar una gran cantidad de
problemas, que a su vez pueden causar una pérdida de tiempo y
dinero.

Otro costo económico es la posibilidad de que se produzcan
fallos en el servidor, esto puede causar retrasos en el servicio e
incluso la perdida de gran cantidad de información importante.
Para eliminar este riesgo o, al menos mitigarlo, se debe invertir en
mecanismos de seguridad.
Tnlg. Cristian Paul Peñaloza Salamea.
17
Universidad Católica de Cuenca
3.4
Sistemas OLAP
Diferencias del Datawarehouse vs OLTP
Los sistemas tradicionales de transacciones y las aplicaciones de
Data Warehousing son polos opuestos en cuanto a sus requerimientos
de diseño y sus características de operación.
Las aplicaciones de OLTP están organizadas para ejecutar las
transacciones para los cuales fueron hechos, como por ejemplo: mover
dinero entre cuentas, un cargo o abono, una devolución de inventario,
etc. Por otro lado, un Datawarehouse está organizado en base a
conceptos, como por ejemplo: clientes, facturas, productos, etc.
Otra diferencia radica en el número de usuarios. Normalmente, el
número de usuarios de un Datawarehouse es menor al de un OLTP. Es
común encontrar que los sistemas transaccionales son accedidos por
cientos de usuarios simultáneamente, mientras que los Datawarehouse
sólo por decenas.
Los sistemas de OLTP realizan cientos de transacciones por
segundo mientras que una sola consulta de un Datawarehouse puede
tomar minutos. Otro factor es que frecuentemente los sistemas
transaccionales son menores en tamaño a los Datawarehouses, esto es
debido a que un Datawarehouse puede estar formado por información
de varios OLTP´s.
Existen también diferencia en el diseño, mientras que el de un
OLTP es extremadamente normalizado, el de un Datawarehouse tiende
a ser desnormalizado. El OLTP normalmente está formado por un número
Tnlg. Cristian Paul Peñaloza Salamea.
18
Universidad Católica de Cuenca
Sistemas OLAP
mayor de tablas, cada una con pocas columnas, mientras que en un
Datawarehouse el número de tablas es menor, pero cada una de éstas
tiende a ser mayor en número de columnas.
Los OLTP son continuamente actualizados por los sistemas
operacionales del día con día, mientras que los Datawarehouse son
actualizados en batch de manera periódica.
Las estructuras de los OLTP son muy estables, rara vez cambian,
mientras las de los Datawarehouses sufren cambios constantes
derivados de su evolución. Esto se debe a que los tipos de consultas a
los cuales están sujetos son muy variados y es imposible preverlos todos
de antemano. Mejorar la Entrega
de Información: información
completa, correcta, consistente, oportuna y accesible. Información que
la gente necesita, en el tiempo que la necesita y en el formato que la
necesita.
Mejorar el Proceso de Toma de Decisiones: con un mayor soporte
de información se obtienen decisiones más rápidas; así también, la
gente de negocios adquiere mayor confianza en sus propias decisiones
y las del resto, y logra un mayor entendimiento de los impactos de sus
decisiones. Impacto Positivo sobre los Procesos Empresariales: cuando a
la gente se le da acceso a una mejor calidad de información, la
empresa puede lograr por sí sola:
 Eliminar los retardos de los procesos empresariales que resultan
de información incorrecta, inconsistente y/o no existente.
Tnlg. Cristian Paul Peñaloza Salamea.
19
Universidad Católica de Cuenca
Sistemas OLAP
 Integrar y optimizar procesos empresariales a través del uso
compartido e integrado de las fuentes de información.
 Eliminar la producción y el procesamiento de datos que no
son usados ni necesarios, producto de aplicaciones mal diseñados
o ya no utilizados.
3.5
Características OLTP
Las características principales de los sistemas OLTP son:
 Realizan transacciones en tiempo real del proceso de un negocio,
con lo cual los datos almacenados cambian continuamente. Los
sistemas OLTP en sus transacciones conducen procesos esenciales
del negocio.
 Los sistemas OLTP son los responsables del mantenimiento de los
datos, ya sea agregando datos, realizando actualizaciones o bien
eliminándolos.
 Las estructuras de datos deben estar optimizadas para validar la
entrada de los mismos, y rechazarlos si no cumplen con
determinadas reglas de negocio.
 Para la toma de decisiones, proporciona capacidades limitadas
ya que no es su objetivo, por lo tanto no es prioridad en su diseño.
Tnlg. Cristian Paul Peñaloza Salamea.
20
Universidad Católica de Cuenca
Sistemas OLAP
Si se quisiera obtener determinada información histórica relativa al
negocio consultando un sistema OLTP, se produciría un impacto
negativo en el funcionamiento del sistema.
Normalmente, para el diseño de un sistema OLTP se define un
modelo de Diagrama Entidad Relación (DER). Un DER es una
representación de la realidad a través de un esquema gráfico que
contiene los siguientes elementos:
 Entidades: Una Entidad
es un tipo de objeto que puede
identificarse de manera única por algún medio. Este objeto es
traducido a la estructura física de una base de datos como una
tabla.
 Atributos: Las características particulares que distinguen a las
Entidades se denominan Atributos.
 Relaciones: vínculos existentes entre las tablas que sirven para
asegurar la integridad referencial.
3.6
Usos Comunes de OLTP
Toda organización o empresa, lleva adelante sus objetivos diarios
realizando un conjunto de tareas que se encuentran cuidadosamente
agrupadas
dentro
de
procesos,
estos
últimos
estrechamente
relacionados entre sí. Los procesos pueden pertenecer al área Industrial,
Tnlg. Cristian Paul Peñaloza Salamea.
21
Universidad Católica de Cuenca
Sistemas OLAP
al departamento de Marketing, al departamento de Ventas o al sector
Administrativo, mencionando solo algunos.
Decimos entonces, que en la definición de OLTP se pueden
encuadrar a todos los sistemas tradicionales dedicados a la captura.
Sistema OLTP
Imaginemos que estamos frente a un Sistema de Cajeros Automáticos.
El sistema, al ser operado por un cliente pasará por las siguientes
situaciones:
 Tomar la tarjeta del Cliente.
 Validar el Cliente. Consultar a la Base de Datos si el Cliente existe
y, de existir, confirmar que se encuentra en una línea de cajeros
habilitada.
 Autenticar el cliente en el sistema.
De querer realizar una transferencia:
 Verificar que está autorizado para realizarla.
 Verificar que tiene saldo.
 Inicializar la transferencia manejándola como una transacción.
 Emitir comprobante.
 Saludar al Cliente.
La situación en un Sistema de Ventas por medio de un sitio Web, sería
la siguiente:
 Validar al cliente y autenticarlo en el sistema.
 Tomar el pedido.
 Controlar los topes de créditos.
 Informar los valores parciales de la compra y acumulados.
 Requerir confirmación del cliente antes de enviar el pedido.
 Enviar el pedido.
Tnlg. Cristian Paul Peñaloza Salamea.
22
Universidad Católica de Cuenca
Sistemas OLAP
Vemos que el sistema transaccional asegura un conjunto de
reglas de negocio, como ser en el ejemplo del sistema de Ventas Web,
antes de realizar la venta se controla que el cliente no haya superado el
tope de los créditos.
A su vez, debe mantenerse una integridad en la información, es
decir, si en una tabla manejo el stock de los productos y en otra llevo los
movimientos que realizo de estos productos, las cantidades que muevo
en la tabla de movimientos tienen que ser descontadas en igual
medida que las que tengo en la tabla de productos.
Procesos Operacionales
Inventario
Ventas
Proveedores
Marketing
Clientes
Producción
Cuadro No 2: Procesos Operacionales
Las organizaciones se ven entonces en la necesidad de registrar
las transacciones que ocurren durante sus procesos operacionales, para
su control y posterior consulta.
Tnlg. Cristian Paul Peñaloza Salamea.
23
Universidad Católica de Cuenca
Sistemas OLAP
Un sistema OLTP es utilizado en:
 Sistemas bancarios
 Procesamiento de pedidos
 Comercio electrónico
 Sistemas de facturación
 Sistemas de stock
Almacenamiento Transaccional
$
Comercio electrónico
Bancos
$
$
Pedidos
$
Sistemas OLTP
Facturación
Stock
Cuadro No 3: Almacenamiento Transaccional
Tnlg. Cristian Paul Peñaloza Salamea.
24
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 4
Sistemas OLAP
4.1
Introducción a los sistemas OLAP
El cambio que propone la tecnología OLAP, es en esencia una
revisión del enfoque que tradicionalmente se ha aplicado al desarrollo
de los sistemas de apoyo a la toma de decisiones y de análisis del
negocio.
La concentración en la atención de los sistemas de información
en las operaciones de la empresa, dio lugar a sistemas especializados
en
el
tratamiento
eficiente
y
seguro
de
altos
volúmenes
de
transacciones cortas (facturación, movimientos de inventarios, etc.).
Esto es conocido como OLTP (On-Line Transaction Processing).
Pero dentro de la óptica de los sistemas dirigidos a OLTP, el
soporte de las actividades de análisis jugó un papel secundario,
generalmente caracterizado por métodos de trabajo que acceden en
forma directa a la “base de datos” (la misma que está soportando las
operaciones on-line) con la finalidad de extraer y procesar la
información.
En los sistemas OLAP la información ya no se almacena en tablas,
sino en cubos de n dimensiones. Se construye a partir de una tabla
principal, llamada tabla de hechos, que enumera los hechos ciertos en
Tnlg. Cristian Paul Peñaloza Salamea.
25
Universidad Católica de Cuenca
Sistemas OLAP
el sistema. A ella se va añadiendo una dimensión por relación cuya
información que se quiera almacenar, de manera que todas están pre
calculadas en el sistema.
Los sistemas OLAP son los que implementa finalmente los llamados
"Datawarehouse" o depósitos de datos que podemos definir como un
almacén de datos transformados y separados físicamente de la
aplicación donde se encontraron los datos en el ambiente operacional.
Implementaciones comerciales de OLAP hay muchas. Quizás la más
conocida sea SAP, aunque hay muchas como Microsoft Analysis
Services (incluido en SQL Server) ó DB2 OLAP Server de IBM.
4.2
OLAP
OLAP es el acrónimo en inglés de procesamiento analítico en
línea (On-Line Analytical Processing). Es una solución utilizada en el
campo de la llamada Inteligencia empresarial (o Business Intelligence)
cuyo objetivo es agilizar la consulta de grandes cantidades de datos.
Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de Datos o Sistemas
Transaccionales (OLTP). Se usa en informes de negocios de ventas,
marketing, informes de dirección, minería de datos y áreas similares.
La razón de usar OLAP para las consultas es la velocidad de
respuesta. Una base de datos relacional almacena entidades en tablas
Tnlg. Cristian Paul Peñaloza Salamea.
26
Universidad Católica de Cuenca
Sistemas OLAP
discretas si han sido normalizadas. Esta estructura es buena en un
sistema
OLTP
pero
para
las
complejas
consultas
multitabla
es
relativamente lenta. Un modelo mejor para búsquedas, aunque peor
desde
el
punto
de
vista
operativo,
es
una
base
de
datos
multidimensional.
4.3
Funcionalidad de los sistemas OLAP
En la base de cualquier sistema OLAP se encuentra el concepto
de cubo OLAP (también llamado cubo multidimensional o hipercubo).
Se compone de hechos numéricos llamados medidas que se clasifican
por dimensiones. El cubo de metadatos es típicamente creado a partir
de un esquema en estrella o copo de nieve, esquema de las tablas en
una base de datos relacional. Las medidas se obtienen de los registros
de una tabla de hechos y las dimensiones se derivan de la dimensión de
los cuadros.
Información a obtener.
Normalmente este tipo de selecciones se ve reflejada en la
visualización de la estructura multidimensional, en unos campos de
selección que nos permitan elegir el nivel de agregación (jerarquía) de
la dimensión, y/o la elección de un dato en concreto, la visualización de
los atributos del sujeto, frente a una(s) dimensiones en modo tabla,
pudiendo con ello realizar, entre otras las siguientes acciones:
Tnlg. Cristian Paul Peñaloza Salamea.
27
Universidad Católica de Cuenca
Sistemas OLAP
 Rotar (Swap): Alterar las filas por columnas (permutar dos
dimensiones de análisis).
 Bajar (Down): Bajar el nivel de visualización en las filas a una
jerarquía inferior.
 Detallar (Drilldown): Informar para una fila en concreto, de datos
a un nivel inferior.
 Expandir (Expand): Id. anterior sin perder la información a nivel
superior para éste y el resto de los valores.
 Colapsar (Collapse): Operación inversa de la anterior.
4.4
Propósito de los sistemas OLAP
El propósito del OLAP (procesamiento analítico en línea) es
permitir un análisis multidimensional de las bases de datos de gran
volumen para realizar un análisis especial de los mismos (que son el
tema de consultas especiales).
Gracias al OLAP, los usuarios pueden crear representaciones
multidimensionales (llamadas hipercubo o "cubos OLAP") de acuerdo
con el criterio que ellos definan para simular situaciones.
4.5
Extracción de Datos
La extracción de datos, más que a un análisis multidimensional
(OLAP), está destinada a mostrar cualquier correlación dentro de un
Tnlg. Cristian Paul Peñaloza Salamea.
28
Universidad Católica de Cuenca
Sistemas OLAP
volumen de datos importante del sistema de información con el fin de
detectar alguna tendencia.
La extracción de datos se basa en técnicas de inteligencia
artificial (red neural) para mostrar vínculos ocultos entre los datos.
4.6
Característica de los Sistemas OLAP
Las siguientes son características que la tecnología OLAP posee:
 Las bases de datos de OLAP tienen un esquema que está
optimizado para que las preguntas realizadas por los usuarios sean
respondidas rápidamente.
 Las preguntas que se le hacen a un OLAP, deben permitir un uso
interactivo con los usuarios.
 Los
cubos
de
conformados
OLAP
por
almacenan
estructuras
varios
altamente
niveles
de datos
optimizadas
que
responden a las expectativas de negocio de la empresa.
 Un sistema OLAP está preparado para realizar informes complejos
de una manera simple.
 OLAP proporciona una vista de datos multidimensional. Los cubos
proporcionan una vista de los datos multidimensional que se
extiende más allá del análisis de dos dimensiones que puede
proporcionar una simple planilla de cálculo utilizada como tal.
Tnlg. Cristian Paul Peñaloza Salamea.
29
Universidad Católica de Cuenca
Sistemas OLAP
 Los usuarios pueden cambiar fácilmente las filas, las columnas, y
las páginas en informes de OLAP, pudiendo leer la información de
la manera que se crea más conveniente para el análisis.
4.7
Usos Comunes de OLAP
Los sistemas OLAP, son utilizados por las empresas para conocer la
historia del negocio y poder realizar la toma de decisiones.
Podemos enunciar entonces las siguientes áreas en donde el uso
de un sistema OLAP está difundido:
 Sistemas
de
información
ejecutivos.
Los
usuarios
y
los
administradores generalmente de mandos altos y medios, reciben
la
información
sobre
los
indicadores
de
funcionamiento
dominantes del negocio y de las excepciones o las variaciones
según sea de patrones y de estándares preestablecidos. Los
Sistemas de Información Ejecutivos (EIS) presentan típicamente
datos multidimensionales en formatos gráficos.
 Aplicaciones financieras. Para diversos usos de tipo financiero se
utilizan las bases de datos de OLAP como ser para comunicar,
planear, y analizar. Los ejemplos de usos financieros incluyen la
comunicación, análisis del mes-cierre, análisis de lo beneficioso
del producto, los presupuestos y pronóstico. Los analistas
financieros utilizan OLAP extensivamente para el análisis de datos
Tnlg. Cristian Paul Peñaloza Salamea.
30
Universidad Católica de Cuenca
Sistemas OLAP
financieros y operacionales para contestar las preguntas de la
gerencia mayor.
 Ventas y aplicaciones de Marketing. Existen diferentes formas de
llegar a los clientes para alcanzar los objetivos de venta y de
comercialización propuestos. Por esto, la utilización de sistemas
OLAP, donde es importante contar con información organizada
de manera rápida, es aconsejable. Los ejemplos incluyen análisis
de la facturación, análisis de producto, análisis del cliente, y
análisis de ventas regional.
 Otros Usos. Las bases de datos de OLAP se adaptan a una amplia
gama de análisis, incluyendo rendimiento de procesamiento y
eficacia de la fabricación, eficacia del servicio de cliente, y
análisis de coste del producto. En definitiva, un sistema OLAP es
útil para todo proceso en el que sea necesario tomar decisiones.
4.8
Convirtiendo Datos en Información
Para convertir los datos en información, se debe entender de qué
manera pueden interpretarse los datos almacenados en sistemas
operacionales, determinando:
 Como los hechos que deseamos medir se relacionan con los
datos que podemos obtener.
 Entendiendo cómo estos datos reflejan metas y objetivos que
abarcan el negocio involucrado.
Tnlg. Cristian Paul Peñaloza Salamea.
31
Universidad Católica de Cuenca
Sistemas OLAP
Un DW, clasifica la información en base a los aspectos que son de
interés para la empresa.
En
el
ambiente
operacional
se
diseña
alrededor
de las
aplicaciones y funciones (ventas, facturación, stock, etc.). La base de
datos combina los procesos en una estructura que responde a las
necesidades de las reglas del negocio.
En cambio en un DW, estos elementos se organizan alrededor de
sujetos clientes (vendedores, productos, sucursales, etc.).
Una vez que el análisis del negocio se reconoce como un valor
significativo para una organización, las peticiones de los datos y de la
información llegan a ser numerosas y frecuentes.
Satisfacer estas peticiones puede ser una tarea muy compleja en
un sistema OLTP, se debe bucear por grandes cantidades de datos
obtenidos de distintas fuentes, procurando seleccionar, adecuar y
consolidar la información. En un sistema OLAP, estos temas se resuelven
por única vez, en la etapa de diseño.
4.9
Transformación y agrupación de datos – ETL
Los datos que alimentan a un sistema DW provienen de diferentes
fuentes, estas fuentes son los distintos sistemas operacionales que la
empresa posee, generalmente ni son homogéneos
entre sí
ni
concuerdan exactamente con lo que se necesita, por lo que será
necesario realizar todas las adaptaciones pertinentes.
Tnlg. Cristian Paul Peñaloza Salamea.
32
Universidad Católica de Cuenca
Sistemas OLAP
Cuadro No 4: Transformación y Agrupación de Datos
Es común que los sistemas operacionales que se encuentran en
las organizaciones hayan sido desarrollados por diferentes equipos de
programadores o empresas de software, y en su desarrollo, hayan
adoptado diferentes convenciones en la codificación de variables,
nombres de los atributos de las tablas, diferentes tipos de datos o
formatos de fechas.
Al reunir datos de los diferentes sistemas, se debe definir una
norma única para el DW y realizar las transformaciones que sean
necesarias en cada caso. Básicamente deben realizarse las siguientes
tareas:
 Establecer las reglas que serán utilizadas para realizar la
transformación.
Tnlg. Cristian Paul Peñaloza Salamea.
33
Universidad Católica de Cuenca
Sistemas OLAP
 Detectar las inconsistencias que pueden originarse al tomar los
datos desde distintas fuentes.
 Planificar cuidadosamente y con detalles la transformación de los
datos que den como resultado final
conjuntos de datos
consistentes.
Operacional
Data Warehouse
Cuadro No 5: Datos Operacionales y Datawarehouse
 Varias columnas a una: En un sistema OLTP, los datos de una
persona, como ser Dirección pueden almacenarse en diferentes
campos de la misma tabla (Calle, Número, Piso y Departamento).
Al transformar estos datos para que puedan ser utilizados en un
sistema DW, es posible que los almacenemos en una única
columna. Lo mismo puede suceder con el Nombre y Apellido. En
el sistema OLTP puede estar almacenado en dos columnas y en
OLAP ser requerido en una sola.
Cuadro No 6: Varias columnas a una.
Tnlg. Cristian Paul Peñaloza Salamea.
34
Universidad Católica de Cuenca
Sistemas OLAP
 Una columna a varios: los sistemas más antiguos solían colocar el
tipo y número de documento en el mismo campo de la tabla. En
un DW, es muy posible que necesitemos colocar el tipo de
documento en un campo y el número de documento en otro.
Cuadro No 7: Una columna a varios.
Tnlg. Cristian Paul Peñaloza Salamea.
35
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 5
Tipos de Sistemas OLAP
5.1
Clasificación
Tradicionalmente, los sistemas OLAP se clasifican según las
siguientes categorías:
® ROLAP
® MOLAP
® HOLAP
5.1.1
ROLAP
Procesamiento Analítico OnLine Relacional
5.1.1.1
Introducción
Implementación OLAP que almacena los datos en un motor
relacional.
Típicamente,
los
datos
son
detallados,
evitando
las
agregaciones y las tablas se encuentran normalizadas. Los esquemas
más comunes sobre los que se trabaja son estrella ó copo de nieve,
aunque es posible trabajar sobre cualquier base de datos relacional. La
arquitectura está compuesta por un servidor de banco de datos
relacional y el motor OLAP se encuentra en un servidor dedicado. La
principal ventaja de esta arquitectura es que permite el análisis de una
enorme cantidad de datos.
Tnlg. Cristian Paul Peñaloza Salamea.
36
Universidad Católica de Cuenca
Sistemas OLAP
Los sistemas ROLAP difiere significativamente de los MOLAP en que
los primeros no requieren, en principio, la computación previa ni el
almacenamiento
de
la
información,
ya
que
pueden
acceder
directamente a la fuente de dichos datos, las herramientas ROLAP
acceden a los datos de una base de datos relacional y generan
consultas SQL para calcular la información al nivel apropiado cuando
un usuario final lo requiere.
Aunque las aplicaciones ROLAP se construyen sobre sistemas de
bases de datos relacionales, generalmente estas bases de datos deben
ser diseñadas cuidadosamente para el uso de ROLAP. Una base de
datos diseñada para procesamiento de transacciones (OLTP) no
funcionará bien como base de datos ROLAP. Este diseño específico
puede conllevar la creación de tablas de base de datos adicionales
(tablas resumen o agregaciones) las cuales resumen los datos en
cualquier combinación deseada de dimensiones. Este mecanismo
puede agilizar el acceso a datos precalculados mejorando el
rendimiento del sistema ROLAP, pero, en este caso, se debe crear una
copia adicional de los datos si estos no se grabaron directamente en las
tablas ROLAP, sino que provienen de tablas OLTP. Sin embargo, dado
que se trata, en ambos casos (ROLAP y OLTP), de una base de datos
relacional, pueden utilizarse cualquiera de las técnicas existentes para el
acceso y gestión de la misma y la migración de datos entre bases de
datos relacionales.
Tnlg. Cristian Paul Peñaloza Salamea.
37
Universidad Católica de Cuenca
5.1.1.2
Sistemas OLAP
Diseño de tablas para una herramienta ROLAP
En un sistema ROLAP, la información se almacena en tablas de
una base de datos relacional. En este diseño tiene una especial
importancia la denominada tabla de hechos, que es donde se
almacena la historia de alguna magnitud relevante para la empresa
que necesita ser estudiada de forma exhaustiva, como por ejemplo, las
ventas.
Adicionalmente, esta tabla de hechos estará ligada a otras tablas
en las que se almacenarán los parámetros en función de los cuales
varía la magnitud a estudiar, estos parámetros reciben el nombre de
dimensiones; típicamente, para el caso del estudio de la magnitud
ventas, las dimensiones podrían ser: el tiempo (por días, semanas, horas,
... según interese), los productos, las zonas geográficas (regiones, países,
ciudades, códigos postales,...), los clientes, los almacenes o centros de
producción, las promociones, etc.
Finalmente, el diseño de estas tablas dará lugar a una estructura
en cuyo centro estará la tabla de hechos y, alrededor de ésta y
relacionadas con ella, estarán las tablas para las dimensiones, dando
lugar a un esquema en estrella.
Tnlg. Cristian Paul Peñaloza Salamea.
38
Universidad Católica de Cuenca
Sistemas OLAP
Podría darse el caso de que se quisiera jerarquizar alguna de las
dimensiones, por ejemplo, el tiempo se podría indicar por días, pero
quizá
interese
poder
agruparlo
por
semanas,
por
meses,
por
cuatrimestres y/o por años; los clientes se podrían clasificar por sexos
(hombre, mujer); los productos podrían estar agrupados por categorías,
etc. La construcción de este diseño implicaría añadir nuevas tablas que
se relacionarían con las dimensiones de la tabla de hechos central. A
este diseño se le llama esquema en copo de nieve.
Una vez finalizado el diseño de este sistema, se tiene una
estructura que se identifica con un cubo OLAP. Un almacén de datos
dispondrá de varios de estos cubos, uno por cada magnitud (o conjunto
de magnitudes si éstas dependen de las mismas dimensiones) de interés
para la empresa.
5.1.1.3
Ventajas de ROLAP
La construcción de herramientas OLAP sobre sistemas relacionales
presenta algunas ventajas frente a los sistemas multidimensionales:

ROLAP se considera más escalable para manejar grandes
volúmenes de datos, especialmente modelos con dimensiones de
gran cardinalidad (por ejemplo, con millones de miembros).

Hay disponible una gran variedad de herramientas de carga de
datos para sistemas relacionales; además, existe la posibilidad de
Tnlg. Cristian Paul Peñaloza Salamea.
39
Universidad Católica de Cuenca
Sistemas OLAP
ajustar el código ETL(Extract, Transform, Load) a un modelo de
datos particular. Con todo esto se consigue que los tiempos de
carga sean generalmente mucho menores que con las cargas
MOLAP automatizadas.

Los datos se almacenan en una base de datos relacional
estándar que puede ser accedida por cualquier herramienta de
generación de informes SQL (reporting). Estas herramientas no
tienen que ser necesariamente de tipo OLAP.

Las herramientas MOLAP tienden a sufrir un bajo rendimiento
cuando consultan elementos como descripciones textuales.

Obviando
el
almacenamiento
de
datos
del
modelo
multidimensional, es posible modelar datos con éxito que de otro
modo no se ajustarían en un modelo dimensional estricto.
5.1.1.4
Desventajas de ROLAP
Hay un consenso general en la industria de que las herramientas
ROLAP tienen menor rendimiento que las herramientas MOLAP.

El proceso de carga de tablas agregadas debe ser gestionado
por código ETL personalizado. Las herramientas ROLAP no
disponen de mecanismos automáticos para realizar esta tarea, lo
significa que se necesita más tiempo de desarrollo de código.
Tnlg. Cristian Paul Peñaloza Salamea.
40
Universidad Católica de Cuenca

Sistemas OLAP
Muchos desarrolladores de modelos dimensionales ROLAP ignoran
el paso de crear tablas agregadas. En este caso el rendimiento
de una consulta se ve afectado porque entonces se necesita
consultar las tablas con datos más detallados. Esto puede evitarse
parcialmente añadiendo tablas agregadas adicionales, sin
embargo no es práctico crear tablas agregadas para todas las
combinaciones posibles de dimensiones/atributos.

Los sistemas ROLAP se construyen sobre bases de datos de
propósito general, por lo que hay algunas funcionalidades
especiales propias de las herramientas MOLAP que no están
disponibles en los sistemas ROLAP (tales como el indexado
jerárquico especial). Sin embargo, las herramientas ROLAP
modernas van supliendo estas carencias con las últimas mejoras
en el lenguaje SQL tales como los operadores CUBE y ROLLUP, las
vistas de cubo DB2, así como otras extensiones SQL OLAP. Estas
mejoras
SQL
pueden
mitigar
las
diferencias
frente
a
las
herramientas MOLAP.

Dado que las herramientas ROLAP se basan en SQL para todos los
cálculos, no son apropiadas cuando el modelo realiza muchos
cómputos que no se traducen bien en SQL (por ejemplos:
presupuestos,
asignaciones,
informes
financieros
y
otros
escenarios).
Tnlg. Cristian Paul Peñaloza Salamea.
41
Universidad Católica de Cuenca
5.1.1.5
Sistemas OLAP
Grafico
Cuadro No 8: Ventajas y Desventajas Rolap
5.1.2
MOLAP
Multidimensional OnLine Analytical Processing
5.1.2.1
Introducción
MOLAP
Analytical
es
el
acrónimo
Processing,
es
inglés
decir,
de Multidimensional
'procesamiento
Online
analítico
multidimensional en línea’.
Se trata de una alternativa a la tecnología ROLAP (OLAPRelacional). Aunque ambos tipos de herramientas están diseñadas para
realizar
análisis
de
datos
a
través
de
un
modelo
de
datos
multidimensional, MOLAP se diferencia significativamente en que
requiere un preprocesamiento y almacenamiento de la información
contenida en el cubo OLAP. MOLAP almacena estos datos en una
Tnlg. Cristian Paul Peñaloza Salamea.
42
Universidad Católica de Cuenca
Sistemas OLAP
matriz de almacenamiento multidimensional optimizado, más que en
una base de datos relacional (o en un ROLAP).
5.1.2.2

Ventajas de MOLAP
Consulta rápidas debido a la optimización del rendimiento de
almacenamiento, la indexación multidimensional y la memoria
caché.

Ocupa menor tamaño en disco en comparación con los datos
almacenados en base de datos relacional debido a técnicas de
compresión.

Automatización del procesamiento de los datos agregados de
mayor nivel.

Muy compacto para conjuntos de datos de pocas dimensiones.

El modelo de almacenamiento en vectores/matrices proporciona
una indexación natural.

Eficaz extracción de datos lograda gracias a la pre-estructuración
de los datos agregados.
5.1.2.3

Desventajas de MOLAP
La etapa de procesamiento (carga de datos) puede ser bastante
larga,
sobre
todo
para
grandes
volúmenes
de
datos.
Normalmente, esto se puede evitar con un procesamiento
incremental, es decir, sólo el procesamiento de los datos que han
Tnlg. Cristian Paul Peñaloza Salamea.
43
Universidad Católica de Cuenca
Sistemas OLAP
cambiado (por lo general, los nuevos datos) en lugar de volver a
procesar de todo el conjunto de datos.

Las herramientas MOLAP tradicionalmente tienen dificultades
para consultar con modelos con dimensiones muy altas (del orden
de millones de miembros).

Algunas herramientas MOLAP tienen dificultades para actualizar y
consultar los modelos con más de diez dimensiones. Este límite
varía en función de la complejidad y la cardinalidad de las
dimensiones de que se trate. También depende de la cantidad
de hechos o medidas almacenados. Otras herramientas MOLAP
(por ejemplo, Microsoft Análisis Services o Applix TM1) puede
manejar cientos de dimensiones.

El enfoque MOLAP introduce redundancia en los datos.
5.1.2.4
Grafico
Cuadro No 9: Ventajas y Desventajas Molap
Tnlg. Cristian Paul Peñaloza Salamea.
44
Universidad Católica de Cuenca
5.1.3
Sistemas OLAP
HOLAP
Hybrid OnLine Analytical Processing
5.1.3.1 Introducción
HOLAP (Hybrid Online Analytical Process, procesamiento analítico
en línea híbrido) es una combinación de ROLAP y MOLAP, que son otras
posibles implementaciones de OLAP. HOLAP permite almacenar una
parte de los datos como en un sistema MOLAP y el resto como en uno
ROLAP. El grado de control que el operador de la aplicación tiene sobre
este particionamiento varía de unos productos a otros.
5.1.3.2
Particionamiento Vertical
En este modo, HOLAP almacena agregaciones como un MOLAP
para mejorar la velocidad de las consultas, y los datos se detallan en
ROLAP para optimizar el tiempo en que se procesa el cubo.
5.1.3.3
Particionamiento Horizontal
En este modo HOLAP almacena una sección de los datos,
normalmente los más recientes (por ejemplo particionando por la
dimensión tiempo) en modo MOLAP para mejorar la velocidad de las
consultas, y los datos más antiguos en ROLAP. Además, se pueden
almacenar algunos cubos en MOLAP y otros en ROLAP.
Tnlg. Cristian Paul Peñaloza Salamea.
45
Universidad Católica de Cuenca
5.2
Sistemas OLAP
Comparación
5.2.1 Comparación General
Cada sistema OLAP tiene ciertos beneficios (aunque existe
desacuerdo acerca de las características específicas de los beneficios
entre los proveedores).
Algunas implementaciones MOLAP son propensas a la "explosión"
de la base de datos; este fenómeno provoca la necesidad de grandes
cantidades de espacio de almacenamiento para el uso de una base
de datos MOLAP cuando se dan ciertas condiciones: elevado número
de
dimensiones,
resultados
precalculados
y
escasos
datos
multidimensionales. Las técnicas habituales de atenuación de la
explosión de la base de datos no son todo lo eficientes que sería
deseable.
Por lo general MOLAP ofrece mejor rendimiento debido a la
especializada indexación y a las optimizaciones de almacenamiento.
MOLAP también necesita menos espacio de almacenamiento en
comparación con los especializados ROLAP porque su almacenamiento
especializado normalmente incluye técnicas de compresión.
ROLAP es generalmente más escalable. Sin embargo, el gran
volumen de preprocesamiento es difícil de implementar eficientemente
Tnlg. Cristian Paul Peñaloza Salamea.
46
Universidad Católica de Cuenca
Sistemas OLAP
por lo que con frecuencia se omiten; por tanto, el rendimiento de una
consulta ROLAP puede verse afectado.
Desde la aparición de ROLAP van apareciendo nuevas versiones
de bases de datos preparadas para realizar cálculos, las funciones
especializadas que se pueden utilizar tienen más limitaciones.
HOLAP (OLAP Híbrido) engloba un conjunto de técnicas que
tratan de combinar MOLAP y ROLAP de la mejor forma posible.
Generalmente puede pre-procesar rápidamente, escala bien, y
proporciona una buena función de apoyo.
5.2.2 ROLAP vs. MOLAP
Cuando se comparan las dos arquitecturas, se pueden realizar las
siguientes observaciones:

El ROLAP delega la negociación entre tiempo de respuesta y el
proceso batch al diseño del sistema. Mientras, el MOLAP, suele
requerir que sus bases de datos se precompilen para conseguir un
rendimiento aceptable en las consultas, incrementando, por
tanto los requerimientos batch.

Los sistemas con alta volatilidad de los datos (aquellos en los que
cambian las reglas de agregación y consolidación), requieren
una arquitectura que pueda realizar esta consolidación ad-hoc.
Los sistemas ROLAP soportan bien esta consolidación dinámica,
Tnlg. Cristian Paul Peñaloza Salamea.
47
Universidad Católica de Cuenca
mientras
que
los
Sistemas OLAP
MOLAP
están
más
orientados
hacia
consolidaciones batch.

Los ROLAP pueden crecer hasta un gran número de dimensiones,
mientras que los MOLAP generalmente son adecuados para diez
o menos dimensiones.

Los ROLAP soportan análisis OLAP contra grandes volúmenes de
datos elementales, mientras que los MOLAP se comportan
razonablemente en volúmenes más reducidos (menos de 5 Gb)
Por ello, y resumiendo, el ROLAP es una arquitectura flexible y
general, que crece para dar soporte a amplios requerimientos OLAP. El
MOLAP
es
una
solución
particular,
adecuada
para
soluciones
departamentales con unos volúmenes de información y número de
dimensiones más modestos.
5.3
Otros Tipos
Los siguientes acrónimos a veces también se utilizan, aunque no son
sistemas tan generalizados como los anteriores:

WOLAP o Web OLAP: OLAP basado u orientado para la web.

DOLAP o Desktop OLAP: OLAP de escritorio

RTOLAP o Real Time OLAP: OLAP en tiempo real

SOLAP o Spatial OLAP: OLAP espacial
Tnlg. Cristian Paul Peñaloza Salamea.
48
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 6
Soluciones OLAP
6.1
Data Mart
Data Mart: Son almacenes de datos con información de interés
particular para un determinado sector de la empresa.
6.2
Esquema Estrella
Para facilitar el análisis, el data mart organiza los datos en una
estructura llamada esquema de estrella.
Esta estructura está compuesta por una tabla central (tabla de
hechos) y un conjunto de tablas organizadas alrededor de ésta (tablas
de dimensiones).
En las puntas de la estrella se encuentran las tablas de dimensión
que contienen los atributos de las aperturas que interesan al negocio
que se pueden utilizar como criterios de filtro y son relativamente
pequeñas. Cada tabla de dimensión se vincula con la tabla de hechos
por un identificador.
6.2.1
Características del Esquema Estrella
Las características de un esquema de estrella son:
 El centro de la estrella es la tabla de hecho.
 Los puntos de la estrella son las tablas de dimensiones.
Tnlg. Cristian Paul Peñaloza Salamea.
49
Universidad Católica de Cuenca
Sistemas OLAP
 Cada esquema está compuesto por una sola tabla de hechos.
 Generalmente
pudiendo
estar
es
un
esquema
parcialmente
totalmente
normalizado
en
desnormalizado,
las
tablas
de
dimensiones.
Dimensión
Dimensión
Servicio
Paciente
Tabla de Hechos
Admisión Pacientes
Dimensión
Dimensión
Zona Geográfica
Tiempo
Cuadro No 10: Esquema Estrella.
6.2.2
Tabla de Hechos
El modelo dimensional divide el mundo de los datos en dos
grandes tipos: las medidas y las dimensiones de estas medidas.
Las medidas, siempre son numéricas, se almacenan en las tablas
de hechos y las dimensiones que son textuales se almacenan en las
tablas de dimensiones.
La tabla de hechos es la tabla primaria del modelo dimensional, y
contiene los valores del negocio que se desea analizar.
Tnlg. Cristian Paul Peñaloza Salamea.
50
Universidad Católica de Cuenca
Sistemas OLAP
 Cada tabla de hechos contiene las claves externas, que se
relacionan con sus respectivas tablas de dimensiones, y las columnas
con los valores que serán analizados.
6.2.3
Tabla de Dimensiones
Las dimensiones organizan los datos en función de un área de
interés para los usuarios.
Cada dimensión describe un aspecto del negocio y proporciona
el acceso intuitivo y simple a datos.
Una dimensión provee al usuario de un gran número de
combinaciones e intersecciones para analizar datos.
Las tablas de dimensiones son las compañeras de las tablas de
hechos. Cada dimensión se define por su clave primaria que sirve para
mantener la integridad referencial en la tabla de hechos a la que se
relaciona.
Un cubo requiere que se defina al menos una dimensión en su
esquema.
6.3
Esquema Copo de Nieve.
El esquema copo de nieve es una variación del esquema estrella
donde alguna punta de la estrella se explota en más tablas.
El nombre del esquema se debe a que el diagrama se asemeja a
un copo de nieve.
Tnlg. Cristian Paul Peñaloza Salamea.
51
Universidad Católica de Cuenca
Sistemas OLAP
En este esquema, las tablas de dimensión copo de nieve se
encuentran normalizadas para eliminar redundancia de datos.
A diferencia del esquema estrella, los datos de las dimensiones se
reparten en múltiples tablas.
Como ventaja del esquema destacamos el ahorro de espacio de
almacenamiento en disco, pero en perjuicio de un aumento en la
cantidad de tablas.
País
Copo de nieve
Dimensión zona
Geografica
Provincia
Ciudad
Servicio
Admisión
Paciente
Paciente
Tiempo
Cuadro No 11: Esquema Copo de Nieve.
6.3.1
Características del Esquema Copo de Nieve
Los siguientes son las características de un copo de nieve:
 La dimensión está normalizada
Tnlg. Cristian Paul Peñaloza Salamea.
52
Universidad Católica de Cuenca
Sistemas OLAP
 Los distintos niveles se encuentran almacenados en tablas
separadas
 Se argumenta ahorro de espacio
6.4
Medidas
Las medidas son los valores de datos que se analizan.
Una medida es una columna cuantitativa, numérica, en la tabla
de hechos. Las medidas representan los valores que son analizados,
como cantidad de pacientes admitidos o llamadas efectuadas.
Las medidas son:

Valores que permiten analizar los hechos.

Valores numéricos porque estos valores son las bases de las
cuales el usuario puede realizar cálculos.
Si la medida fuera un valor no numérico debemos codificarla a un
valor numérico en el proceso de obtención de datos, y luego cuando
tengamos que exponer sus valores decodificarla para mostrarla con el
valor original.
6.4.1
Características de las medidas
Las siguientes son algunas de las características de las medidas:
® Deben ser numéricas.
® Cruzan todas las dimensiones en todos los niveles.
Tnlg. Cristian Paul Peñaloza Salamea.
53
Universidad Católica de Cuenca
Sistemas OLAP
6.4.2 Medidas Naturales
Son las columnas numéricas que queremos analizar que provienen
directamente de los sistemas OLTP.
Cuando definimos una medida debemos tener en cuenta cual
será la forma de agregación (agrupación de la misma) al subir por la
estructura dimensional.
Estas formas de agregación pueden ser:
 Suma: es la operación que suma los valores de las columnas
 Cuenta: realiza un conteo de los valores
 Mínima: devuelve un valor mínimo
 Máxima: proporciona el mayor de los valores
 Cuenta de Distintos: cuenta los valores diferentes
6.4.3
Medidas Calculadas
Son las medidas que se calculan en el cubo en base a los valores de las
medidas naturales.
El sentido de la expresión medidas calculadas es muy amplio y engloba
a cualquier manipulación de las medidas naturales que nos faciliten el
análisis de los hechos.
En una medida calculada puede haber:
 Cálculos Matemáticos
Tnlg. Cristian Paul Peñaloza Salamea.
54
Universidad Católica de Cuenca
Sistemas OLAP
 Expresiones condicionales
 Alertas
Estos tres tipos (cálculos, condiciones y alertas) usualmente pueden
existir juntos dentro de la misma medida calculada.
Tnlg. Cristian Paul Peñaloza Salamea.
55
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 7
Cubos OLAP
7.1
Introducción
Cuadro No 12: Cubo OLAP.
Los cubos de información o cubos OLAP funcionan como los
cubos de rompecabezas en los juegos, en el juego se trata de armar los
colores y en el datawarehouse se trata de organizar los datos por tablas
o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos
OLAP tienen un número indefinido de dimensiones, razón por la cual
también reciben el nombre de hipercubos. Un cubo OLAP contendrá
datos
de
una
determinada
variable
que
se
desea
analizar,
proporcionando una vista lógica de los datos provistos por el sistema de
información hacia el datawarehouse, esta vista estará dispuesta según
unas dimensiones y podrá contener información calculada. El análisis de
los datos está basado en las dimensiones del hipercubo, por lo tanto, se
trata de un análisis multidimensional.
Tnlg. Cristian Paul Peñaloza Salamea.
56
Universidad Católica de Cuenca
Sistemas OLAP
A la información de un cubo puede acceder el ejecutivo
mediante "tablas dinámicas" en una hoja de cálculo o a través de
programas personalizados. Las tablas dinámicas le permiten manipular
las vistas (cruces, filtrados, organización, totales) de la información con
mucha facilidad. Las diferentes operaciones que se pueden realizar con
cubos de información se producen con mucha rapidez. Llevando estos
conceptos a un datawarehouse, éste es una colección de datos que
está formada por «dimensiones» y «variables», entendiendo como
dimensiones a aquellos elementos que participan en el análisis y
variables a los valores que se desean analizar.
7.2
Dimensiones y Jerarquías
Cada una de las dimensiones de un cubo OLAP puede resumirse
mediante una jerarquía. Por ejemplo si se considera una escala (o
dimensión) temporal "Mayo de 2005" se puede incluir en "Segundo
Trimestre de 2005", que a su vez se incluye en "Año 2005". De igual
manera, otra dimensión de un cubo que refleje una situación
geográfica, las ciudades se pueden incluir en regiones, países o
regiones mundiales; los productos podrían clasificarse por categorías, y
las partidas de gastos podrían agruparse en tipos de gastos. En cambio,
el analista podría comenzar en un nivel muy resumido, como por
ejemplo el total de la diferencia entre los resultados reales y lo
presupuestado, para posteriormente descender en el cubo (en sus
Tnlg. Cristian Paul Peñaloza Salamea.
57
Universidad Católica de Cuenca
Sistemas OLAP
jerarquías) para poder observar con un mayor nivel de detalle que le
permita descubrir en el cubo los lugares en los que se ha producido esta
diferencia, según los productos y períodos.
7.3
Dispersión en Cubos OLAP
Vincular o enlazar cubos es un mecanismo para superar de la
dispersión. Ésta se produce cuando no todas las celdas del cubo se
rellenan con datos (escasez de datos o valores nulos). El tiempo de
procesamiento es tan valioso que se debe adoptar la manera más
efectiva de sumar ceros (los valores nulos o no existentes). Por ejemplo
los ingresos pueden estar disponibles para cada cliente y producto,
pero los datos de los costos pueden no estar disponibles con esta
cantidad de análisis. En lugar de crear un cubo disperso, a veces es
mejor crear otro distinto, pero vinculado, cubo en el que un subconjunto
de los datos se puede analizar con gran detalle. La vinculación asegura
que los datos de los dos cubos mantienen una coherencia.
7.4
Acceso y cálculo de un Cubo OLAP
Los datos de los cubos pueden ser actualizados de vez en
cuando, tal vez por personas diferentes de forma concurrente. Para
solventar este problema a menudo es necesario bloquear partes de un
cubo mientras otro usuario está escribiendo, para volver a calcular los
totales en el cubo. Otras implementaciones añaden la posibilidad de
Tnlg. Cristian Paul Peñaloza Salamea.
58
Universidad Católica de Cuenca
Sistemas OLAP
mostrar una alerta que indique que los totales calculados previamente
ya no son válidos tras los nuevos datos. También hay algunos productos
que calculan los totales cuando se les necesita con los últimos datos
producidos en el sistema.
7.5
Definición técnica
En teoría de bases de datos, un cubo OLAP es una representación
abstracta de la proyección de una relación de un RDBMS (Sistema
administrador de bases de datos relacionales). Dada una relación de
orden N, se considera la posibilidad de una proyección que dispone de
los campos X, Y, Z como clave de la relación y de W como atributo
residual. Categorizando esto como una función se tiene que:
W: (X, Y, Z) → W
Los atributos X, Y, Z se corresponden con los ejes del cubo, mientras que
el valor de W devuelto por cada tripleta (X, Y, Z) se corresponde con el
dato o elemento que se rellena en cada celda del cubo.
Debido a que los dispositivos de salida (monitores, impresoras, ...) sólo
cuentan con dos dimensiones, no pueden caracterizar fácilmente
cuatro dimensiones, es más práctico proyectar "rebanadas" o secciones
de los datos del cubo (se dice proyectar en el sentido clásico vector
Tnlg. Cristian Paul Peñaloza Salamea.
59
Universidad Católica de Cuenca
Sistemas OLAP
analítico de reducción dimensional, no en el sentido de SQL, aunque los
dos conceptos son claramente análogos), tal vez la expresión:
W: (X, Y) → W
Aunque no se conserve la clave del cubo (al faltar el parámetro
Z), puede tener algún significado semántico, sin embargo, también
puede que una sección de la representación funcional con tres
parámetros para un determinado valor de Z también resulte de interés.
7.6
Seguridad
A la hora de diseñar el modelo multidimensional, es fundamental
definir la seguridad adecuada sobre los diferentes componentes y
niveles de la solución,
organización
la
debido a lo sensible que puede ser para la
información
que
suelen manejar
este
tipo
de
aplicaciones.
Al igual que ocurre con las bases de datos de los sistemas
transaccionales, en OLAP pueden manejarse distintos niveles de
seguridad.
La seguridad en OLAP tiene una arquitectura jerárquica,
partiendo del cubo y llegando al nivel de celda dentro del cubo.
De este modo, podemos definir los permisos a nivel de:
 Cubo
 Dimensión
Tnlg. Cristian Paul Peñaloza Salamea.
60
Universidad Católica de Cuenca
Sistemas OLAP
 Celda (Medida)
Cubo: esta restricción de seguridad se realiza sobre todo el cubo,
se puede permitir o denegar el acceso al cubo.
Permitido
Denegado
Cuadro No 13: Cuadro de Seguridad de Cubos.
Dimensión: Podemos permitir que el usuario vea la dimensión, que
acceda solo a una parte de ella, o que no tenga permiso de
visualizarla.
Permitido
Solo una parte
Denegado
Cuadro No 14: Cuadro de Seguridad de Dimensión.
Celda: En una celda o medida podemos permitir el acceso, o
bien
personalizarlo
utilizando
expresiones
que
verifiquen
alguna
condición para acceder a los datos.
Otra opción para limitar los accesos puede ser el uso de cubos
virtuales. Podríamos crear un cubo virtual solo con las medidas que
deseamos que tenga acceso el usuario y luego otorgar los permisos
sobre el cubo virtual, y denegar o no otorgar permiso sobre el cubo
original.
Tnlg. Cristian Paul Peñaloza Salamea.
61
Universidad Católica de Cuenca
7.7
Sistemas OLAP
Consultas
Una vez que tenemos armado el cubo, los usuarios pueden
realizar diferentes operaciones para poder visualizar y analizar sus datos.
Las operaciones que se pueden realizar son:
 Drill - Down
 Drill - Up
 Slice y Dice. (Filtrado)
 Rotación
 Consolidación
Drill Down – Drill Up: Es una técnica por la que el usuario puede
navegar entre las jerarquías de una dimensión agrupando (Drill-up) o
desagrupando (Drill-down) los datos.
El drill down y el dril up sirven para navegar el cubo sobre sus
dimensiones, con el drill up se pasa desde el detalle a la generalización,
y con el drill down se pasa desde un nivel general al detalle.
Cuadro No 15: Drill Down – Drill Up
Tnlg. Cristian Paul Peñaloza Salamea.
62
Universidad Católica de Cuenca
Sistemas OLAP
Slice: Al seleccionar un miembro en particular de una dimensión
se forma una especie de rebanada (Slice) del cubo original.
Cuadro No 16: Slice
Dice: Al seleccionar varios miembros de varias dimensiones se
forma sub-cubo, cubo más pequeño o dado (dice). Tanto Slice como
Dice son formas particulares de Filtrado.
Cuadro No 17: Dice
Tnlg. Cristian Paul Peñaloza Salamea.
63
Universidad Católica de Cuenca
Sistemas OLAP
Rotación: Selecciona el orden de visualización de las dimensiones,
rota o gira el cubo según sus dimensiones.
Cuadro No 18: Rotación
Consolidación (Roll-Up): Calcula las medidas en función de
agrupamientos, realiza el re-cálculo de la medida de acuerdo a los
ajustes de escala.
Cuadro No 19: Consolidación
Tnlg. Cristian Paul Peñaloza Salamea.
64
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 8
Base de datos multidimensional
8.1
Introducción
Las bases de datos multidimensionales se utilizan principalmente
para crear aplicaciones OLAP y pueden verse como bases de datos de
una sola tabla, su peculiaridad es que por cada dimensión tienen un
campo (o columna), y otro campo por cada métrica o hecho, es decir
estas tablas almacenan registros cuyos campos son de la forma:
(d1, d2, d3,..., f1, f2, f3,...)
Donde los campos 'di' hacen referencia a las dimensiones de la
tabla, y los campos 'fi' a las métricas o hechos que se quiere almacenar,
estudiar o analizar.
8.2
Bases de datos multidimensional vs. Cubos OLAP
Cada una de estas tablas puede asimilarse a un hipercubo o más
concretamente si de herramientas OLAP se trata a un cubo OLAP,
donde las dimensiones del mismo se corresponden los campos de
dimensiones de la tabla (campos 'di...'), y el valor almacenado en cada
celda del cubo equivale a la métrica o métricas (campos 'fi...')
almacenadas en la tabla.
Tnlg. Cristian Paul Peñaloza Salamea.
65
Universidad Católica de Cuenca
8.3
Sistemas OLAP
Implementación
Lo más importante a tener en cuenta para implementar esta
estructura de datos es que la tabla contiene todas las n-tuplas, con los
valores de las dimensiones, o índice del cubo, y los valores de las
métricas previamente calculados para el cruce de valores del índice en
cuestión.
8.4
Ejemplo
Dada la siguiente especificación para una tabla (o hipercubo) en
una base de datos multidimensional.
Dimensión (Tiempo, Productos)
Jerarquía (Año->Semestre->Mes->Semana), (Categoría->Línea->Marca)
Elementos (2006, 2007,..., S1-06,..., Ene-06,..., 200625....),(Todos, Máquinas,
Refacciones, Máquinas caras, Máquinas Baratas, Máquina 1,...).
Hechos
(Ventas, Inventario, Defectos, Devoluciones)
Métricas (PD:=Devoluciones/Ventas, %Defectos)
La tabla resultante podría tener la forma siguiente:
Tabla
Tiempo
Productos
Inventario
Ventas
Defectos
Devoluciones
P/D
%Defectos
2006
Todos
1000
200
50
10
1/100
5%
10
100
10
10
10/10
100%
Ene06 Maquina1
Tnlg. Cristian Paul Peñaloza Salamea.
66
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 9
Base de datos multivaluada
9.1
Introducción
Las bases de datos Multivaluadas (multivalue database) son un
tipo especial de base de datos multidimensionales, también llamadas
bases de datos PICK por el primer desarrollo que se realizo de este tipo,
la aplicación "Pick operating system".
9.2
Historia
El modelo de datos multivaluado fue definido por Don Nelson a
mediados de los 60, y en 1968 se realizó la primera implementación de
un sistema de bases de datos multidimensional, este desarrollo se
atribuye a Dick Pick (de ahí que también se utilice el termino Base de
datos Pick para este tipo de bases de datos).
9.3
Concepto
El modelo de datos más extendido es el modelo relacional, este
modelo se basa en las leyes de la normalización de bases de datos;
según estas normas, y concretamente, según la primera forma normal,
un campo de una base de datos no puede contener valores múltiples.
En una base de datos multivaluada no se aplica la regla de la primera
Tnlg. Cristian Paul Peñaloza Salamea.
67
Universidad Católica de Cuenca
Sistemas OLAP
forma normal, es decir, se permite que un campo pueda tener más de
un valor almacenado.
9.4
Ejemplo
Supongamos una base de datos en la que queremos almacenar
información de clientes; se supone que cada cliente puede tener más
de un teléfono. En el modelo relacional habría que crear dos tablas o
relaciones como estas:
Tabla 'Cliente'
ID Cliente
Nombre
Apellido
123
Rachel
Ingram
456
James
Wright
789
María
Fernández
Tabla 'Teléfono cliente'
ID Cliente
Teléfono
123
555-861-2025
456
555-776-4100
789
555-808-9633
Tnlg. Cristian Paul Peñaloza Salamea.
68
Universidad Católica de Cuenca
Sistemas OLAP
En el modelo multivaluado la siguiente tabla (que no cumple la
primera forma normal) es perfectamente válida:
Tabla 'Cliente'
ID Cliente
Nombre
Apellido
Teléfono
123
Rachel
Ingram
555-861-2025
456
James
Wright
555-403-1659
555-776-4100
789
María
Fernández
555-808-9633
Tnlg. Cristian Paul Peñaloza Salamea.
69
Universidad Católica de Cuenca
Sistemas OLAP
Capitulo 10
Conclusiones y Recomendaciones
10.1
Conclusiones
Las principales conclusiones obtenidas a lo largo de nuestro
proyecto de investigación son:
 Un sistema de BI constituye una necesidad para el correcto
manejo del negocio.
 Los Sistemas OLAP son una muy buena herramienta para sustentar
la evolución y el crecimiento del negocio y deben estar diseñados
de forma tal que puedan seguir esa evolución y crecimiento.
 Los Sistemas OLAP influyen en toda la empresa, no son una
facilidad de un sector.
 Cualquier empresa que se proponga cumplir con sus objetivos
debe tener un Sistema OLAP. Estos Sistemas no son sólo para las
grandes empresas.
 Los Sistemas OLAP no son máquinas de fabricar informes.
 El tener un Sistema OLAP no es un lujo para la empresa, es
responder a una necesidad.
Tnlg. Cristian Paul Peñaloza Salamea.
70
Universidad Católica de Cuenca
Sistemas OLAP
 Los Sistemas OLAP son válidos para cualquier proceso en el que
deban tomarse decisiones, no son propiedad de las áreas
comerciales o financieras.
 Los Sistemas OLAP no son una herramienta del área de Sistemas
para mantener cautivos a los usuarios. Por el contrario, con un
Sistema OLAP los usuarios consiguen más independencia al poder
realizar las consultas en forma intuitiva y flexible.
 Construir un Sistema OLAP tiene como valor agregado el tener
que revisar dónde y cómo se están almacenando los datos de los
sistemas transaccionales (OLTP). Es una muy buena oportunidad
de incluir en los procesos manejos de datos que se estén
haciendo manualmente y sin soporte alguno.
 El desarrollo de un Sistema OLAP no se comienza por la elección
de la herramienta de visualización. Como en todo desarrollo hay
que relevar las necesidades de la empresa, consultar a los
usuarios, fijar el alcance y las restricciones y, finalmente, diseñar,
desarrollar y probar cada etapa.
 El desarrollo de un Sistema OLAP no termina con la creación de un
cubo multidimensional. Se deben definir e implementar los
trabajos de procesamiento de los cubos (periodicidad, horario,
manejo de errores, etcétera).
Tnlg. Cristian Paul Peñaloza Salamea.
71
Universidad Católica de Cuenca
Sistemas OLAP
 Existe una gran variedad de herramientas de visualización de
datos. Debe brindarse a cada usuario la que más le convenga, sin
descuidar el presupuesto. La herramienta de visualización no
debe ser una barrera entre el usuario y el Sistema OLAP.
Tnlg. Cristian Paul Peñaloza Salamea.
72
Universidad Católica de Cuenca
10.2
Sistemas OLAP
Recomendación
Antes de realizar cualquier acción, tomemos en cuenta la
necesidad de nuestro negocio, ubicando en un escalón superior las
deficiencias de la misma. De manera que la elección de nuestra
herramienta sea la correcta.
Además no olvidar que los Sistemas de Información ayuda a la
organización a encontrar defectos para una mejor toma de decisión,
no los solucionan automáticamente.
Tomar en cuenta que no basta con crear cubos OLAP sino que
debemos implementarlos.
Utilizar las Bases de Datos Empresariales como fuentes de
Información para realzar la producción de nuestro organismo y no
como una caja donde se almacena datos inertes que a lo largo del
tiempo se olvida y no se da ningún uso útil.
10.3
Bibliografía
1.- www.wikipedia.org
2.- www.olap.com
3.- www.rincondelvago.com
4.- www.monagrafias.com
5.- Libros de inteligencia de negocios.
6.- Manual de Implementación OLAP.
7.- Manual de Cubos OLAP.
Tnlg. Cristian Paul Peñaloza Salamea.
73
Universidad Católica de Cuenca
10.4
Sistemas OLAP
Cronograma
El siguiente cronograma es el que se ha cumplido en el desarrollo
de este Trabajo de Investigación:
Tnlg. Cristian Paul Peñaloza Salamea.
74
Universidad Católica de Cuenca
10.5
Sistemas OLAP
Índices de Figuras
Cuadro N° 1. Clasificación de los Sistemas OLAP………………………..…..4
Cuadro N° 2. Procesos Operacionales…………………………………...……23
Cuadro N° 3. Almacenamiento Transaccional………………………………24
Cuadro N° 4. Transformación y Agrupación de Datos………………..……33
Cuadro N° 5. Datos Operacionales y Datawarehouse………………….…34
Cuadro N° 6. Varias Columnas a una….………………………………………34
Cuadro N° 7. Una columna a varias……………………………………………35
Cuadro N° 8. Ventajas y Desventajas Rolap………………….………………42
Cuadro N° 9. Ventajas y Desventajas Molap…………...…….………………44
Cuadro N° 10. Esquema Estrella…………………………………………………50
Cuadro N° 11. Esquema Copo de Nieve……...………………………………52
Cuadro N° 12. Cubos OLAP………………………………………………………56
Cuadro N° 13. Cuadro de seguridad de Cubos……..………………………61
Cuadro N° 14. Cuadro de seguridad de Dimensión...………………………61
Cuadro N° 15. Drill Down – Drill Up………………..……..………………………62
Tnlg. Cristian Paul Peñaloza Salamea.
75
Universidad Católica de Cuenca
Sistemas OLAP
Cuadro N° 16. Slice………………………………….……..………………………63
Cuadro N° 17. Dice………………………………….……..………………………63
Cuadro N° 18. Rotación...………………………….……..………………………64
Cuadro N° 19. Consolidación….………………….……..………………………64
Tnlg. Cristian Paul Peñaloza Salamea.
76
Descargar