Universidad Católica de Cuenca Sistemas OLAP Capitulo 1 Sistemas de información 1.1. Visión de los sistemas de información. La empresa puede ser vista como un sistema, es decir, como un “conjunto de elementos interdependientes, como un conjunto organizado, como partes que interactúan formando un todo unitario y complejo” utilizando. El conjunto empresa puede ser desagregado en partes o subsistemas, existiendo varias formas de efectuar tal descomposición. Institucional: Conformado por la misión, creencias y valores de la organización; Gestión: Comprende el proceso de gestión, divido en las etapas de planeamiento, ejecución y control. Organización: Se refiere a la estructura organizacional adoptada y a la delegación de autoridad resultante. Psico-socio-político-cultural: Refleja el comportamiento de los integrantes de la organización, considerando sus factores personales y comporta mentales. Producción físico-operacional: Donde ocurren las transacciones. Tnlg. Cristian Paul Peñaloza Salamea. 1 Universidad Católica de Cuenca Sistemas OLAP Información: Instrumento de suporte al proceso de gestión concebido a la luz de las directivas y políticas emanadas de este proceso. La información adecuada para el cumplimiento de los objetivos depende, por tanto, no solamente de la disponibilidad de datos, sino también de como son colectados, almacenados e interpretados y en este proceso tenemos tecnología y personas involucradas. 1.2 Clasificación de los sistemas de información. Los sistemas de información se han dividido de acuerdo al siguiente esquema: Sistemas Estratégicos: Orientados a soportar la toma de decisiones, facilitan la labor de la dirección, proporcionándole un soporte básico, aportando mejor información para la toma de decisiones. Se caracterizan porque son n sistemas sin carga periódica de trabajo, es decir, su utilización no es predecible, en contraposición a los que se utilizan en forma periódica. Se destacan entre estos sistemas: los Sistemas de Información Gerencial (MIS), Sistemas de Información Ejecutivos (EIS), Sistemas de Información Georeferencial (GIS), Sistemas de Simulación de Negocios (BIS y que en la práctica son sistemas expertos o de Inteligencia Artificial (AI). Tnlg. Cristian Paul Peñaloza Salamea. 2 Universidad Católica de Cuenca Sistemas OLAP Sistemas Tácticos: Diseñados para soportar las actividades de coordinación de actividades y manejo de documentación, definidos para facilitar consultas sobre información almacenada en el sistema, proporcionar informes y en resumen, facilitar la gestión, independiente de la información por parte de los niveles intermedios de la organización. Se destacan entre ellos: los Sistemas Ofimáticos (OA), Sistemas de Transmisión de Mensajería (Correo electrónico y Servidor de fax), coordinación y control de tareas (Work Flow) y tratamiento de documentos (Imagen, Trámite y Bases de Datos Documentales). Dentro de este grupo encontramos a los mencionados sistemas OLAP. Sistemas Técnico: Operativos, que cubren el núcleo de operaciones tradicionales de captura masiva de datos (Data Entry) y servicios básicos de tratamiento de datos, con tareas predefinidas (contabilidad, facturación, almacén, costos, presupuesto, personal y otros sistemas administrativos). Estos sistemas están evolucionando con la irrupción de censores, autómatas, sistemas multimedia, bases de datos relacionales más avanzadas y datawarehousing. Tnlg. Cristian Paul Peñaloza Salamea. 3 Universidad Católica de Cuenca Sistemas OLAP Sistemas Interinstitucionales: Este último nivel de sistemas de información recién está surgiendo. Es consecuencia del desarrollo organizacional orientado a un mercado de carácter global, el cual obliga a pensar e implementar estructuras de comunicación más estrechas entre la organización y el mercado (Empresa Extendida, Organización Inteligente e Integración Organizacional), todo esto a partir de la generalización de las redes informáticas de alcance nacional y global (INTERNET), que se convierten en vehículo de comunicación entre la organización y el mercado, no importa dónde esté la organización (INTRANET), el mercado de la institución (EXTRANET) y el mercado (Red Global). Cuadro No 1: Clasificación de los Sistemas de Información Tnlg. Cristian Paul Peñaloza Salamea. 4 Universidad Católica de Cuenca Sistemas OLAP Capitulo 2 Datawarehouse 2.1 ¿Qué es un datawarehouse (Almacén de Datos)? Un datawarehouse (almacén de datos) es una colección de datos en la cual se encuentra la información de la organización en forma integrada, clasificada por atributos, variante en el tiempo y no volátil, que se usa como soporte para el proceso de toma de decisiones gerenciales. Aunque diversas empresas y personas individuales logran comprender el enfoque de un datawarehouse, la experiencia ha demostrado que existen muchas dificultades potenciales. Reunir los elementos de datos apropiados desde diversas fuentes de aplicación en un ambiente integral centralizado, simplifica el problema de acceso a la información y en consecuencia, acelera el proceso de análisis, consultas y el menor tiempo de uso de la información. Las aplicaciones para soporte de decisiones basadas en un datawarehousing, pueden hacer más práctica y fácil la explotación de datos para una mayor eficacia del negocio, que no se logra cuando se usan sólo los datos que provienen de las aplicaciones operacionales (que ayudan en la operación de la empresa en sus operaciones Tnlg. Cristian Paul Peñaloza Salamea. 5 Universidad Católica de Cuenca Sistemas OLAP cotidianas), en los que la información se obtiene realizando procesos independientes y muchas veces complejos. Un datawarehouse se crea al extraer datos desde una o más bases de datos de aplicaciones operacionales. La data extraída es transformada para eliminar inconsistencias y resumir si es necesario y luego cargadas en el datawarehouse. El proceso de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para el acceso a la información institucional. Este nuevo enfoque ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con más responsabilidad. La innovación de la Tecnología de Información dentro de un ambiente datawarehousing puede permitir a cualquier organización hacer un uso más óptimo de los datos, como un ingrediente clave para un proceso de toma de decisiones más efectivo. Las organizaciones tienen que aprovechar sus recursos de información para crear la información de la operación del negocio, pero deben considerarse las estrategias tecnológicas necesarias para la implementación de una arquitectura completa de datawarehouse. 2.2 ¿Ventajas de los datawarehouse? Hay muchas ventajas por las que es recomendable usar un Datawarehouse. Algunas de ellas son: Tnlg. Cristian Paul Peñaloza Salamea. 6 Universidad Católica de Cuenca Sistemas OLAP Los almacenes de datos (Datawarehouse) hacen más fácil el acceso a una gran variedad de datos a los usuarios finales. Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisión tales como informes de tendencia', por ejemplo: obtener los ítems con la mayoría de las ventas en un área en particular dentro de los últimos dos años; informes de excepción, informes que muestran los resultados reales frente a los objetivos planteados a priori. Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes. 2.3 ¿Inconvenientes de los datawarehouse? Utilizar almacenes de datos también plantea algunos inconvenientes, algunos de ellos son: A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados. Los almacenes de datos se pueden quedar obsoletos relativamente pronto. Tnlg. Cristian Paul Peñaloza Salamea. 7 Universidad Católica de Cuenca Sistemas OLAP A veces, ante una petición de información estos devuelven una información subóptima, que también supone una pérdida para la organización. A menudo existe una delgada línea entre los almacenes de datos y sistemas operativos. Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el datawarehouse, resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a necesitarse. 2.4 ¿Función de un datawarehouse? En un datawarehouse lo que se quiere es contener datos que son necesarios o útiles para una organización, es decir, que se utiliza como un repositorio de datos para posteriormente transformarlos en información útil para el usuario. Un almacén de datos debe entregar la información correcta a la gente indicada en el momento óptimo y en el formato adecuado. El datawarehouse da respuesta a las necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones (DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fácilmente consultas sobre sus almacenes de datos sin tocar o afectar la operación del sistema. Tnlg. Cristian Paul Peñaloza Salamea. 8 Universidad Católica de Cuenca Sistemas OLAP En el funcionamiento de un almacén de los datos son muy importantes las siguientes ideas: Integración de los datos provenientes de bases de datos distribuidas por las diferentes unidades de la organización y que con frecuencia tendrán diferentes estructuras (fuentes heterogéneas). Se debe facilitar una descripción global y un análisis comprensivo de toda la organización en el almacén de datos. Separación de los datos usados en operaciones diarias de los datos usados en el almacén de datos para los propósitos de divulgación, de ayuda en la toma de decisiones, para el análisis y para operaciones de control. Ambos tipos de datos no deben coincidir en la misma base de datos, ya que obedecen a objetivos muy distintos y podrían entorpecerse entre sí. Periódicamente, se importan datos al almacén de datos de los distintos sistemas de planeamiento de recursos de la entidad (ERP) y de otros sistemas de software relacionados con el negocio para la transformación posterior (OLAP). Es práctica común normalizar los datos antes de combinarlos en el almacén de datos mediante herramientas de extracción, transformación y carga (ETL). Estas herramientas leen los datos primarios, realizan el proceso de transformación al datawarehouse y escriben en el almacén. Tnlg. Cristian Paul Peñaloza Salamea. 9 Universidad Católica de Cuenca 2.5 Sistemas OLAP Objetivos del Datawarehouse Minimizar costos a la hora de tomar decisiones. Se suprime el despilfarro de tiempo que se podía producir al intentar ejecutar consultas de datos largas y complejas con bases de datos que estaban diseñadas específicamente para transacciones más cortas y sencillas. Mejorar la flexibilidad ante el entorno. El DW convierte los datos operacionales en información relacionada y estructurada, que genera el "conocimiento" necesario para la toma de decisiones. Esto permite establecer una base única del modelo de información de la organización, que puede dar lugar a una visión global de la información en base a los conceptos de negocio que tratan los usuarios. Además, aporta una mejor calidad y flexibilidad en el análisis del mercado, y del entorno en general. Proveer una visión única de los clientes en toda la empresa. Esta visión global puede conllevar también la obtención de otras ventajas competitivas, al identificar determinados costes que con los sistemas anteriores podían permanecer ocultos. Realzar el servicio al cliente. Todo lo que hemos dicho en el punto anterior implica una importante mejora en la calidad de gestión, lo que también repercute en la relación con el cliente, que es, como sabemos, uno de los pilares básicos en los que descansa cualquier organización ajustada. De hecho, el que un DW implique una mayor flexibilidad ante el entorno tiene una consecuencia directa Tnlg. Cristian Paul Peñaloza Salamea. 10 Universidad Católica de Cuenca Sistemas OLAP en una mayor capacidad para responder a las necesidades de los clientes. Rediseñar los procesos. Ofrecer a los usuarios una capacidad de análisis de la información de su negocio que tiende a ser ilimitada y permite con frecuencia obtener una perspectiva más profunda y clara de los procesos de negocio propiamente dichos, lo que a su vez permite obtener ideas renovadoras para la rediseño de los mismos. Predecir compras de productos. Se logra llevar un control exacto de los productos, así como su comercialización. Poner tanta información comercial como sea posible. La información de la institución es clara y bien recabada, de manera que nuestros proveedores, directamente puedan lograr conocer las necesidades de la empresa y la comunicación entre clientes fluya sin problema alguno. 2.6 ¿Cómo trabaja el Datawarehouse? Cualquier empresa, independientemente de su tamaño, cuenta con un conjunto de aplicaciones de procesamiento transaccional que mecanizan los procesos operativos, muy estructurados y repetitivos, que Tnlg. Cristian Paul Peñaloza Salamea. 11 Universidad Católica de Cuenca Sistemas OLAP vienen a constituir las funciones básicas de la entidad, tales como la facturación, contabilidad, nóminas, etc. El datawarehouse constituye el subsistema de información operativo o transaccional, en él se procesan de manera automática, grandes volúmenes de datos referentes a las actividades rutinarias, que se almacenan en bases de datos operativas. De ellas se puede extraer información, fundamentalmente válida para las transacciones del día a día, es decir, sirven para apoyar y ejecutar las decisiones operativas que conducen las actividades básicas, pero no sirven para realizar análisis más avanzados, incluso de tipo estratégico, ya que no están diseñadas para apoyar este tipo de tareas. A partir de los datos almacenados en estas bases de datos operativas, las cuales suelen ser inconsistentes en la manera en que representan los datos (por ejemplo, distintas bases de datos pueden estar utilizando unidades de medidas diferentes para los mismos atributos), Se extrae un cúmulo de conocimientos o informaciones que aporten un valor añadido a la gestión adecuada de la empresa. Datawarehouse es el proceso de extraer y filtrar datos de las operaciones comunes de la empresa, procedentes de los distintos subsistemas operacionales, para transformarlos, integrarlos, sumariarlos y almacenarlos en un depósito o repositorio, para poder acceder a ellos cada que se necesite. Tnlg. Cristian Paul Peñaloza Salamea. 12 Universidad Católica de Cuenca Sistemas OLAP Luego concentra la información de interés para toda la organización y distribuye dicha información por medio de diversas herramientas de consulta y de creación de informes orientadas a la toma de decisiones. Con esta tecnología se convierten los datos operacionales de una organización en una herramienta competitiva, que permite a los usuarios finales examinar los datos de modo más estratégico, realizar análisis y detección de tendencias, seguimiento de medidas críticas, producir informes con mayor rapidez, un acceso más fácil, más flexible y más intuitivo a la información que se necesite en cada momento. De esta manera el datawarehouse reúne y consolida las bases de datos diferentes, que se mantienen en los diferentes departamentos o áreas funcionales de la empresa como subsistemas de información independientes, en una gran base de datos, recogiendo datos muy dispares y, muchas veces infrautilizados, procedentes de fuentes internas repartidas por toda la organización. También recogerá datos o informaciones externas, que rutinariamente se recibe sobre las diferentes entidades u objetos de información, es decir, clientes, proveedores, productos y servicios, canales, estructura organizativa, competencia, mercado, coyuntura económica, etc... Tnlg. Cristian Paul Peñaloza Salamea. 13 Universidad Católica de Cuenca Sistemas OLAP Todo ello, con el objetivo preciso de convertir los datos operacionales en información relacionada y estructurada 2.7 ¿En qué se lo puede usar? o Manejo de relaciones de marketing. Mejora la producción de sistemas que pueden manejar cientos o miles de usuarios, al datawarehouse acceda un limitado conjunto de usuarios en cualquier tiempo determinado. Ahorrando dinero y esfuerzo a cualesquier institución. o Análisis de rentabilidad. Investiga la situación actual de la empresa, recopilando información de lo más profundo, para comparar con datos verídicos de años pasados, visualizando informes relativamente cuantitativos, que ayudará al ejecutivo a la toma de decisiones casi en cien por ciento confiables y productivas a corto plazo. o Reducción de costos. Debido a la necesidad de investigar tendencias y evaluar las relaciones entre muchas clases de datos, las consultas al datawarehouse permiten acceder a volúmenes muy grandes tanto de datos detallados como resumidos. Permitiendo disponer de menor número de personal, acortando precios a la hora de su producción. Tnlg. Cristian Paul Peñaloza Salamea. 14 Universidad Católica de Cuenca Sistemas OLAP Capitulo 3 OLTP 3.1 Introducción OLTP es la sigla en inglés de Procesamiento de Transacciones En Línea (Online Transaction Processing) es un tipo de sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones (gestor transaccional). Los paquetes de software para OLTP se basan en la arquitectura cliente-servidor ya que suelen ser utilizados por empresas con una red informática distribuida. El término puede parecer ambiguo, ya que puede entenderse "transacción" en el contexto de las "transacciones computacionales" o de las "transacciones en bases de datos". También podría entenderse en términos de transacciones de negocios o comerciales. OLTP también se ha utilizado para referirse a la transformación en la que el sistema responde de inmediato a las peticiones del usuario. Un Cajero automático de un banco es un ejemplo de una aplicación de procesamiento de transacciones comerciales. La tecnología OLTP se utiliza en innumerables aplicaciones, como en banca electrónica, procesamiento de pedidos, comercio electrónico, supermercados o industria. Tnlg. Cristian Paul Peñaloza Salamea. 15 Universidad Católica de Cuenca 3.2 Sistemas OLAP Beneficios El procesamiento de transacciones en línea tiene dos claros beneficios: la simplicidad y la eficiencia. Sobre la simplicidad: La reducción de la documentación y la obtención de previsiones de ingresos y gastos de forma más rápida y precisa son ejemplos de cómo OLTP hace las cosas más simples para las empresas. También proporciona una base concreta para la estabilidad de una organización gracias a las actualizaciones oportunas. Otro factor es que la simplicidad de permitir a los consumidores la elección de la forma en que desean pagar, por lo que es mucho mas atractivo que la de hacer transacciones. Sobre la eficiencia 3.3 OLTP amplia la base de consumidores para la organización. Los procesos individuales se ejecutan mucho más rápido. Inconvenientes OLTP es una gran herramienta para cualquier organización, aunque en su utilización hay algunas cuestiones en las que se debe pensar ya que Tnlg. Cristian Paul Peñaloza Salamea. 16 Universidad Católica de Cuenca Sistemas OLAP pueden suponer un problema: la seguridad y los costes económicos o de tiempo. Sobre la seguridad: Una de las ventajas de OLTP es también un posible problema. La disponibilidad a todo el mundo que estos sistemas ofrecen a las empresas hacen a sus bases de datos mucho más susceptibles a los intrusos y hackers. Sobre los costes: En las transacciones B2B, las empresas deben ir fuera de línea (offline) para completar ciertos pasos de algún proceso, causando que los compradores y proveedores pierdan algunos de los beneficios de eficiencia que el sistema proporciona. Tan simple como es un sistema OLTP, la más simple perturbación en el sistema tiene el potencial de causar una gran cantidad de problemas, que a su vez pueden causar una pérdida de tiempo y dinero. Otro costo económico es la posibilidad de que se produzcan fallos en el servidor, esto puede causar retrasos en el servicio e incluso la perdida de gran cantidad de información importante. Para eliminar este riesgo o, al menos mitigarlo, se debe invertir en mecanismos de seguridad. Tnlg. Cristian Paul Peñaloza Salamea. 17 Universidad Católica de Cuenca 3.4 Sistemas OLAP Diferencias del Datawarehouse vs OLTP Los sistemas tradicionales de transacciones y las aplicaciones de Data Warehousing son polos opuestos en cuanto a sus requerimientos de diseño y sus características de operación. Las aplicaciones de OLTP están organizadas para ejecutar las transacciones para los cuales fueron hechos, como por ejemplo: mover dinero entre cuentas, un cargo o abono, una devolución de inventario, etc. Por otro lado, un Datawarehouse está organizado en base a conceptos, como por ejemplo: clientes, facturas, productos, etc. Otra diferencia radica en el número de usuarios. Normalmente, el número de usuarios de un Datawarehouse es menor al de un OLTP. Es común encontrar que los sistemas transaccionales son accedidos por cientos de usuarios simultáneamente, mientras que los Datawarehouse sólo por decenas. Los sistemas de OLTP realizan cientos de transacciones por segundo mientras que una sola consulta de un Datawarehouse puede tomar minutos. Otro factor es que frecuentemente los sistemas transaccionales son menores en tamaño a los Datawarehouses, esto es debido a que un Datawarehouse puede estar formado por información de varios OLTP´s. Existen también diferencia en el diseño, mientras que el de un OLTP es extremadamente normalizado, el de un Datawarehouse tiende a ser desnormalizado. El OLTP normalmente está formado por un número Tnlg. Cristian Paul Peñaloza Salamea. 18 Universidad Católica de Cuenca Sistemas OLAP mayor de tablas, cada una con pocas columnas, mientras que en un Datawarehouse el número de tablas es menor, pero cada una de éstas tiende a ser mayor en número de columnas. Los OLTP son continuamente actualizados por los sistemas operacionales del día con día, mientras que los Datawarehouse son actualizados en batch de manera periódica. Las estructuras de los OLTP son muy estables, rara vez cambian, mientras las de los Datawarehouses sufren cambios constantes derivados de su evolución. Esto se debe a que los tipos de consultas a los cuales están sujetos son muy variados y es imposible preverlos todos de antemano. Mejorar la Entrega de Información: información completa, correcta, consistente, oportuna y accesible. Información que la gente necesita, en el tiempo que la necesita y en el formato que la necesita. Mejorar el Proceso de Toma de Decisiones: con un mayor soporte de información se obtienen decisiones más rápidas; así también, la gente de negocios adquiere mayor confianza en sus propias decisiones y las del resto, y logra un mayor entendimiento de los impactos de sus decisiones. Impacto Positivo sobre los Procesos Empresariales: cuando a la gente se le da acceso a una mejor calidad de información, la empresa puede lograr por sí sola: Eliminar los retardos de los procesos empresariales que resultan de información incorrecta, inconsistente y/o no existente. Tnlg. Cristian Paul Peñaloza Salamea. 19 Universidad Católica de Cuenca Sistemas OLAP Integrar y optimizar procesos empresariales a través del uso compartido e integrado de las fuentes de información. Eliminar la producción y el procesamiento de datos que no son usados ni necesarios, producto de aplicaciones mal diseñados o ya no utilizados. 3.5 Características OLTP Las características principales de los sistemas OLTP son: Realizan transacciones en tiempo real del proceso de un negocio, con lo cual los datos almacenados cambian continuamente. Los sistemas OLTP en sus transacciones conducen procesos esenciales del negocio. Los sistemas OLTP son los responsables del mantenimiento de los datos, ya sea agregando datos, realizando actualizaciones o bien eliminándolos. Las estructuras de datos deben estar optimizadas para validar la entrada de los mismos, y rechazarlos si no cumplen con determinadas reglas de negocio. Para la toma de decisiones, proporciona capacidades limitadas ya que no es su objetivo, por lo tanto no es prioridad en su diseño. Tnlg. Cristian Paul Peñaloza Salamea. 20 Universidad Católica de Cuenca Sistemas OLAP Si se quisiera obtener determinada información histórica relativa al negocio consultando un sistema OLTP, se produciría un impacto negativo en el funcionamiento del sistema. Normalmente, para el diseño de un sistema OLTP se define un modelo de Diagrama Entidad Relación (DER). Un DER es una representación de la realidad a través de un esquema gráfico que contiene los siguientes elementos: Entidades: Una Entidad es un tipo de objeto que puede identificarse de manera única por algún medio. Este objeto es traducido a la estructura física de una base de datos como una tabla. Atributos: Las características particulares que distinguen a las Entidades se denominan Atributos. Relaciones: vínculos existentes entre las tablas que sirven para asegurar la integridad referencial. 3.6 Usos Comunes de OLTP Toda organización o empresa, lleva adelante sus objetivos diarios realizando un conjunto de tareas que se encuentran cuidadosamente agrupadas dentro de procesos, estos últimos estrechamente relacionados entre sí. Los procesos pueden pertenecer al área Industrial, Tnlg. Cristian Paul Peñaloza Salamea. 21 Universidad Católica de Cuenca Sistemas OLAP al departamento de Marketing, al departamento de Ventas o al sector Administrativo, mencionando solo algunos. Decimos entonces, que en la definición de OLTP se pueden encuadrar a todos los sistemas tradicionales dedicados a la captura. Sistema OLTP Imaginemos que estamos frente a un Sistema de Cajeros Automáticos. El sistema, al ser operado por un cliente pasará por las siguientes situaciones: Tomar la tarjeta del Cliente. Validar el Cliente. Consultar a la Base de Datos si el Cliente existe y, de existir, confirmar que se encuentra en una línea de cajeros habilitada. Autenticar el cliente en el sistema. De querer realizar una transferencia: Verificar que está autorizado para realizarla. Verificar que tiene saldo. Inicializar la transferencia manejándola como una transacción. Emitir comprobante. Saludar al Cliente. La situación en un Sistema de Ventas por medio de un sitio Web, sería la siguiente: Validar al cliente y autenticarlo en el sistema. Tomar el pedido. Controlar los topes de créditos. Informar los valores parciales de la compra y acumulados. Requerir confirmación del cliente antes de enviar el pedido. Enviar el pedido. Tnlg. Cristian Paul Peñaloza Salamea. 22 Universidad Católica de Cuenca Sistemas OLAP Vemos que el sistema transaccional asegura un conjunto de reglas de negocio, como ser en el ejemplo del sistema de Ventas Web, antes de realizar la venta se controla que el cliente no haya superado el tope de los créditos. A su vez, debe mantenerse una integridad en la información, es decir, si en una tabla manejo el stock de los productos y en otra llevo los movimientos que realizo de estos productos, las cantidades que muevo en la tabla de movimientos tienen que ser descontadas en igual medida que las que tengo en la tabla de productos. Procesos Operacionales Inventario Ventas Proveedores Marketing Clientes Producción Cuadro No 2: Procesos Operacionales Las organizaciones se ven entonces en la necesidad de registrar las transacciones que ocurren durante sus procesos operacionales, para su control y posterior consulta. Tnlg. Cristian Paul Peñaloza Salamea. 23 Universidad Católica de Cuenca Sistemas OLAP Un sistema OLTP es utilizado en: Sistemas bancarios Procesamiento de pedidos Comercio electrónico Sistemas de facturación Sistemas de stock Almacenamiento Transaccional $ Comercio electrónico Bancos $ $ Pedidos $ Sistemas OLTP Facturación Stock Cuadro No 3: Almacenamiento Transaccional Tnlg. Cristian Paul Peñaloza Salamea. 24 Universidad Católica de Cuenca Sistemas OLAP Capitulo 4 Sistemas OLAP 4.1 Introducción a los sistemas OLAP El cambio que propone la tecnología OLAP, es en esencia una revisión del enfoque que tradicionalmente se ha aplicado al desarrollo de los sistemas de apoyo a la toma de decisiones y de análisis del negocio. La concentración en la atención de los sistemas de información en las operaciones de la empresa, dio lugar a sistemas especializados en el tratamiento eficiente y seguro de altos volúmenes de transacciones cortas (facturación, movimientos de inventarios, etc.). Esto es conocido como OLTP (On-Line Transaction Processing). Pero dentro de la óptica de los sistemas dirigidos a OLTP, el soporte de las actividades de análisis jugó un papel secundario, generalmente caracterizado por métodos de trabajo que acceden en forma directa a la “base de datos” (la misma que está soportando las operaciones on-line) con la finalidad de extraer y procesar la información. En los sistemas OLAP la información ya no se almacena en tablas, sino en cubos de n dimensiones. Se construye a partir de una tabla principal, llamada tabla de hechos, que enumera los hechos ciertos en Tnlg. Cristian Paul Peñaloza Salamea. 25 Universidad Católica de Cuenca Sistemas OLAP el sistema. A ella se va añadiendo una dimensión por relación cuya información que se quiera almacenar, de manera que todas están pre calculadas en el sistema. Los sistemas OLAP son los que implementa finalmente los llamados "Datawarehouse" o depósitos de datos que podemos definir como un almacén de datos transformados y separados físicamente de la aplicación donde se encontraron los datos en el ambiente operacional. Implementaciones comerciales de OLAP hay muchas. Quizás la más conocida sea SAP, aunque hay muchas como Microsoft Analysis Services (incluido en SQL Server) ó DB2 OLAP Server de IBM. 4.2 OLAP OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. La razón de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas Tnlg. Cristian Paul Peñaloza Salamea. 26 Universidad Católica de Cuenca Sistemas OLAP discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas, aunque peor desde el punto de vista operativo, es una base de datos multidimensional. 4.3 Funcionalidad de los sistemas OLAP En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (también llamado cubo multidimensional o hipercubo). Se compone de hechos numéricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es típicamente creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensión de los cuadros. Información a obtener. Normalmente este tipo de selecciones se ve reflejada en la visualización de la estructura multidimensional, en unos campos de selección que nos permitan elegir el nivel de agregación (jerarquía) de la dimensión, y/o la elección de un dato en concreto, la visualización de los atributos del sujeto, frente a una(s) dimensiones en modo tabla, pudiendo con ello realizar, entre otras las siguientes acciones: Tnlg. Cristian Paul Peñaloza Salamea. 27 Universidad Católica de Cuenca Sistemas OLAP Rotar (Swap): Alterar las filas por columnas (permutar dos dimensiones de análisis). Bajar (Down): Bajar el nivel de visualización en las filas a una jerarquía inferior. Detallar (Drilldown): Informar para una fila en concreto, de datos a un nivel inferior. Expandir (Expand): Id. anterior sin perder la información a nivel superior para éste y el resto de los valores. Colapsar (Collapse): Operación inversa de la anterior. 4.4 Propósito de los sistemas OLAP El propósito del OLAP (procesamiento analítico en línea) es permitir un análisis multidimensional de las bases de datos de gran volumen para realizar un análisis especial de los mismos (que son el tema de consultas especiales). Gracias al OLAP, los usuarios pueden crear representaciones multidimensionales (llamadas hipercubo o "cubos OLAP") de acuerdo con el criterio que ellos definan para simular situaciones. 4.5 Extracción de Datos La extracción de datos, más que a un análisis multidimensional (OLAP), está destinada a mostrar cualquier correlación dentro de un Tnlg. Cristian Paul Peñaloza Salamea. 28 Universidad Católica de Cuenca Sistemas OLAP volumen de datos importante del sistema de información con el fin de detectar alguna tendencia. La extracción de datos se basa en técnicas de inteligencia artificial (red neural) para mostrar vínculos ocultos entre los datos. 4.6 Característica de los Sistemas OLAP Las siguientes son características que la tecnología OLAP posee: Las bases de datos de OLAP tienen un esquema que está optimizado para que las preguntas realizadas por los usuarios sean respondidas rápidamente. Las preguntas que se le hacen a un OLAP, deben permitir un uso interactivo con los usuarios. Los cubos de conformados OLAP por almacenan estructuras varios altamente niveles de datos optimizadas que responden a las expectativas de negocio de la empresa. Un sistema OLAP está preparado para realizar informes complejos de una manera simple. OLAP proporciona una vista de datos multidimensional. Los cubos proporcionan una vista de los datos multidimensional que se extiende más allá del análisis de dos dimensiones que puede proporcionar una simple planilla de cálculo utilizada como tal. Tnlg. Cristian Paul Peñaloza Salamea. 29 Universidad Católica de Cuenca Sistemas OLAP Los usuarios pueden cambiar fácilmente las filas, las columnas, y las páginas en informes de OLAP, pudiendo leer la información de la manera que se crea más conveniente para el análisis. 4.7 Usos Comunes de OLAP Los sistemas OLAP, son utilizados por las empresas para conocer la historia del negocio y poder realizar la toma de decisiones. Podemos enunciar entonces las siguientes áreas en donde el uso de un sistema OLAP está difundido: Sistemas de información ejecutivos. Los usuarios y los administradores generalmente de mandos altos y medios, reciben la información sobre los indicadores de funcionamiento dominantes del negocio y de las excepciones o las variaciones según sea de patrones y de estándares preestablecidos. Los Sistemas de Información Ejecutivos (EIS) presentan típicamente datos multidimensionales en formatos gráficos. Aplicaciones financieras. Para diversos usos de tipo financiero se utilizan las bases de datos de OLAP como ser para comunicar, planear, y analizar. Los ejemplos de usos financieros incluyen la comunicación, análisis del mes-cierre, análisis de lo beneficioso del producto, los presupuestos y pronóstico. Los analistas financieros utilizan OLAP extensivamente para el análisis de datos Tnlg. Cristian Paul Peñaloza Salamea. 30 Universidad Católica de Cuenca Sistemas OLAP financieros y operacionales para contestar las preguntas de la gerencia mayor. Ventas y aplicaciones de Marketing. Existen diferentes formas de llegar a los clientes para alcanzar los objetivos de venta y de comercialización propuestos. Por esto, la utilización de sistemas OLAP, donde es importante contar con información organizada de manera rápida, es aconsejable. Los ejemplos incluyen análisis de la facturación, análisis de producto, análisis del cliente, y análisis de ventas regional. Otros Usos. Las bases de datos de OLAP se adaptan a una amplia gama de análisis, incluyendo rendimiento de procesamiento y eficacia de la fabricación, eficacia del servicio de cliente, y análisis de coste del producto. En definitiva, un sistema OLAP es útil para todo proceso en el que sea necesario tomar decisiones. 4.8 Convirtiendo Datos en Información Para convertir los datos en información, se debe entender de qué manera pueden interpretarse los datos almacenados en sistemas operacionales, determinando: Como los hechos que deseamos medir se relacionan con los datos que podemos obtener. Entendiendo cómo estos datos reflejan metas y objetivos que abarcan el negocio involucrado. Tnlg. Cristian Paul Peñaloza Salamea. 31 Universidad Católica de Cuenca Sistemas OLAP Un DW, clasifica la información en base a los aspectos que son de interés para la empresa. En el ambiente operacional se diseña alrededor de las aplicaciones y funciones (ventas, facturación, stock, etc.). La base de datos combina los procesos en una estructura que responde a las necesidades de las reglas del negocio. En cambio en un DW, estos elementos se organizan alrededor de sujetos clientes (vendedores, productos, sucursales, etc.). Una vez que el análisis del negocio se reconoce como un valor significativo para una organización, las peticiones de los datos y de la información llegan a ser numerosas y frecuentes. Satisfacer estas peticiones puede ser una tarea muy compleja en un sistema OLTP, se debe bucear por grandes cantidades de datos obtenidos de distintas fuentes, procurando seleccionar, adecuar y consolidar la información. En un sistema OLAP, estos temas se resuelven por única vez, en la etapa de diseño. 4.9 Transformación y agrupación de datos – ETL Los datos que alimentan a un sistema DW provienen de diferentes fuentes, estas fuentes son los distintos sistemas operacionales que la empresa posee, generalmente ni son homogéneos entre sí ni concuerdan exactamente con lo que se necesita, por lo que será necesario realizar todas las adaptaciones pertinentes. Tnlg. Cristian Paul Peñaloza Salamea. 32 Universidad Católica de Cuenca Sistemas OLAP Cuadro No 4: Transformación y Agrupación de Datos Es común que los sistemas operacionales que se encuentran en las organizaciones hayan sido desarrollados por diferentes equipos de programadores o empresas de software, y en su desarrollo, hayan adoptado diferentes convenciones en la codificación de variables, nombres de los atributos de las tablas, diferentes tipos de datos o formatos de fechas. Al reunir datos de los diferentes sistemas, se debe definir una norma única para el DW y realizar las transformaciones que sean necesarias en cada caso. Básicamente deben realizarse las siguientes tareas: Establecer las reglas que serán utilizadas para realizar la transformación. Tnlg. Cristian Paul Peñaloza Salamea. 33 Universidad Católica de Cuenca Sistemas OLAP Detectar las inconsistencias que pueden originarse al tomar los datos desde distintas fuentes. Planificar cuidadosamente y con detalles la transformación de los datos que den como resultado final conjuntos de datos consistentes. Operacional Data Warehouse Cuadro No 5: Datos Operacionales y Datawarehouse Varias columnas a una: En un sistema OLTP, los datos de una persona, como ser Dirección pueden almacenarse en diferentes campos de la misma tabla (Calle, Número, Piso y Departamento). Al transformar estos datos para que puedan ser utilizados en un sistema DW, es posible que los almacenemos en una única columna. Lo mismo puede suceder con el Nombre y Apellido. En el sistema OLTP puede estar almacenado en dos columnas y en OLAP ser requerido en una sola. Cuadro No 6: Varias columnas a una. Tnlg. Cristian Paul Peñaloza Salamea. 34 Universidad Católica de Cuenca Sistemas OLAP Una columna a varios: los sistemas más antiguos solían colocar el tipo y número de documento en el mismo campo de la tabla. En un DW, es muy posible que necesitemos colocar el tipo de documento en un campo y el número de documento en otro. Cuadro No 7: Una columna a varios. Tnlg. Cristian Paul Peñaloza Salamea. 35 Universidad Católica de Cuenca Sistemas OLAP Capitulo 5 Tipos de Sistemas OLAP 5.1 Clasificación Tradicionalmente, los sistemas OLAP se clasifican según las siguientes categorías: ® ROLAP ® MOLAP ® HOLAP 5.1.1 ROLAP Procesamiento Analítico OnLine Relacional 5.1.1.1 Introducción Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el análisis de una enorme cantidad de datos. Tnlg. Cristian Paul Peñaloza Salamea. 36 Universidad Católica de Cuenca Sistemas OLAP Los sistemas ROLAP difiere significativamente de los MOLAP en que los primeros no requieren, en principio, la computación previa ni el almacenamiento de la información, ya que pueden acceder directamente a la fuente de dichos datos, las herramientas ROLAP acceden a los datos de una base de datos relacional y generan consultas SQL para calcular la información al nivel apropiado cuando un usuario final lo requiere. Aunque las aplicaciones ROLAP se construyen sobre sistemas de bases de datos relacionales, generalmente estas bases de datos deben ser diseñadas cuidadosamente para el uso de ROLAP. Una base de datos diseñada para procesamiento de transacciones (OLTP) no funcionará bien como base de datos ROLAP. Este diseño específico puede conllevar la creación de tablas de base de datos adicionales (tablas resumen o agregaciones) las cuales resumen los datos en cualquier combinación deseada de dimensiones. Este mecanismo puede agilizar el acceso a datos precalculados mejorando el rendimiento del sistema ROLAP, pero, en este caso, se debe crear una copia adicional de los datos si estos no se grabaron directamente en las tablas ROLAP, sino que provienen de tablas OLTP. Sin embargo, dado que se trata, en ambos casos (ROLAP y OLTP), de una base de datos relacional, pueden utilizarse cualquiera de las técnicas existentes para el acceso y gestión de la misma y la migración de datos entre bases de datos relacionales. Tnlg. Cristian Paul Peñaloza Salamea. 37 Universidad Católica de Cuenca 5.1.1.2 Sistemas OLAP Diseño de tablas para una herramienta ROLAP En un sistema ROLAP, la información se almacena en tablas de una base de datos relacional. En este diseño tiene una especial importancia la denominada tabla de hechos, que es donde se almacena la historia de alguna magnitud relevante para la empresa que necesita ser estudiada de forma exhaustiva, como por ejemplo, las ventas. Adicionalmente, esta tabla de hechos estará ligada a otras tablas en las que se almacenarán los parámetros en función de los cuales varía la magnitud a estudiar, estos parámetros reciben el nombre de dimensiones; típicamente, para el caso del estudio de la magnitud ventas, las dimensiones podrían ser: el tiempo (por días, semanas, horas, ... según interese), los productos, las zonas geográficas (regiones, países, ciudades, códigos postales,...), los clientes, los almacenes o centros de producción, las promociones, etc. Finalmente, el diseño de estas tablas dará lugar a una estructura en cuyo centro estará la tabla de hechos y, alrededor de ésta y relacionadas con ella, estarán las tablas para las dimensiones, dando lugar a un esquema en estrella. Tnlg. Cristian Paul Peñaloza Salamea. 38 Universidad Católica de Cuenca Sistemas OLAP Podría darse el caso de que se quisiera jerarquizar alguna de las dimensiones, por ejemplo, el tiempo se podría indicar por días, pero quizá interese poder agruparlo por semanas, por meses, por cuatrimestres y/o por años; los clientes se podrían clasificar por sexos (hombre, mujer); los productos podrían estar agrupados por categorías, etc. La construcción de este diseño implicaría añadir nuevas tablas que se relacionarían con las dimensiones de la tabla de hechos central. A este diseño se le llama esquema en copo de nieve. Una vez finalizado el diseño de este sistema, se tiene una estructura que se identifica con un cubo OLAP. Un almacén de datos dispondrá de varios de estos cubos, uno por cada magnitud (o conjunto de magnitudes si éstas dependen de las mismas dimensiones) de interés para la empresa. 5.1.1.3 Ventajas de ROLAP La construcción de herramientas OLAP sobre sistemas relacionales presenta algunas ventajas frente a los sistemas multidimensionales: ROLAP se considera más escalable para manejar grandes volúmenes de datos, especialmente modelos con dimensiones de gran cardinalidad (por ejemplo, con millones de miembros). Hay disponible una gran variedad de herramientas de carga de datos para sistemas relacionales; además, existe la posibilidad de Tnlg. Cristian Paul Peñaloza Salamea. 39 Universidad Católica de Cuenca Sistemas OLAP ajustar el código ETL(Extract, Transform, Load) a un modelo de datos particular. Con todo esto se consigue que los tiempos de carga sean generalmente mucho menores que con las cargas MOLAP automatizadas. Los datos se almacenan en una base de datos relacional estándar que puede ser accedida por cualquier herramienta de generación de informes SQL (reporting). Estas herramientas no tienen que ser necesariamente de tipo OLAP. Las herramientas MOLAP tienden a sufrir un bajo rendimiento cuando consultan elementos como descripciones textuales. Obviando el almacenamiento de datos del modelo multidimensional, es posible modelar datos con éxito que de otro modo no se ajustarían en un modelo dimensional estricto. 5.1.1.4 Desventajas de ROLAP Hay un consenso general en la industria de que las herramientas ROLAP tienen menor rendimiento que las herramientas MOLAP. El proceso de carga de tablas agregadas debe ser gestionado por código ETL personalizado. Las herramientas ROLAP no disponen de mecanismos automáticos para realizar esta tarea, lo significa que se necesita más tiempo de desarrollo de código. Tnlg. Cristian Paul Peñaloza Salamea. 40 Universidad Católica de Cuenca Sistemas OLAP Muchos desarrolladores de modelos dimensionales ROLAP ignoran el paso de crear tablas agregadas. En este caso el rendimiento de una consulta se ve afectado porque entonces se necesita consultar las tablas con datos más detallados. Esto puede evitarse parcialmente añadiendo tablas agregadas adicionales, sin embargo no es práctico crear tablas agregadas para todas las combinaciones posibles de dimensiones/atributos. Los sistemas ROLAP se construyen sobre bases de datos de propósito general, por lo que hay algunas funcionalidades especiales propias de las herramientas MOLAP que no están disponibles en los sistemas ROLAP (tales como el indexado jerárquico especial). Sin embargo, las herramientas ROLAP modernas van supliendo estas carencias con las últimas mejoras en el lenguaje SQL tales como los operadores CUBE y ROLLUP, las vistas de cubo DB2, así como otras extensiones SQL OLAP. Estas mejoras SQL pueden mitigar las diferencias frente a las herramientas MOLAP. Dado que las herramientas ROLAP se basan en SQL para todos los cálculos, no son apropiadas cuando el modelo realiza muchos cómputos que no se traducen bien en SQL (por ejemplos: presupuestos, asignaciones, informes financieros y otros escenarios). Tnlg. Cristian Paul Peñaloza Salamea. 41 Universidad Católica de Cuenca 5.1.1.5 Sistemas OLAP Grafico Cuadro No 8: Ventajas y Desventajas Rolap 5.1.2 MOLAP Multidimensional OnLine Analytical Processing 5.1.2.1 Introducción MOLAP Analytical es el acrónimo Processing, es inglés decir, de Multidimensional 'procesamiento Online analítico multidimensional en línea’. Se trata de una alternativa a la tecnología ROLAP (OLAPRelacional). Aunque ambos tipos de herramientas están diseñadas para realizar análisis de datos a través de un modelo de datos multidimensional, MOLAP se diferencia significativamente en que requiere un preprocesamiento y almacenamiento de la información contenida en el cubo OLAP. MOLAP almacena estos datos en una Tnlg. Cristian Paul Peñaloza Salamea. 42 Universidad Católica de Cuenca Sistemas OLAP matriz de almacenamiento multidimensional optimizado, más que en una base de datos relacional (o en un ROLAP). 5.1.2.2 Ventajas de MOLAP Consulta rápidas debido a la optimización del rendimiento de almacenamiento, la indexación multidimensional y la memoria caché. Ocupa menor tamaño en disco en comparación con los datos almacenados en base de datos relacional debido a técnicas de compresión. Automatización del procesamiento de los datos agregados de mayor nivel. Muy compacto para conjuntos de datos de pocas dimensiones. El modelo de almacenamiento en vectores/matrices proporciona una indexación natural. Eficaz extracción de datos lograda gracias a la pre-estructuración de los datos agregados. 5.1.2.3 Desventajas de MOLAP La etapa de procesamiento (carga de datos) puede ser bastante larga, sobre todo para grandes volúmenes de datos. Normalmente, esto se puede evitar con un procesamiento incremental, es decir, sólo el procesamiento de los datos que han Tnlg. Cristian Paul Peñaloza Salamea. 43 Universidad Católica de Cuenca Sistemas OLAP cambiado (por lo general, los nuevos datos) en lugar de volver a procesar de todo el conjunto de datos. Las herramientas MOLAP tradicionalmente tienen dificultades para consultar con modelos con dimensiones muy altas (del orden de millones de miembros). Algunas herramientas MOLAP tienen dificultades para actualizar y consultar los modelos con más de diez dimensiones. Este límite varía en función de la complejidad y la cardinalidad de las dimensiones de que se trate. También depende de la cantidad de hechos o medidas almacenados. Otras herramientas MOLAP (por ejemplo, Microsoft Análisis Services o Applix TM1) puede manejar cientos de dimensiones. El enfoque MOLAP introduce redundancia en los datos. 5.1.2.4 Grafico Cuadro No 9: Ventajas y Desventajas Molap Tnlg. Cristian Paul Peñaloza Salamea. 44 Universidad Católica de Cuenca 5.1.3 Sistemas OLAP HOLAP Hybrid OnLine Analytical Processing 5.1.3.1 Introducción HOLAP (Hybrid Online Analytical Process, procesamiento analítico en línea híbrido) es una combinación de ROLAP y MOLAP, que son otras posibles implementaciones de OLAP. HOLAP permite almacenar una parte de los datos como en un sistema MOLAP y el resto como en uno ROLAP. El grado de control que el operador de la aplicación tiene sobre este particionamiento varía de unos productos a otros. 5.1.3.2 Particionamiento Vertical En este modo, HOLAP almacena agregaciones como un MOLAP para mejorar la velocidad de las consultas, y los datos se detallan en ROLAP para optimizar el tiempo en que se procesa el cubo. 5.1.3.3 Particionamiento Horizontal En este modo HOLAP almacena una sección de los datos, normalmente los más recientes (por ejemplo particionando por la dimensión tiempo) en modo MOLAP para mejorar la velocidad de las consultas, y los datos más antiguos en ROLAP. Además, se pueden almacenar algunos cubos en MOLAP y otros en ROLAP. Tnlg. Cristian Paul Peñaloza Salamea. 45 Universidad Católica de Cuenca 5.2 Sistemas OLAP Comparación 5.2.1 Comparación General Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las características específicas de los beneficios entre los proveedores). Algunas implementaciones MOLAP son propensas a la "explosión" de la base de datos; este fenómeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas condiciones: elevado número de dimensiones, resultados precalculados y escasos datos multidimensionales. Las técnicas habituales de atenuación de la explosión de la base de datos no son todo lo eficientes que sería deseable. Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexación y a las optimizaciones de almacenamiento. MOLAP también necesita menos espacio de almacenamiento en comparación con los especializados ROLAP porque su almacenamiento especializado normalmente incluye técnicas de compresión. ROLAP es generalmente más escalable. Sin embargo, el gran volumen de preprocesamiento es difícil de implementar eficientemente Tnlg. Cristian Paul Peñaloza Salamea. 46 Universidad Católica de Cuenca Sistemas OLAP por lo que con frecuencia se omiten; por tanto, el rendimiento de una consulta ROLAP puede verse afectado. Desde la aparición de ROLAP van apareciendo nuevas versiones de bases de datos preparadas para realizar cálculos, las funciones especializadas que se pueden utilizar tienen más limitaciones. HOLAP (OLAP Híbrido) engloba un conjunto de técnicas que tratan de combinar MOLAP y ROLAP de la mejor forma posible. Generalmente puede pre-procesar rápidamente, escala bien, y proporciona una buena función de apoyo. 5.2.2 ROLAP vs. MOLAP Cuando se comparan las dos arquitecturas, se pueden realizar las siguientes observaciones: El ROLAP delega la negociación entre tiempo de respuesta y el proceso batch al diseño del sistema. Mientras, el MOLAP, suele requerir que sus bases de datos se precompilen para conseguir un rendimiento aceptable en las consultas, incrementando, por tanto los requerimientos batch. Los sistemas con alta volatilidad de los datos (aquellos en los que cambian las reglas de agregación y consolidación), requieren una arquitectura que pueda realizar esta consolidación ad-hoc. Los sistemas ROLAP soportan bien esta consolidación dinámica, Tnlg. Cristian Paul Peñaloza Salamea. 47 Universidad Católica de Cuenca mientras que los Sistemas OLAP MOLAP están más orientados hacia consolidaciones batch. Los ROLAP pueden crecer hasta un gran número de dimensiones, mientras que los MOLAP generalmente son adecuados para diez o menos dimensiones. Los ROLAP soportan análisis OLAP contra grandes volúmenes de datos elementales, mientras que los MOLAP se comportan razonablemente en volúmenes más reducidos (menos de 5 Gb) Por ello, y resumiendo, el ROLAP es una arquitectura flexible y general, que crece para dar soporte a amplios requerimientos OLAP. El MOLAP es una solución particular, adecuada para soluciones departamentales con unos volúmenes de información y número de dimensiones más modestos. 5.3 Otros Tipos Los siguientes acrónimos a veces también se utilizan, aunque no son sistemas tan generalizados como los anteriores: WOLAP o Web OLAP: OLAP basado u orientado para la web. DOLAP o Desktop OLAP: OLAP de escritorio RTOLAP o Real Time OLAP: OLAP en tiempo real SOLAP o Spatial OLAP: OLAP espacial Tnlg. Cristian Paul Peñaloza Salamea. 48 Universidad Católica de Cuenca Sistemas OLAP Capitulo 6 Soluciones OLAP 6.1 Data Mart Data Mart: Son almacenes de datos con información de interés particular para un determinado sector de la empresa. 6.2 Esquema Estrella Para facilitar el análisis, el data mart organiza los datos en una estructura llamada esquema de estrella. Esta estructura está compuesta por una tabla central (tabla de hechos) y un conjunto de tablas organizadas alrededor de ésta (tablas de dimensiones). En las puntas de la estrella se encuentran las tablas de dimensión que contienen los atributos de las aperturas que interesan al negocio que se pueden utilizar como criterios de filtro y son relativamente pequeñas. Cada tabla de dimensión se vincula con la tabla de hechos por un identificador. 6.2.1 Características del Esquema Estrella Las características de un esquema de estrella son: El centro de la estrella es la tabla de hecho. Los puntos de la estrella son las tablas de dimensiones. Tnlg. Cristian Paul Peñaloza Salamea. 49 Universidad Católica de Cuenca Sistemas OLAP Cada esquema está compuesto por una sola tabla de hechos. Generalmente pudiendo estar es un esquema parcialmente totalmente normalizado en desnormalizado, las tablas de dimensiones. Dimensión Dimensión Servicio Paciente Tabla de Hechos Admisión Pacientes Dimensión Dimensión Zona Geográfica Tiempo Cuadro No 10: Esquema Estrella. 6.2.2 Tabla de Hechos El modelo dimensional divide el mundo de los datos en dos grandes tipos: las medidas y las dimensiones de estas medidas. Las medidas, siempre son numéricas, se almacenan en las tablas de hechos y las dimensiones que son textuales se almacenan en las tablas de dimensiones. La tabla de hechos es la tabla primaria del modelo dimensional, y contiene los valores del negocio que se desea analizar. Tnlg. Cristian Paul Peñaloza Salamea. 50 Universidad Católica de Cuenca Sistemas OLAP Cada tabla de hechos contiene las claves externas, que se relacionan con sus respectivas tablas de dimensiones, y las columnas con los valores que serán analizados. 6.2.3 Tabla de Dimensiones Las dimensiones organizan los datos en función de un área de interés para los usuarios. Cada dimensión describe un aspecto del negocio y proporciona el acceso intuitivo y simple a datos. Una dimensión provee al usuario de un gran número de combinaciones e intersecciones para analizar datos. Las tablas de dimensiones son las compañeras de las tablas de hechos. Cada dimensión se define por su clave primaria que sirve para mantener la integridad referencial en la tabla de hechos a la que se relaciona. Un cubo requiere que se defina al menos una dimensión en su esquema. 6.3 Esquema Copo de Nieve. El esquema copo de nieve es una variación del esquema estrella donde alguna punta de la estrella se explota en más tablas. El nombre del esquema se debe a que el diagrama se asemeja a un copo de nieve. Tnlg. Cristian Paul Peñaloza Salamea. 51 Universidad Católica de Cuenca Sistemas OLAP En este esquema, las tablas de dimensión copo de nieve se encuentran normalizadas para eliminar redundancia de datos. A diferencia del esquema estrella, los datos de las dimensiones se reparten en múltiples tablas. Como ventaja del esquema destacamos el ahorro de espacio de almacenamiento en disco, pero en perjuicio de un aumento en la cantidad de tablas. País Copo de nieve Dimensión zona Geografica Provincia Ciudad Servicio Admisión Paciente Paciente Tiempo Cuadro No 11: Esquema Copo de Nieve. 6.3.1 Características del Esquema Copo de Nieve Los siguientes son las características de un copo de nieve: La dimensión está normalizada Tnlg. Cristian Paul Peñaloza Salamea. 52 Universidad Católica de Cuenca Sistemas OLAP Los distintos niveles se encuentran almacenados en tablas separadas Se argumenta ahorro de espacio 6.4 Medidas Las medidas son los valores de datos que se analizan. Una medida es una columna cuantitativa, numérica, en la tabla de hechos. Las medidas representan los valores que son analizados, como cantidad de pacientes admitidos o llamadas efectuadas. Las medidas son: Valores que permiten analizar los hechos. Valores numéricos porque estos valores son las bases de las cuales el usuario puede realizar cálculos. Si la medida fuera un valor no numérico debemos codificarla a un valor numérico en el proceso de obtención de datos, y luego cuando tengamos que exponer sus valores decodificarla para mostrarla con el valor original. 6.4.1 Características de las medidas Las siguientes son algunas de las características de las medidas: ® Deben ser numéricas. ® Cruzan todas las dimensiones en todos los niveles. Tnlg. Cristian Paul Peñaloza Salamea. 53 Universidad Católica de Cuenca Sistemas OLAP 6.4.2 Medidas Naturales Son las columnas numéricas que queremos analizar que provienen directamente de los sistemas OLTP. Cuando definimos una medida debemos tener en cuenta cual será la forma de agregación (agrupación de la misma) al subir por la estructura dimensional. Estas formas de agregación pueden ser: Suma: es la operación que suma los valores de las columnas Cuenta: realiza un conteo de los valores Mínima: devuelve un valor mínimo Máxima: proporciona el mayor de los valores Cuenta de Distintos: cuenta los valores diferentes 6.4.3 Medidas Calculadas Son las medidas que se calculan en el cubo en base a los valores de las medidas naturales. El sentido de la expresión medidas calculadas es muy amplio y engloba a cualquier manipulación de las medidas naturales que nos faciliten el análisis de los hechos. En una medida calculada puede haber: Cálculos Matemáticos Tnlg. Cristian Paul Peñaloza Salamea. 54 Universidad Católica de Cuenca Sistemas OLAP Expresiones condicionales Alertas Estos tres tipos (cálculos, condiciones y alertas) usualmente pueden existir juntos dentro de la misma medida calculada. Tnlg. Cristian Paul Peñaloza Salamea. 55 Universidad Católica de Cuenca Sistemas OLAP Capitulo 7 Cubos OLAP 7.1 Introducción Cuadro No 12: Cubo OLAP. Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el datawarehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el datawarehouse, esta vista estará dispuesta según unas dimensiones y podrá contener información calculada. El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un análisis multidimensional. Tnlg. Cristian Paul Peñaloza Salamea. 56 Universidad Católica de Cuenca Sistemas OLAP A la información de un cubo puede acceder el ejecutivo mediante "tablas dinámicas" en una hoja de cálculo o a través de programas personalizados. Las tablas dinámicas le permiten manipular las vistas (cruces, filtrados, organización, totales) de la información con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de información se producen con mucha rapidez. Llevando estos conceptos a un datawarehouse, éste es una colección de datos que está formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos elementos que participan en el análisis y variables a los valores que se desean analizar. 7.2 Dimensiones y Jerarquías Cada una de las dimensiones de un cubo OLAP puede resumirse mediante una jerarquía. Por ejemplo si se considera una escala (o dimensión) temporal "Mayo de 2005" se puede incluir en "Segundo Trimestre de 2005", que a su vez se incluye en "Año 2005". De igual manera, otra dimensión de un cubo que refleje una situación geográfica, las ciudades se pueden incluir en regiones, países o regiones mundiales; los productos podrían clasificarse por categorías, y las partidas de gastos podrían agruparse en tipos de gastos. En cambio, el analista podría comenzar en un nivel muy resumido, como por ejemplo el total de la diferencia entre los resultados reales y lo presupuestado, para posteriormente descender en el cubo (en sus Tnlg. Cristian Paul Peñaloza Salamea. 57 Universidad Católica de Cuenca Sistemas OLAP jerarquías) para poder observar con un mayor nivel de detalle que le permita descubrir en el cubo los lugares en los que se ha producido esta diferencia, según los productos y períodos. 7.3 Dispersión en Cubos OLAP Vincular o enlazar cubos es un mecanismo para superar de la dispersión. Ésta se produce cuando no todas las celdas del cubo se rellenan con datos (escasez de datos o valores nulos). El tiempo de procesamiento es tan valioso que se debe adoptar la manera más efectiva de sumar ceros (los valores nulos o no existentes). Por ejemplo los ingresos pueden estar disponibles para cada cliente y producto, pero los datos de los costos pueden no estar disponibles con esta cantidad de análisis. En lugar de crear un cubo disperso, a veces es mejor crear otro distinto, pero vinculado, cubo en el que un subconjunto de los datos se puede analizar con gran detalle. La vinculación asegura que los datos de los dos cubos mantienen una coherencia. 7.4 Acceso y cálculo de un Cubo OLAP Los datos de los cubos pueden ser actualizados de vez en cuando, tal vez por personas diferentes de forma concurrente. Para solventar este problema a menudo es necesario bloquear partes de un cubo mientras otro usuario está escribiendo, para volver a calcular los totales en el cubo. Otras implementaciones añaden la posibilidad de Tnlg. Cristian Paul Peñaloza Salamea. 58 Universidad Católica de Cuenca Sistemas OLAP mostrar una alerta que indique que los totales calculados previamente ya no son válidos tras los nuevos datos. También hay algunos productos que calculan los totales cuando se les necesita con los últimos datos producidos en el sistema. 7.5 Definición técnica En teoría de bases de datos, un cubo OLAP es una representación abstracta de la proyección de una relación de un RDBMS (Sistema administrador de bases de datos relacionales). Dada una relación de orden N, se considera la posibilidad de una proyección que dispone de los campos X, Y, Z como clave de la relación y de W como atributo residual. Categorizando esto como una función se tiene que: W: (X, Y, Z) → W Los atributos X, Y, Z se corresponden con los ejes del cubo, mientras que el valor de W devuelto por cada tripleta (X, Y, Z) se corresponde con el dato o elemento que se rellena en cada celda del cubo. Debido a que los dispositivos de salida (monitores, impresoras, ...) sólo cuentan con dos dimensiones, no pueden caracterizar fácilmente cuatro dimensiones, es más práctico proyectar "rebanadas" o secciones de los datos del cubo (se dice proyectar en el sentido clásico vector Tnlg. Cristian Paul Peñaloza Salamea. 59 Universidad Católica de Cuenca Sistemas OLAP analítico de reducción dimensional, no en el sentido de SQL, aunque los dos conceptos son claramente análogos), tal vez la expresión: W: (X, Y) → W Aunque no se conserve la clave del cubo (al faltar el parámetro Z), puede tener algún significado semántico, sin embargo, también puede que una sección de la representación funcional con tres parámetros para un determinado valor de Z también resulte de interés. 7.6 Seguridad A la hora de diseñar el modelo multidimensional, es fundamental definir la seguridad adecuada sobre los diferentes componentes y niveles de la solución, organización la debido a lo sensible que puede ser para la información que suelen manejar este tipo de aplicaciones. Al igual que ocurre con las bases de datos de los sistemas transaccionales, en OLAP pueden manejarse distintos niveles de seguridad. La seguridad en OLAP tiene una arquitectura jerárquica, partiendo del cubo y llegando al nivel de celda dentro del cubo. De este modo, podemos definir los permisos a nivel de: Cubo Dimensión Tnlg. Cristian Paul Peñaloza Salamea. 60 Universidad Católica de Cuenca Sistemas OLAP Celda (Medida) Cubo: esta restricción de seguridad se realiza sobre todo el cubo, se puede permitir o denegar el acceso al cubo. Permitido Denegado Cuadro No 13: Cuadro de Seguridad de Cubos. Dimensión: Podemos permitir que el usuario vea la dimensión, que acceda solo a una parte de ella, o que no tenga permiso de visualizarla. Permitido Solo una parte Denegado Cuadro No 14: Cuadro de Seguridad de Dimensión. Celda: En una celda o medida podemos permitir el acceso, o bien personalizarlo utilizando expresiones que verifiquen alguna condición para acceder a los datos. Otra opción para limitar los accesos puede ser el uso de cubos virtuales. Podríamos crear un cubo virtual solo con las medidas que deseamos que tenga acceso el usuario y luego otorgar los permisos sobre el cubo virtual, y denegar o no otorgar permiso sobre el cubo original. Tnlg. Cristian Paul Peñaloza Salamea. 61 Universidad Católica de Cuenca 7.7 Sistemas OLAP Consultas Una vez que tenemos armado el cubo, los usuarios pueden realizar diferentes operaciones para poder visualizar y analizar sus datos. Las operaciones que se pueden realizar son: Drill - Down Drill - Up Slice y Dice. (Filtrado) Rotación Consolidación Drill Down – Drill Up: Es una técnica por la que el usuario puede navegar entre las jerarquías de una dimensión agrupando (Drill-up) o desagrupando (Drill-down) los datos. El drill down y el dril up sirven para navegar el cubo sobre sus dimensiones, con el drill up se pasa desde el detalle a la generalización, y con el drill down se pasa desde un nivel general al detalle. Cuadro No 15: Drill Down – Drill Up Tnlg. Cristian Paul Peñaloza Salamea. 62 Universidad Católica de Cuenca Sistemas OLAP Slice: Al seleccionar un miembro en particular de una dimensión se forma una especie de rebanada (Slice) del cubo original. Cuadro No 16: Slice Dice: Al seleccionar varios miembros de varias dimensiones se forma sub-cubo, cubo más pequeño o dado (dice). Tanto Slice como Dice son formas particulares de Filtrado. Cuadro No 17: Dice Tnlg. Cristian Paul Peñaloza Salamea. 63 Universidad Católica de Cuenca Sistemas OLAP Rotación: Selecciona el orden de visualización de las dimensiones, rota o gira el cubo según sus dimensiones. Cuadro No 18: Rotación Consolidación (Roll-Up): Calcula las medidas en función de agrupamientos, realiza el re-cálculo de la medida de acuerdo a los ajustes de escala. Cuadro No 19: Consolidación Tnlg. Cristian Paul Peñaloza Salamea. 64 Universidad Católica de Cuenca Sistemas OLAP Capitulo 8 Base de datos multidimensional 8.1 Introducción Las bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma: (d1, d2, d3,..., f1, f2, f3,...) Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los campos 'fi' a las métricas o hechos que se quiere almacenar, estudiar o analizar. 8.2 Bases de datos multidimensional vs. Cubos OLAP Cada una de estas tablas puede asimilarse a un hipercubo o más concretamente si de herramientas OLAP se trata a un cubo OLAP, donde las dimensiones del mismo se corresponden los campos de dimensiones de la tabla (campos 'di...'), y el valor almacenado en cada celda del cubo equivale a la métrica o métricas (campos 'fi...') almacenadas en la tabla. Tnlg. Cristian Paul Peñaloza Salamea. 65 Universidad Católica de Cuenca 8.3 Sistemas OLAP Implementación Lo más importante a tener en cuenta para implementar esta estructura de datos es que la tabla contiene todas las n-tuplas, con los valores de las dimensiones, o índice del cubo, y los valores de las métricas previamente calculados para el cruce de valores del índice en cuestión. 8.4 Ejemplo Dada la siguiente especificación para una tabla (o hipercubo) en una base de datos multidimensional. Dimensión (Tiempo, Productos) Jerarquía (Año->Semestre->Mes->Semana), (Categoría->Línea->Marca) Elementos (2006, 2007,..., S1-06,..., Ene-06,..., 200625....),(Todos, Máquinas, Refacciones, Máquinas caras, Máquinas Baratas, Máquina 1,...). Hechos (Ventas, Inventario, Defectos, Devoluciones) Métricas (PD:=Devoluciones/Ventas, %Defectos) La tabla resultante podría tener la forma siguiente: Tabla Tiempo Productos Inventario Ventas Defectos Devoluciones P/D %Defectos 2006 Todos 1000 200 50 10 1/100 5% 10 100 10 10 10/10 100% Ene06 Maquina1 Tnlg. Cristian Paul Peñaloza Salamea. 66 Universidad Católica de Cuenca Sistemas OLAP Capitulo 9 Base de datos multivaluada 9.1 Introducción Las bases de datos Multivaluadas (multivalue database) son un tipo especial de base de datos multidimensionales, también llamadas bases de datos PICK por el primer desarrollo que se realizo de este tipo, la aplicación "Pick operating system". 9.2 Historia El modelo de datos multivaluado fue definido por Don Nelson a mediados de los 60, y en 1968 se realizó la primera implementación de un sistema de bases de datos multidimensional, este desarrollo se atribuye a Dick Pick (de ahí que también se utilice el termino Base de datos Pick para este tipo de bases de datos). 9.3 Concepto El modelo de datos más extendido es el modelo relacional, este modelo se basa en las leyes de la normalización de bases de datos; según estas normas, y concretamente, según la primera forma normal, un campo de una base de datos no puede contener valores múltiples. En una base de datos multivaluada no se aplica la regla de la primera Tnlg. Cristian Paul Peñaloza Salamea. 67 Universidad Católica de Cuenca Sistemas OLAP forma normal, es decir, se permite que un campo pueda tener más de un valor almacenado. 9.4 Ejemplo Supongamos una base de datos en la que queremos almacenar información de clientes; se supone que cada cliente puede tener más de un teléfono. En el modelo relacional habría que crear dos tablas o relaciones como estas: Tabla 'Cliente' ID Cliente Nombre Apellido 123 Rachel Ingram 456 James Wright 789 María Fernández Tabla 'Teléfono cliente' ID Cliente Teléfono 123 555-861-2025 456 555-776-4100 789 555-808-9633 Tnlg. Cristian Paul Peñaloza Salamea. 68 Universidad Católica de Cuenca Sistemas OLAP En el modelo multivaluado la siguiente tabla (que no cumple la primera forma normal) es perfectamente válida: Tabla 'Cliente' ID Cliente Nombre Apellido Teléfono 123 Rachel Ingram 555-861-2025 456 James Wright 555-403-1659 555-776-4100 789 María Fernández 555-808-9633 Tnlg. Cristian Paul Peñaloza Salamea. 69 Universidad Católica de Cuenca Sistemas OLAP Capitulo 10 Conclusiones y Recomendaciones 10.1 Conclusiones Las principales conclusiones obtenidas a lo largo de nuestro proyecto de investigación son: Un sistema de BI constituye una necesidad para el correcto manejo del negocio. Los Sistemas OLAP son una muy buena herramienta para sustentar la evolución y el crecimiento del negocio y deben estar diseñados de forma tal que puedan seguir esa evolución y crecimiento. Los Sistemas OLAP influyen en toda la empresa, no son una facilidad de un sector. Cualquier empresa que se proponga cumplir con sus objetivos debe tener un Sistema OLAP. Estos Sistemas no son sólo para las grandes empresas. Los Sistemas OLAP no son máquinas de fabricar informes. El tener un Sistema OLAP no es un lujo para la empresa, es responder a una necesidad. Tnlg. Cristian Paul Peñaloza Salamea. 70 Universidad Católica de Cuenca Sistemas OLAP Los Sistemas OLAP son válidos para cualquier proceso en el que deban tomarse decisiones, no son propiedad de las áreas comerciales o financieras. Los Sistemas OLAP no son una herramienta del área de Sistemas para mantener cautivos a los usuarios. Por el contrario, con un Sistema OLAP los usuarios consiguen más independencia al poder realizar las consultas en forma intuitiva y flexible. Construir un Sistema OLAP tiene como valor agregado el tener que revisar dónde y cómo se están almacenando los datos de los sistemas transaccionales (OLTP). Es una muy buena oportunidad de incluir en los procesos manejos de datos que se estén haciendo manualmente y sin soporte alguno. El desarrollo de un Sistema OLAP no se comienza por la elección de la herramienta de visualización. Como en todo desarrollo hay que relevar las necesidades de la empresa, consultar a los usuarios, fijar el alcance y las restricciones y, finalmente, diseñar, desarrollar y probar cada etapa. El desarrollo de un Sistema OLAP no termina con la creación de un cubo multidimensional. Se deben definir e implementar los trabajos de procesamiento de los cubos (periodicidad, horario, manejo de errores, etcétera). Tnlg. Cristian Paul Peñaloza Salamea. 71 Universidad Católica de Cuenca Sistemas OLAP Existe una gran variedad de herramientas de visualización de datos. Debe brindarse a cada usuario la que más le convenga, sin descuidar el presupuesto. La herramienta de visualización no debe ser una barrera entre el usuario y el Sistema OLAP. Tnlg. Cristian Paul Peñaloza Salamea. 72 Universidad Católica de Cuenca 10.2 Sistemas OLAP Recomendación Antes de realizar cualquier acción, tomemos en cuenta la necesidad de nuestro negocio, ubicando en un escalón superior las deficiencias de la misma. De manera que la elección de nuestra herramienta sea la correcta. Además no olvidar que los Sistemas de Información ayuda a la organización a encontrar defectos para una mejor toma de decisión, no los solucionan automáticamente. Tomar en cuenta que no basta con crear cubos OLAP sino que debemos implementarlos. Utilizar las Bases de Datos Empresariales como fuentes de Información para realzar la producción de nuestro organismo y no como una caja donde se almacena datos inertes que a lo largo del tiempo se olvida y no se da ningún uso útil. 10.3 Bibliografía 1.- www.wikipedia.org 2.- www.olap.com 3.- www.rincondelvago.com 4.- www.monagrafias.com 5.- Libros de inteligencia de negocios. 6.- Manual de Implementación OLAP. 7.- Manual de Cubos OLAP. Tnlg. Cristian Paul Peñaloza Salamea. 73 Universidad Católica de Cuenca 10.4 Sistemas OLAP Cronograma El siguiente cronograma es el que se ha cumplido en el desarrollo de este Trabajo de Investigación: Tnlg. Cristian Paul Peñaloza Salamea. 74 Universidad Católica de Cuenca 10.5 Sistemas OLAP Índices de Figuras Cuadro N° 1. Clasificación de los Sistemas OLAP………………………..…..4 Cuadro N° 2. Procesos Operacionales…………………………………...……23 Cuadro N° 3. Almacenamiento Transaccional………………………………24 Cuadro N° 4. Transformación y Agrupación de Datos………………..……33 Cuadro N° 5. Datos Operacionales y Datawarehouse………………….…34 Cuadro N° 6. Varias Columnas a una….………………………………………34 Cuadro N° 7. Una columna a varias……………………………………………35 Cuadro N° 8. Ventajas y Desventajas Rolap………………….………………42 Cuadro N° 9. Ventajas y Desventajas Molap…………...…….………………44 Cuadro N° 10. Esquema Estrella…………………………………………………50 Cuadro N° 11. Esquema Copo de Nieve……...………………………………52 Cuadro N° 12. Cubos OLAP………………………………………………………56 Cuadro N° 13. Cuadro de seguridad de Cubos……..………………………61 Cuadro N° 14. Cuadro de seguridad de Dimensión...………………………61 Cuadro N° 15. Drill Down – Drill Up………………..……..………………………62 Tnlg. Cristian Paul Peñaloza Salamea. 75 Universidad Católica de Cuenca Sistemas OLAP Cuadro N° 16. Slice………………………………….……..………………………63 Cuadro N° 17. Dice………………………………….……..………………………63 Cuadro N° 18. Rotación...………………………….……..………………………64 Cuadro N° 19. Consolidación….………………….……..………………………64 Tnlg. Cristian Paul Peñaloza Salamea. 76