SISTEMAS DE INTELIGENCIA DE NEGOCIOS Estructura de contenidos INTRODUCCIÓN...........................................................................3 1. BODEGA DE DATOS (DATA WAREHOUSE)...................................3 1.1.Componentes............................................................3 1.1.1. Orígenes de datos.........................................4 1.1.1.1. Sistemas propios...........................................4 1.1.1.2. Origen externos............................................4 1.1.2. Área de almacenamiento de Datos.....................4 1.1.2.1. Modelos de datos dimensionales......................4 1.1.2.2. Cubos OLAP..................................................7 1.1.3. Herramientas de Acceso a datos.....................10 1.1.3.1. Reportes , Informes y herramientas Dashboard..10 1.1.3.2. Minería de Datos..........................................10 1.1.3.3. Sistemas de Soporte a las Decisiones...........11 2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS..12 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. Requisitos de Negocio..................................................12 Modelado dimensional..................................................13 Diseño y desarrollo ETL..................................................14 Diseño y construcción de cubos.....................................16 Implementación Interfaz de usuario..............................17 Plan de Mantenimiento..................................................18 Pruebas e Implementación............................................18 GLOSARIO..................................................................................20 BIBLIOGRAFÍA............................................................................22 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS 2 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS INTRODUCCIÓN Cada día son más las organizaciones alrededor del mundo, que establecen estrategias y asumen posiciones privilegiadas en el sector debido a la toma de decisiones de apoyados en Sistemas de Inteligencia de Negocios. La generación de conocimiento asegura una mejor gestión de los procesos en las organizaciones, la cadena de valor que adquieren los datos durante su recorrido por la organización sólo es posible si se tienen adecuadamente estructuradas las actividades que hacen posible contar con soluciones de Inteligencia de Negocios (BI). 1. BODEGA DE DATOS (DATA WAREHOUSE) 1.1 Componentes La estructura organizacional de la bodega permite identificar tres elementos esenciales en la bodega de datos: Modelos de Datos Dimensionales VENTAS Reportes , Informes y herramientas Dashboard Esquema en Estrella ERP Esquema Copo de Nieve Minería de Datos SCM Web Log Procesos ETL Esquema Constelación Sistemas de Soporte a las Decisiones Origenes de Datos Externos Cubos OLAP Orígenes de datos Área de almacenamiento Herramientas de Acceso a Datos 3 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS 1.1.1. Orígenes de datos Corresponde a las fuentes que suministran los datos que conformaran la bodega y permitirán la generación de información asociada a la filosofía organizacional. 1.1.1.1. Sistemas propios Al interior de las organizaciones existen sistemas de información los cuales son la fuente primaria para proveer los datos a transferir a la bodega. Los repositorios de estos datos pueden ser bases de datos relacionales, archivos de datos, archivos planos, hojas de cálculo, entre otros, esto determina la necesidad de establecer procesos pertinentes para el análisis de los mismos y determinar cuáles de esos datos representan la naturaleza del negocio y de los objetivos propuestos para la bodega de datos. 1.1.1.2. Orígenes externos Además de los sistemas de la organización la interacción con sistemas externos también genera fuentes de datos, los cuales pueden también corresponder a diferentes formatos, estos deben ser analizados para determinar el proceso ETL que corresponda para su inclusión como fuente de datos en la bodega. Entre estos se encuentran datos de tipo estadístico y cualitativo, como los desarrollados a través de estudios de mercado, poblacional, tendencias de la industria, etc. 1.1.2. Área de almacenamiento de Datos La información contenida en la bodega en su mayoría debe estar desnormalizada , para agilizar el tiempo de procesamiento de las consultas, ya que se requiere manejar grandes volúmenes de datos derivados y la realización de cálculos a diferentes niveles. 1.1.2.1. Modelos de datos dimensionales Para la construcción del modelo lógico conceptual de la estructura de la bodega de datos, se utiliza una representación multidimensional de las variables que conforman los diferentes indicadores de gestión y control. Se utilizan los modelos estrella, copo de nieve y constelación como forma de representación gráfica; los componentes de estos modelos son tablas de datos de dos tipos: tablas de dimensiones y tablas de hechos. 4 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS Las tablas de dimensiones son equivalentes a una entidad en un modelo de datos, tienen una llave primaria y datos que representan los filtros de información a aplicar, contienen información que en ciertos modelos debe estar desnormalizada; es importante no olvidar que siempre debe existir una tabla de dimensión asociada al tiempo, esta debe construirse con diferentes medidas de tiempo y preferiblemente debe utilizar como llave primaria un dato de tipo entero, para optimizar los tiempos de búsqueda y el espacio de almacenamiento. Las tablas de hechos representan eventos del negocio que deben ser cuantificables, poseen una llave primaria propia y llaves foráneas que identifican la relación con las tablas de dimensiones. Posee además otros campos asociados a las métricas con las que se establecen las respuestas que forman parte del objetivo de información. 1.1.2.1.1. Esquema en Estrella Este esquema es un modelo de datos compuesto por una tabla central denominada Tabla de hechos “Fact Table”, que contiene los datos fuente de información para el análisis, y unas tablas denominadas dimensiones, que se encuentran relacionadas con la tabla de hechos. Dimensiones Dimensiones Dimensiones TABLA DE HECHOS Dimensiones Dimensiones 5 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS Debido a la simplicidad del modelo, ofrece gran velocidad de procesamiento al ser usado en el análisis, permitiendo acceder tanto a los datos resumidos a partir de funciones de agregado como al detalle de la información. Esta velocidad es producto de la indexación que sufren las tablas de dimensiones en forma individual, sin afectar el rendimiento de la base de datos en su conjunto. 1.1.2.1.2. Esquema Copo de Nieve En este esquema el modelo de datos está compuesto por una tabla central denominada Tabla de hechos, pero a diferencia del esquema en estrella las tablas de dimensiones no están relacionadas todas con dicha tabla. Algunas de las tablas de dimensiones están directamente relacionadas con otras dimensiones, estableciendo una estructura similar a la representación gráfica de un copo de nieve. TABLA DE HECHOS Al sufrir un proceso de normalización, se reduce el espacio requerido de almacenamiento en las dimensiones minimizando la redundancia en los datos, pero al tener que construir más tablas de dimensiones la consulta de datos disminuye el rendimiento al tener que crear más tablas y consecuentemente el número de combinaciones (Joins) para procesarlas. 6 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS 1.1.2.1.3. Esquema Constelación En este esquema el modelo de datos consta de más de una tabla de hechos, lo cual aumenta la complejidad del modelo. Las tablas de dimensiones son compartidas por las tablas de hechos. Aunque el modelo ofrece flexibilidad, su estructura puede ser muy compleja para mantener. Las tablas de hechos pueden llegar a representar diferentes niveles de detalle, representados por su relación con una misma dimensión. Algunas tablas representarán detalles y otras representarán pronósticos. Siendo entonces este modelo una combinación de esquemas en Estrella o Copo de Nieve. Dimensiones Dimensiones HECHOS A HECHOS B Dimensiones Dimensiones Dimensiones 1.1.2.2. Cubos OLAP –OnLine Analytical Processing Un cubo OLAP o de Procesamiento Analítico en Línea, representa una base de datos multidimensional caracterizada porque el almacenamiento se realiza a través de un arreglo multidimensional. Las bases de datos relacionales tienen limitaciones respecto al análisis de grandes volúmenes de datos, por esta C L I E N T E S 25 32 93 Cliente 2 13 15 50 Cliente 3 56 45 11 Cliente 1 Libro 1 Libro 2 Libro 3 AÑOS Año 3 Año 2 Año 1 LIBROS 7 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS razón la propuesta del almacenamiento en cubos agilizaría los procesos de análisis sobre los datos, sin embargo estaría limitada al periodo de tiempo para el cual se construyo el cubo, siendo necesario rediseñar el cubo si el periodo de análisis cambia. Las dimensiones en el cubo representan los posibles filtros asociados a las consultas, cuando se tienen más de tres dimensiones, los cubos se denominan hipercubos. Las herramientas OLAP permiten: “rotar” los cubos. C L I E N T E S 25 32 93 Cliente 2 13 15 50 Cliente 3 56 45 11 Cliente 1 Libro 1 Libro 2 Libro 3 AÑOS Año 3 Año 2 Año 1 L I B R O S Libro 1 25 13 56 Libro 2 32 15 45 Libro 3 93 50 11 Cliente 1 Cliente 2 Cliente 3 LIBROS AÑOS Año 3 Año 2 Año 1 CLIENTES Cambio de dimensión “clientes” por la de “libros”. Seleccionar sólo algunas de las celdas C L I E N T E S AÑOS Cliente 2 13 Libro 1 15 Año 1 Libro 2 LIBROS 8 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS Totalizar por item C L I E N T E S Cliente 1 150 Cliente 2 78 Cliente 3 112 AÑOS Año 3 Año 2 Año 1 LIBROS O cambiar el nivel de agregación para obtener totales en diferentes niveles. Cubos con mas detalles C L I E N T E S Cliente 1 57 93 Cliente 2 28 50 Cliente 3 101 11 Materia 1 Materia 2 AÑOS Año 3 Año 2 Año 1 MATERIAS Se puede obtener diferentes jerarquías a partir de los atributos de las dimensiones. 9 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS 1.1.3. Herramientas de Acceso a datos Una vez se tengan almacenados los datos, es necesario procesarlos para que se conviertan en conocimiento y apoyen la toma de decisiones. Estas herramientas pueden categorizarse de acuerdo con la complejidad de su uso o la manera en que presenta la información así: Dashboard Dashboard Add Widgets... Services View Agents Visual Console GIS Maps Inventory Edit My User Reporting SNMP console Menssages Extensions Manage Incidents 1.1.3.1. Reportes , Informes y Herramientas Dashboard Aquí se presentan los datos para que el usuario visualice la información en un alto nivel, establece Herramientas para la generación de consultas e informes con interfaz gráfica, las cuales a través de asistentes facilitan la realización de peticiones complejas. El término dashboard (tablero de control) hace alusión a una página desarrollada con tecnología Web, donde se muestre en tiempo real la información de la empresa, producto de las operaciones de Inteligencia de Negocios. Su utilidad se centra en la posibilidad de generar análisis casi instantáneos. Para la construcción de los tableros de control es importante identificar los indicadores de rendimiento claves (KPI – Key Performance Indicator), que generalmente están asociados a un objetivo de negocio y de esta forma hacer seguimiento a través de tasas o porcentajes que indican si se esta cerca o por encima de una meta del negocio. A partir de esta filosofía se puede descomponer una meta organizacional en metas operacionales. 1.1.3.2. Minería de Datos La minería de datos busca que a partir de los datos almacenados se pueden extraer patrones que permitan convertir estos datos en Inteligencia de Negocios (BI), para lo cual existen en el mercado infinidad de soluciones de software que proporcionan ventajas competitivas a las organizaciones. 10 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS Estas herramientas facilitan la construcción de modelos de minería de datos, utilizando orígenes distintos, tanto de fuentes relacionales como de cubos multidimensionales. En estas herramientas se pueden aplicar las diferentes técnicas asociadas a la minería como son: el modelado de regresión lineal, árboles de decisión, redes neuronales, agrupación, etc. También permiten la visualización de los modelos y generar las consultas de predicción. 1.1.3.3. Sistemas de Soporte a las Decisiones Un Sistema de Soporte a la Decisión (DSS) es una herramienta de Inteligencia de Negocios que permite acceder a los datos para su análisis y proyección como información importante para cualquier organización. Dentro de las características asociadas a estas herramientas se encuentran: • Generación de informes dinámicos y flexibles, ya que permiten ser modificados. • Facilidad de utilización para los usuarios. • Segmentación de información por perfil de usuario. • Tiempos de respuesta óptimos. • Integración con los demás sistemas de la compañía. Dentro de las herramientas DSS se encuentran: • Sistemas de información gerencial (MIS, Management Information Systems): provee soporte a tareas organizacionales relacionadas con aplicaciones CRM/ERP. • Sistemas de información ejecutiva (EIS, Executive Information System): provee acceso sencillo a información interna y externa relevante para alcanzar las metas, especializado en el presentar el estado diario de la organización a través de indicadores clave. 11 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS 2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS 7 6 5 4 3 2 1 Pruebas e Implementación Plan de Mantenimiento Implementación Interfaz de Usuario Diseño y Construcción de Cubos Diseño y Desarrollo ETL Modelado Dimensional Requisitos de Negocio El anterior diagrama representa las etapas necesarias para la implementación de un Sistema de Inteligencia de Negocios, estas etapas son afrontadas por diferentes metodologías y representan un modelo de procesos a realizar.. 2.1. Requisitos de Negocio Para crear diseños apropiados es necesario identificar los requerimientos claves correspondientes a los factores de éxito del negocio, de tal manera que se describa el alcance de cada nivel de los usuarios y del Data Warehouse (Bodega de Datos). Se deben especificar en forma clara y precisa las funciones que se esperan de la Bodega de Datos, para lo cual es importante considerar las expectativas de los diferentes usuarios, tanto a nivel operativo, como gerencial y del mismo administrador de base de datos. 12 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS Es necesario además identificar las temáticas y objetivos de las áreas funcionales de la organización y el nivel de detalle de la información requerida ya que la granularidad determina los niveles de agrupamiento a implementar, las dimensiones de categorización (tiempo, ubicación geográfica, sector de industria, clientes, productos, etc.). En esta etapa se deben determinar cual es el problema que se desea resolver y establecer los criterios de éxito que pueden ser cualitativos o cuantitativos. Es importante considerar con que información previa se cuenta y si se tienen los datos necesarios para resolver los interrogantes. 2.2. Modelado Dimensional En esta etapa se debe pasar de un modelo Relacional de datos a un modelo dimensional, para lo cual se deben identificar las dimensiones, los hechos y el modelo a utilizar. Para determinar los campos contenidos en estas es recomendable considerar los siguientes ítems: • Tabla de Dimensiones: o Debe contener una clave simple no relacionada con la llave del negocio, normalmente se refiere a llaves auto numéricas. o Sus campos deben ser descriptores que complementen la información y representan los niveles de agregación. o Debe incluir las claves del negocio. o Siempre debe existir una dimensión temporal. o Deben ser claras y explicitas ya que representan la interfaz que tendrán los usuarios para navegar por la información. o No se debe escatimar en cuanto al número de atributos para la tabla de dimensiones, ya que el numero de registros que contendrá es mínimo respecto al de la tabla de hechos. o Las dimensiones de fechas pueden tener diversas formas de representarse. o El numero de dimensiones depende del modelo dimensional adoptado, pero si se encuentra un numero muy elevado puede ser que algunas no son independientes y deberían agruparse. o En algunos casos se requiere normalizar las dimensiones, generándose un modelo copo de nieve. o Deberían ayudar a responder las siguientes preguntas: ¿qué?, ¿quién?, ¿por qué?, ¿dónde? y ¿cuándo? 13 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS • Tabla de Hechos o Debe contener una clave propia, independiente de las claves de negocio. o Los campos representan las métricas, por lo tanto son numéricos y aditivos (no se almacenan valores individuales, solo totales y subtotales) o Contiene los campos de referencia hacia las tablas de dimensiones. o Cada fila corresponde a una medida o Si se requiere calcular porcentajes y proporciones deben almacenarse el numerador y el denominador. o No tienen valores nulos. o Existen algunas tablas sin hechos (FactLess) que se utilizan para relacionar las dimensiones y deben contener un campo de hecho ficticio con valor por defecto igual a uno (1). El nivel de detalle con el que se debe construir el modelo depende de las preguntas que se quieran responder, aunque lo mejor es utilizar el máximo nivel de detalle, teniendo en cuenta el espacio disponible en la bodega de datos, también es necesario considerar que cada nivel de agregación hace que se pierda parte de la información. 2.3. Diseño y desarrollo de procesos ETL E (Extraction) T (Transformation) L (Load) Limpieza Integración Transformación Actualización Extracción Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiéndolos en datos de calidad y veracidad, por último carga y actualiza la Bodega de Datos. Los procesos ETL por lo general consumen mucho tiempo en un proyecto de BI y es punto clave para el éxito. 14 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS Como se observa en la gráfica el proceso ETL recoge información de diferentes fuentes, transforma los datos convirtiendo en datos de calidad y veracidad por ultimo carga, actualiza en la DW. El proceso extracción, transformación y carga está compuesto por las siguientes etapas: a. Extracción: Este proceso obtiene los datos físicamente de las distintas fuentes de información utilizando técnicas y herramientas ETL, para la selección del método es necesario tener en cuenta algunas problemáticas de la extracción de datos como lo son el tipo de plataforma, protocolos, juego de caracteres, tipos de datos, etc. b. Limpieza: Al recuperar los datos en bruto, se requiere comprobar la calidad de los mismos y corregir errores relacionados con campos nulos, duplicados, inconsistencias en los datos, etc. Etapas de la limpieza de datos: • Depurar los valores: Se pueden separar los datos de acuerdo con la estructura de destino de los datos o la regla definida para esto. • Corregir: A partir de fuentes de datos externas se puede verificar la información existente. • Estandarizar: A partir de formatos definidos por las reglas de negocio, se sustituyen valores en los campos de datos • Relacionar: Verifica en otras fuentes la existencia de datos relacionados, para evitar duplicados. • Consolidar: A partir de la identificación de relaciones entre registros, se llevan a una sola representación. c. Transformación: Una vez que los datos se encuentran “limpios”, se transforman de acuerdo con las reglas de negocio y las características de las herramientas a utilizar. En la transformación se consideran cambios de formato, cambios de códigos, adición de valores derivados y agregados. Es importante recordar que los agregados cumplen un valor importante, ya que al almacenar el resultado de estos cálculos en la Bodega de Datos, se obtendrá un mayor rendimiento al realizar las consultas respectivas, sin olvidar que el nivel de granularidad puede estar determinado por la dimensión del tiempo. d. Integración: En este proceso se realiza la carga de los datos y debe validarse que los datos cargados en la bodega de datos son consistentes 15 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS con los que se encontraban en el medio transaccional. e. Actualización: Este proceso es en el cual se determina la periodicidad con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de Datos. 2.4. Diseño y construcción de cubos Un cubo representa un subconjunto de datos de la bodega almacenado en una estructura multidimensional. Para proceder a la implementación de los cubos es necesario determinar el tipo de cubo y la herramienta que se utilizará para ello. La construcción física de las tablas de dimensiones y las tablas de hechos se realizan de acuerdo con el modelo dimensional definido y la herramienta a utilizar, se ejecutan los procesos ETL para poblar las tablas y se genera el cubo para obtener las respuestas a los requerimientos definidos. Posteriormente se procede a visualizar la información del cubo. Para definir el tipo de cubo a construir es necesario identificar las opciones de almacenamiento que se tienen así: Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional On-Line Analytical Processing) almacenando en una base de datos multidimensional tanto los datos como las agregaciones. Capacidad: ROLAP Detalles Agregaciones Vistas de Usuario (Relational On-Line Analytical Processing), los datos de los hipercubos así como las agregaciones se encuentran dentro de una base de datos relacional 16 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS HOLAP Vistas de Usuario Detalles Agregaciones (Hibrid On-Line Analytical Processing), los datos se encuentran en una estructura relacional y los agregados en una estructura multidimensional. DOLAP Detalles Vistas de Usuario (Desktop On-Line Analytical Processing), Los datos se encuentran en una base de datos multidimensional almacenada en un equipo Cliente. 2.5. Implementación de la Interfaz de usuario Una vez que han sido construidos los cubos se deben establecer las herramientas que permitirán la visualización de la información, para lo cual se cuenta con diversidad de posibilidades tales como: • Herramientas para la realización de informes, en las cuales participan desarrolladores, quienes construyen de acuerdo con requerimientos cambiantes de los usuarios, los informes que van siendo solicitados. • Herramientas OLAP, que proporcionan a partir de los SMBD aplicaciones que permiten visualizar los datos desde diferentes contextos: informes, graficas, estadísticas etc. • Aplicaciones de DashBoard, permitiendo la visualización sincrónica de indicadores, referidos a objetivos o metas procedimentales. • Sistemas DSS, donde se permite utilizar diferentes niveles de análisis a la información a partir de aplicaciones definidas para ello. 17 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS 2.6. Plan de Mantenimiento Debido a la naturaleza dinámica de algunos datos, es necesario establecer un plan de acción para considerar los ajustes o reconstrucción de algunos de los objetos de la Bodega de datos. La siguiente lista proporciona algunos de los elementos a considerar en el plan de mantenimiento. • Modificación de datos de origen de las dimensiones. En este caso debe analizarse si el cambio se asume para toda la historia del dato (p.e. cambia la fecha de nacimiento del cliente) o si debe generarse un nuevo ciclo a partir de la modificación del mismo (p.e. una sucursal cambia de responsable). Se hace necesario modelar la información de manera tal que no se pierda el historial de los datos, para esto es posible utilizar “claves subrogadas”. Una característica importante de la Bodega de Datos, es la de repositorio de información Histórica. • Rendimiento. Se debe considerar el espacio ocupado en la bodega de datos, por esto es posible que se haga necesario modificar las estructuras de las tablas para aliviar el tamaño de los objetos en la bodega. Es importante tener en cuenta que no se debe construir un modelo para generar un informe en particular, sino que debe dar respuesta a diferentes áreas a partir de la inclusión de los indicadores y conceptos del negocio. • Subutilización de Tablas Agregadas. Aun cuando estas tablas proporcionan una mejora en el rendimiento de las consultas es necesario asegurarse que la herramienta BI que se esta utilizando sea capaz de aprovecharlas, de lo contrario los costes de mantenimiento y actualización permanente de estas tablas solo harían mas complejo el sistema. 2.7. Pruebas e Implementación En esta etapa se evalúa el modelo, partiendo de los criterios de éxito que se establecieron en la primera etapa. El proceso debe ser revisado a partir de los resultados obtenidos para determinar si es necesario repetir alguna de las etapas anteriores. 18 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS ERP CRM SCM Proceso de Integración de datos Data Warehouse Proceso de auditoría y reconciliación. Legancy Calidad de datos Control Usuarios BI Puntos de control de Calidad de datos Se evalúa el modelo respecto a los objetivos planteados y si no existen restricciones de tiempo se prueba con un problema real, también debe evaluarse respecto a objetivos diferentes a los inicialmente planteados. Si los resultados no son satisfactorios se hace necesario realizar otra iteración desde la fase de modelado o del proceso de ETL; en caso contrario se hace necesario proceder a la implementación del Sistema de BI. La implementación se ejecuta a partir del diseño de una estrategia, que debe incluir la monitorización y mantenimiento de los modelos adoptados por la bodega de datos, así como la presentación de los resultados de forma clara y precisa a los usuarios, para cumplir con los objetivos de conocimiento. 19 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS GLOSARIO DWH: (Data WareHouse). Bodega de Datos. Es un conjunto de datos integrados sobre los cuales se soportan procesos de toma de decisiones para grandes volúmenes de datos. ETL: (Extraction, Transformation and Load). Corresponde procesos de: a los Extracción: Aquí se identifican las fuentes y la información requerida por el almacén de datos (BD, archivos planos, aplicaciones no relacionales, etc.). Transformación: Una vez se selecciona la información a ser cargada al almacén, ésta se debe tratar para evitar que la migración no interrumpan su carga; por ejemplo: tipos de datos, formatos de fecha, caracteres especiales no visibles (cambios de línea, chr(10),chr(13)), caracteres de comillas sencillas y otros. Carga: Después de determinar las fuentes de información, las transformaciones y limpieza de la información extraída, se procede a determinar la fuente destino y el mapeo entre la estructura origen y la destino para realizar la carga de los datos extraídos KDD: (Knowledge Discovery from Databases). Descubrimiento de Conocimiento en Bases de Datos cuyo objetivo es encontrar conocimiento útil, válido, relevante y nuevo sobre una determinada actividad mediante algoritmos, para grandes volúmenes de datos. ODS (OPERATIONAL DATA STORE) o Almacén Operacional De Datos BI: (Business Intelligence) Inteligencia de Negocios es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. 20 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS GLOSARIO OLAP: es el acrónimo en inglés de procesamiento analítico en línea (OnLine Analytical Processing). Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipoSELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE 21 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS BIBLIOGRAFÍA Cano, J. L. (2007). BUSINESS INTELLIGENCE: Competir con Información. Recuperado el 15 de Mayo de 2012, de http://www.iwith.org/pdf/Libro_ BI_Competir_con_Informacion.pdf Gallardo Arancibia, J. A. (2009). Metodología para el desarrollo de proyectos en Minería de Datos CRISP-DM. Recuperado el 20 de Mayo de 2012, de http://www.oldemarrodriguez.com/yahoo_site_admin/assets/ docs/Documento_CRISP-DM.2385037.pdf Zorrilla, M. (2010). Data WareHouse y OLAP. Recuperado el 29 de Abril de 2016: http://docplayer.es/689025-Data-warehouse-y-olap-martazorrilla-universidad-de-cantabria-2010-11.html 22 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje SISTEMAS DE INTELIGENCIA DE NEGOCIOS OBJETO DE APRENDIZAJE SISTEMAS DE INTELIGENCIA DE NEGOCIOS Desarrollador de contenido Experto temático Ana Yaqueline Chavarro Parra Edna Mireya Rivera L. Asesor Pedagógico Rafael Neftalí Lizcano Reyes Productor Multimedia Manuel Francisco Silva Barrera Víctor Hugo Tabares Carreño Programadores Daniel Eduardo Martínez Díaz Grateful Dead Montaño Sierra Líder expertos temáticos Ana Yaqueline Chavarro Parra Líder línea de producción Santiago Lozada Garcés R PANDORAFMS, es una marca registrada propiedad de PANDORAFMS Enterprise. Copyright © Registered trademark Atribución, no comercial,compartir igual Este material puede ser distribuido, copiado y exhibido por terceros si se muestra en los créditos. No se puede obtener ningún beneficio comercial y las obras derivadas tienen que estar bajo los mismos términos de licencia que el trabajo original. 23 FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje