sistemas de inteligencia de negocios

Anuncio
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Estructura de contenidos
INTRODUCCIÓN...........................................................................3
1.
BODEGA DE DATOS (DATA WAREHOUSE)...................................3
1.1.Componentes............................................................3
1.1.1.
Orígenes de datos.........................................4
1.1.1.1.
Sistemas propios...........................................4
1.1.1.2.
Origen externos............................................4
1.1.2.
Área de almacenamiento de Datos.....................4
1.1.2.1.
Modelos de datos dimensionales......................4
1.1.2.2.
Cubos OLAP..................................................7
1.1.3.
Herramientas de Acceso a datos.....................10
1.1.3.1.
Reportes , Informes y herramientas Dashboard..10
1.1.3.2.
Minería de Datos..........................................10
1.1.3.3. Sistemas de Soporte a las Decisiones...........11
2.
CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS..12
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
2.7.
Requisitos de Negocio..................................................12
Modelado dimensional..................................................13
Diseño y desarrollo ETL..................................................14
Diseño y construcción de cubos.....................................16
Implementación Interfaz de usuario..............................17
Plan de Mantenimiento..................................................18
Pruebas e Implementación............................................18
GLOSARIO..................................................................................20
BIBLIOGRAFÍA............................................................................22
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
2
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
INTRODUCCIÓN
Cada día son más las organizaciones alrededor del mundo, que establecen
estrategias y asumen posiciones privilegiadas en el sector debido a la
toma de decisiones de apoyados en Sistemas de Inteligencia de Negocios.
La generación de conocimiento asegura una mejor gestión de los procesos
en las organizaciones, la cadena de valor que adquieren los datos durante
su recorrido por la organización sólo es posible si se tienen adecuadamente
estructuradas las actividades que hacen posible contar con soluciones de
Inteligencia de Negocios (BI).
1. BODEGA DE DATOS (DATA WAREHOUSE)
1.1 Componentes
La estructura organizacional de la bodega permite identificar tres elementos
esenciales en la bodega de datos:
Modelos de Datos
Dimensionales
VENTAS
Reportes , Informes y
herramientas Dashboard
Esquema en Estrella
ERP
Esquema Copo de Nieve
Minería de Datos
SCM
Web Log
Procesos ETL
Esquema Constelación
Sistemas de Soporte
a las Decisiones
Origenes de Datos
Externos
Cubos OLAP
Orígenes de datos
Área de almacenamiento
Herramientas de
Acceso a Datos
3
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
1.1.1. Orígenes de datos
Corresponde a las fuentes que suministran los datos que conformaran la
bodega y permitirán la generación de información asociada a la filosofía
organizacional.
1.1.1.1. Sistemas propios
Al interior de las organizaciones existen sistemas de información los cuales
son la fuente primaria para proveer los datos a transferir a la bodega.
Los repositorios de estos datos pueden ser bases de datos relacionales,
archivos de datos, archivos planos, hojas de cálculo, entre otros, esto
determina la necesidad de establecer procesos pertinentes para el análisis
de los mismos y determinar cuáles de esos datos representan la naturaleza
del negocio y de los objetivos propuestos para la bodega de datos.
1.1.1.2.
Orígenes externos
Además de los sistemas de la organización la interacción con sistemas
externos también genera fuentes de datos, los cuales pueden también
corresponder a diferentes formatos, estos deben ser analizados para
determinar el proceso ETL que corresponda para su inclusión como fuente
de datos en la bodega. Entre estos se encuentran datos de tipo estadístico
y cualitativo, como los desarrollados a través de estudios de mercado,
poblacional, tendencias de la industria, etc.
1.1.2. Área de almacenamiento de Datos
La información contenida en la bodega en su mayoría debe estar
desnormalizada , para agilizar el tiempo de procesamiento de las consultas,
ya que se requiere manejar grandes volúmenes de datos derivados y la
realización de cálculos a diferentes niveles.
1.1.2.1. Modelos de datos dimensionales
Para la construcción del modelo lógico conceptual de la estructura de la
bodega de datos, se utiliza una representación multidimensional de las
variables que conforman los diferentes indicadores de gestión y control.
Se utilizan los modelos estrella, copo de nieve y constelación como forma
de representación gráfica; los componentes de estos modelos son tablas
de datos de dos tipos: tablas de dimensiones y tablas de hechos.
4
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Las tablas de dimensiones son equivalentes a una entidad en un modelo
de datos, tienen una llave primaria y datos que representan los filtros de
información a aplicar, contienen información que en ciertos modelos debe
estar desnormalizada; es importante no olvidar que siempre debe existir
una tabla de dimensión asociada al tiempo, esta debe construirse con
diferentes medidas de tiempo y preferiblemente debe utilizar como llave
primaria un dato de tipo entero, para optimizar los tiempos de búsqueda
y el espacio de almacenamiento.
Las tablas de hechos representan eventos del negocio que deben ser
cuantificables, poseen una llave primaria propia y llaves foráneas que
identifican la relación con las tablas de dimensiones. Posee además otros
campos asociados a las métricas con las que se establecen las respuestas
que forman parte del objetivo de información.
1.1.2.1.1. Esquema en Estrella
Este esquema es un modelo de datos compuesto por una tabla central
denominada Tabla de hechos “Fact Table”, que contiene los datos fuente
de información para el análisis, y unas tablas denominadas dimensiones,
que se encuentran relacionadas con la tabla de hechos.
Dimensiones
Dimensiones
Dimensiones
TABLA DE HECHOS
Dimensiones
Dimensiones
5
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Debido a la simplicidad del modelo, ofrece gran velocidad de procesamiento
al ser usado en el análisis, permitiendo acceder tanto a los datos resumidos
a partir de funciones de agregado como al detalle de la información. Esta
velocidad es producto de la indexación que sufren las tablas de dimensiones
en forma individual, sin afectar el rendimiento de la base de datos en su
conjunto.
1.1.2.1.2. Esquema Copo de Nieve
En este esquema el modelo de datos está compuesto por una tabla
central denominada Tabla de hechos, pero a diferencia del esquema
en estrella las tablas de dimensiones no están relacionadas todas con
dicha tabla. Algunas de las tablas de dimensiones están directamente
relacionadas con otras dimensiones, estableciendo una estructura similar
a la representación gráfica de un copo de nieve.
TABLA DE HECHOS
Al sufrir un proceso de normalización, se reduce el espacio requerido de
almacenamiento en las dimensiones minimizando la redundancia en los
datos, pero al tener que construir más tablas de dimensiones la consulta
de datos disminuye el rendimiento al tener que crear más tablas y
consecuentemente el número de combinaciones (Joins) para procesarlas.
6
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
1.1.2.1.3. Esquema Constelación
En este esquema el modelo de datos consta de más de una tabla de
hechos, lo cual aumenta la complejidad del modelo. Las tablas de
dimensiones son compartidas por las tablas de hechos. Aunque el modelo
ofrece flexibilidad, su estructura puede ser muy compleja para mantener.
Las tablas de hechos pueden llegar a representar diferentes niveles de
detalle, representados por su relación con una misma dimensión. Algunas
tablas representarán detalles y otras representarán pronósticos. Siendo
entonces este modelo una combinación de esquemas en Estrella o Copo
de Nieve.
Dimensiones
Dimensiones
HECHOS A
HECHOS B
Dimensiones
Dimensiones
Dimensiones
1.1.2.2. Cubos OLAP –OnLine Analytical Processing
Un cubo OLAP o de Procesamiento
Analítico en Línea, representa una base
de datos multidimensional caracterizada
porque el almacenamiento se realiza a
través de un arreglo multidimensional.
Las bases de datos relacionales tienen
limitaciones respecto al análisis de
grandes volúmenes de datos, por esta
C
L
I
E
N
T
E
S
25
32
93
Cliente 2
13
15
50
Cliente 3
56
45
11
Cliente 1
Libro 1 Libro 2 Libro 3
AÑOS
Año 3
Año 2
Año 1
LIBROS
7
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
razón la propuesta del almacenamiento en cubos agilizaría los procesos
de análisis sobre los datos, sin embargo estaría limitada al periodo de
tiempo para el cual se construyo el cubo, siendo necesario rediseñar el
cubo si el periodo de análisis cambia.
Las dimensiones en el cubo representan los posibles filtros asociados a
las consultas, cuando se tienen más de tres dimensiones, los cubos se
denominan hipercubos.
Las herramientas OLAP permiten:
“rotar” los cubos.
C
L
I
E
N
T
E
S
25
32
93
Cliente 2
13
15
50
Cliente 3
56
45
11
Cliente 1
Libro 1 Libro 2 Libro 3
AÑOS
Año 3
Año 2
Año 1
L
I
B
R
O
S
Libro 1
25
13
56
Libro 2
32
15
45
Libro 3
93
50
11
Cliente 1 Cliente 2 Cliente 3
LIBROS
AÑOS
Año 3
Año 2
Año 1
CLIENTES
Cambio de dimensión “clientes” por la de “libros”.
Seleccionar sólo algunas de las celdas
C
L
I
E
N
T
E
S
AÑOS
Cliente 2
13
Libro 1
15
Año 1
Libro 2
LIBROS
8
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Totalizar por item
C
L
I
E
N
T
E
S
Cliente 1
150
Cliente 2
78
Cliente 3
112
AÑOS
Año 3
Año 2
Año 1
LIBROS
O cambiar el nivel de agregación para obtener totales en diferentes niveles.
Cubos con mas detalles
C
L
I
E
N
T
E
S
Cliente 1
57
93
Cliente 2
28
50
Cliente 3
101
11
Materia 1 Materia 2
AÑOS
Año 3
Año 2
Año 1
MATERIAS
Se puede obtener diferentes jerarquías a partir de los atributos de las
dimensiones.
9
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
1.1.3. Herramientas de Acceso a datos
Una vez se tengan almacenados
los datos, es necesario procesarlos
para que se conviertan en
conocimiento y apoyen la toma
de decisiones. Estas herramientas
pueden categorizarse de acuerdo
con la complejidad de su uso o
la manera en que presenta la
información así:
Dashboard
Dashboard
Add Widgets...
Services
View Agents
Visual Console
GIS Maps
Inventory
Edit My User
Reporting
SNMP console
Menssages
Extensions
Manage Incidents
1.1.3.1. Reportes , Informes y Herramientas Dashboard
Aquí se presentan los datos para que el usuario visualice la información
en un alto nivel, establece Herramientas para la generación de consultas
e informes con interfaz gráfica, las cuales a través de asistentes facilitan
la realización de peticiones complejas.
El término dashboard (tablero de control) hace alusión a una página
desarrollada con tecnología Web, donde se muestre en tiempo real la
información de la empresa, producto de las operaciones de Inteligencia de
Negocios. Su utilidad se centra en la posibilidad de generar análisis casi
instantáneos.
Para la construcción de los tableros de control es importante identificar los
indicadores de rendimiento claves (KPI – Key Performance Indicator), que
generalmente están asociados a un objetivo de negocio y de esta forma
hacer seguimiento a través de tasas o porcentajes que indican si se esta
cerca o por encima de una meta del negocio. A partir de esta filosofía se
puede descomponer una meta organizacional en metas operacionales.
1.1.3.2. Minería de Datos
La minería de datos busca que a partir de los datos almacenados se pueden
extraer patrones que permitan convertir estos datos en Inteligencia de
Negocios (BI), para lo cual existen en el mercado infinidad de soluciones
de software que proporcionan ventajas competitivas a las organizaciones.
10
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Estas herramientas facilitan la
construcción de modelos de minería
de datos, utilizando orígenes distintos,
tanto de fuentes relacionales como
de cubos multidimensionales. En
estas herramientas se pueden aplicar
las diferentes técnicas asociadas a la
minería como son: el modelado de
regresión lineal, árboles de decisión,
redes neuronales, agrupación, etc.
También permiten la visualización de
los modelos y generar las consultas
de predicción.
1.1.3.3. Sistemas de Soporte a las Decisiones
Un Sistema de Soporte a la Decisión
(DSS) es una herramienta de Inteligencia
de Negocios que permite acceder a los
datos para su análisis y proyección como
información importante para cualquier
organización.
Dentro de las características asociadas a
estas herramientas se encuentran:
• Generación de informes dinámicos y flexibles, ya que permiten ser
modificados.
• Facilidad de utilización para los usuarios.
• Segmentación de información por perfil de usuario.
• Tiempos de respuesta óptimos.
• Integración con los demás sistemas de la compañía.
Dentro de las herramientas DSS se encuentran:
• Sistemas de información gerencial (MIS, Management Information
Systems): provee soporte a tareas organizacionales relacionadas con
aplicaciones CRM/ERP.
• Sistemas de información ejecutiva (EIS, Executive Information
System): provee acceso sencillo a información interna y externa
relevante para alcanzar las metas, especializado en el presentar el
estado diario de la organización a través de indicadores clave.
11
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS
7
6
5
4
3
2
1
Pruebas e Implementación
Plan de Mantenimiento
Implementación Interfaz de Usuario
Diseño y Construcción de Cubos
Diseño y Desarrollo ETL
Modelado Dimensional
Requisitos de Negocio
El anterior diagrama representa las etapas necesarias para la
implementación de un Sistema de Inteligencia de Negocios, estas etapas
son afrontadas por diferentes metodologías y representan un modelo de
procesos a realizar..
2.1. Requisitos de Negocio
Para crear diseños apropiados es necesario identificar
los requerimientos claves correspondientes a los
factores de éxito del negocio, de tal manera que se
describa el alcance de cada nivel de los usuarios y
del Data Warehouse (Bodega de Datos).
Se deben especificar en forma clara y precisa las
funciones que se esperan de la Bodega de Datos,
para lo cual es importante considerar las expectativas
de los diferentes usuarios, tanto a nivel operativo,
como gerencial y del mismo administrador de base
de datos.
12
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Es necesario además identificar las temáticas y objetivos de las áreas
funcionales de la organización y el nivel de detalle de la información
requerida ya que la granularidad determina los niveles de agrupamiento
a implementar, las dimensiones de categorización (tiempo, ubicación
geográfica, sector de industria, clientes, productos, etc.).
En esta etapa se deben determinar cual es el problema que se desea
resolver y establecer los criterios de éxito que pueden ser cualitativos
o cuantitativos. Es importante considerar con que información previa se
cuenta y si se tienen los datos necesarios para resolver los interrogantes.
2.2. Modelado Dimensional
En esta etapa se debe pasar de un modelo Relacional de datos a un
modelo dimensional, para lo cual se deben identificar las dimensiones,
los hechos y el modelo a utilizar. Para determinar los campos contenidos
en estas es recomendable considerar los siguientes ítems:
• Tabla de Dimensiones:
o Debe contener una clave simple no relacionada con la llave del
negocio, normalmente se refiere a llaves auto numéricas.
o Sus campos deben ser descriptores que complementen la información
y representan los niveles de agregación.
o Debe incluir las claves del negocio.
o Siempre debe existir una dimensión temporal.
o Deben ser claras y explicitas ya que representan la interfaz que
tendrán los usuarios para navegar por la información.
o No se debe escatimar en cuanto al número de atributos para la
tabla de dimensiones, ya que el numero de registros que contendrá
es mínimo respecto al de la tabla de hechos.
o Las dimensiones de fechas pueden tener diversas formas de
representarse.
o El numero de dimensiones depende del modelo dimensional adoptado,
pero si se encuentra un numero muy elevado puede ser que algunas
no son independientes y deberían agruparse.
o En algunos casos se
requiere normalizar las dimensiones,
generándose un modelo copo de nieve.
o Deberían ayudar a responder las siguientes preguntas: ¿qué?,
¿quién?, ¿por qué?, ¿dónde? y ¿cuándo?
13
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
• Tabla de Hechos
o Debe contener una clave propia, independiente de las claves de
negocio.
o Los campos representan las métricas, por lo tanto son numéricos
y aditivos (no se almacenan valores individuales, solo totales y
subtotales)
o Contiene los campos de referencia hacia las tablas de dimensiones.
o Cada fila corresponde a una medida
o Si se requiere calcular porcentajes y proporciones deben almacenarse
el numerador y el denominador.
o No tienen valores nulos.
o Existen algunas tablas sin hechos (FactLess) que se utilizan para
relacionar las dimensiones y deben contener un campo de hecho
ficticio con valor por defecto igual a uno (1).
El nivel de detalle con el que se debe construir el modelo depende de
las preguntas que se quieran responder, aunque lo mejor es utilizar el
máximo nivel de detalle, teniendo en cuenta el espacio disponible en
la bodega de datos, también es necesario considerar que cada nivel de
agregación hace que se pierda parte de la información.
2.3. Diseño y desarrollo de procesos ETL
E (Extraction)
T (Transformation)
L (Load)
Limpieza
Integración
Transformación
Actualización
Extracción
Como se observa en la gráfica el proceso ETL recoge información de
diferentes fuentes, transforma los datos convirtiéndolos en datos de
calidad y veracidad, por último carga y actualiza la Bodega de Datos.
Los procesos ETL por lo general consumen mucho tiempo en un proyecto
de BI y es punto clave para el éxito.
14
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
Como se observa en la gráfica el proceso ETL recoge información de
diferentes fuentes, transforma los datos convirtiendo en datos de calidad
y veracidad por ultimo carga, actualiza en la DW.
El proceso extracción, transformación y carga está compuesto por las
siguientes etapas:
a. Extracción: Este proceso obtiene los datos físicamente de las distintas
fuentes de información utilizando técnicas y herramientas ETL, para la
selección del método es necesario tener en cuenta algunas problemáticas
de la extracción de datos como lo son el tipo de plataforma, protocolos,
juego de caracteres, tipos de datos, etc.
b. Limpieza: Al recuperar los datos en bruto, se requiere comprobar la
calidad de los mismos y corregir errores relacionados con campos nulos,
duplicados, inconsistencias en los datos, etc.
Etapas de la limpieza de datos:
• Depurar los valores: Se pueden separar los datos de acuerdo con la
estructura de destino de los datos o la regla definida para esto.
• Corregir: A partir de fuentes de datos externas se puede verificar
la información existente.
• Estandarizar: A partir de formatos definidos por las reglas de
negocio, se sustituyen valores en los campos de datos
• Relacionar: Verifica en otras fuentes la existencia de datos
relacionados, para evitar duplicados.
• Consolidar: A partir de la identificación de relaciones entre registros,
se llevan a una sola representación.
c. Transformación: Una vez que los datos se encuentran “limpios”, se
transforman de acuerdo con las reglas de negocio y las características de
las herramientas a utilizar.
En la transformación se consideran cambios de formato, cambios de
códigos, adición de valores derivados y agregados. Es importante recordar
que los agregados cumplen un valor importante, ya que al almacenar el
resultado de estos cálculos en la Bodega de Datos, se obtendrá un mayor
rendimiento al realizar las consultas respectivas, sin olvidar que el nivel
de granularidad puede estar determinado por la dimensión del tiempo.
d. Integración: En este proceso se realiza la carga de los datos y debe
validarse que los datos cargados en la bodega de datos son consistentes
15
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
con los que se encontraban en el medio transaccional.
e. Actualización: Este proceso es en el cual se determina la periodicidad
con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de
Datos.
2.4. Diseño y construcción de cubos
Un cubo representa un subconjunto de datos de la bodega almacenado en
una estructura multidimensional. Para proceder a la implementación de
los cubos es necesario determinar el tipo de cubo y la herramienta que
se utilizará para ello.
La construcción física de las tablas de dimensiones y las tablas de hechos
se realizan de acuerdo con el modelo dimensional definido y la herramienta
a utilizar, se ejecutan los procesos ETL para poblar las tablas y se genera
el cubo para obtener las respuestas a los requerimientos definidos.
Posteriormente se procede a visualizar la información del cubo.
Para definir el tipo de cubo a construir es necesario identificar las opciones
de almacenamiento que se tienen así:
Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional
On-Line Analytical Processing) almacenando en una base de datos
multidimensional tanto los datos como las agregaciones.
Capacidad:
ROLAP
Detalles
Agregaciones
Vistas
de
Usuario
(Relational On-Line Analytical Processing), los datos de los hipercubos
así como las agregaciones se encuentran dentro de una base de datos
relacional
16
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
HOLAP
Vistas
de
Usuario
Detalles
Agregaciones
(Hibrid On-Line Analytical Processing), los datos se encuentran en una
estructura relacional y los agregados en una estructura multidimensional.
DOLAP
Detalles
Vistas
de
Usuario
(Desktop On-Line Analytical Processing), Los datos se encuentran en una
base de datos multidimensional almacenada en un equipo Cliente.
2.5. Implementación de la Interfaz de usuario
Una vez que han sido construidos los cubos se deben establecer las
herramientas que permitirán la visualización de la información, para lo
cual se cuenta con diversidad de posibilidades tales como:
• Herramientas para la realización de informes, en las cuales participan
desarrolladores, quienes construyen de acuerdo con requerimientos
cambiantes de los usuarios, los informes que van siendo solicitados.
• Herramientas OLAP, que proporcionan a partir de los SMBD
aplicaciones que permiten visualizar los datos desde diferentes
contextos: informes, graficas, estadísticas etc.
• Aplicaciones de DashBoard, permitiendo la visualización sincrónica
de indicadores, referidos a objetivos o metas procedimentales.
• Sistemas DSS, donde se permite utilizar diferentes niveles de análisis
a la información a partir de aplicaciones definidas para ello.
17
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
2.6. Plan de Mantenimiento
Debido a la naturaleza dinámica de algunos datos, es necesario establecer
un plan de acción para considerar los ajustes o reconstrucción de algunos
de los objetos de la Bodega de datos. La siguiente lista proporciona algunos
de los elementos a considerar en el plan de mantenimiento.
• Modificación de datos de origen de las dimensiones. En este
caso debe analizarse si el cambio se asume para toda la historia
del dato (p.e. cambia la fecha de nacimiento del cliente) o si debe
generarse un nuevo ciclo a partir de la modificación del mismo (p.e.
una sucursal cambia de responsable).
Se hace necesario modelar la información de manera tal que no se
pierda el historial de los datos, para esto es posible utilizar “claves
subrogadas”. Una característica importante de la Bodega de Datos, es
la de repositorio de información Histórica.
• Rendimiento. Se debe considerar el espacio ocupado en la bodega
de datos, por esto es posible que se haga necesario modificar las
estructuras de las tablas para aliviar el tamaño de los objetos en la
bodega.
Es importante tener en cuenta que no se debe construir un modelo
para generar un informe en particular, sino que debe dar respuesta a
diferentes áreas a partir de la inclusión de los indicadores y conceptos
del negocio.
• Subutilización de Tablas Agregadas. Aun cuando estas tablas
proporcionan una mejora en el rendimiento de las consultas es
necesario asegurarse que la herramienta BI que se esta utilizando sea
capaz de aprovecharlas, de lo contrario los costes de mantenimiento
y actualización permanente de estas tablas solo harían mas complejo
el sistema.
2.7. Pruebas e Implementación
En esta etapa se evalúa el modelo, partiendo de los criterios de éxito
que se establecieron en la primera etapa. El proceso debe ser revisado a
partir de los resultados obtenidos para determinar si es necesario repetir
alguna de las etapas anteriores.
18
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
ERP
CRM
SCM
Proceso
de
Integración
de datos
Data
Warehouse
Proceso de auditoría
y reconciliación.
Legancy
Calidad de
datos
Control
Usuarios
BI
Puntos de control de Calidad de datos
Se evalúa el modelo respecto a los objetivos planteados y si no existen
restricciones de tiempo se prueba con un problema real, también debe
evaluarse respecto a objetivos diferentes a los inicialmente planteados.
Si los resultados no son satisfactorios se hace necesario realizar otra
iteración desde la fase de modelado o del proceso de ETL; en caso contrario
se hace necesario proceder a la implementación del Sistema de BI.
La implementación se ejecuta a partir del diseño de una estrategia, que
debe incluir la monitorización y mantenimiento de los modelos adoptados
por la bodega de datos, así como la presentación de los resultados de
forma clara y precisa a los usuarios, para cumplir con los objetivos de
conocimiento.
19
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
GLOSARIO
DWH: (Data WareHouse). Bodega de Datos. Es un conjunto de datos
integrados sobre los cuales se soportan procesos de toma de decisiones
para grandes volúmenes de datos.
ETL: (Extraction, Transformation and Load). Corresponde
procesos de:
a los
Extracción: Aquí se identifican las fuentes y la información requerida
por el almacén de datos (BD, archivos planos, aplicaciones no
relacionales, etc.).
Transformación: Una vez se selecciona la información a ser cargada
al almacén, ésta se debe tratar para evitar que la migración no
interrumpan su carga; por ejemplo: tipos de datos, formatos de fecha,
caracteres especiales no visibles (cambios de línea, chr(10),chr(13)),
caracteres de comillas sencillas y otros.
Carga: Después de determinar las fuentes de información, las
transformaciones y limpieza de la información extraída, se procede a
determinar la fuente destino y el mapeo entre la estructura origen y
la destino para realizar la carga de los datos extraídos
KDD: (Knowledge Discovery from Databases). Descubrimiento de
Conocimiento en Bases de Datos cuyo objetivo es encontrar conocimiento
útil, válido, relevante y nuevo sobre una determinada actividad mediante
algoritmos, para grandes volúmenes de datos.
ODS (OPERATIONAL DATA STORE) o Almacén Operacional De Datos
BI: (Business Intelligence) Inteligencia de Negocios es la habilidad para
transformar los datos en información, y la información en conocimiento,
de forma que se pueda optimizar el proceso de toma de decisiones en los
negocios.
20
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
GLOSARIO
OLAP: es el acrónimo en inglés de procesamiento analítico en línea (OnLine Analytical Processing). Es una solución utilizada en el campo de la
llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo
es agilizar la consulta de grandes cantidades de datos. Para ello utiliza
estructuras multidimensionales (o Cubos OLAP) que contienen datos
resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP).
Se usa en informes de negocios de ventas, marketing, informes de
dirección, minería de datos y áreas similares.
La principal característica que potencia a OLAP, es que es lo más rápido a
la hora de ejecutar sentencias SQL de tipoSELECT, en contraposición con
OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y
DELETE
21
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
BIBLIOGRAFÍA
Cano, J. L. (2007). BUSINESS INTELLIGENCE: Competir con Información.
Recuperado el 15 de Mayo de 2012, de http://www.iwith.org/pdf/Libro_
BI_Competir_con_Informacion.pdf
Gallardo Arancibia, J. A. (2009). Metodología para el desarrollo de
proyectos en Minería de Datos CRISP-DM. Recuperado el 20 de Mayo de
2012, de http://www.oldemarrodriguez.com/yahoo_site_admin/assets/
docs/Documento_CRISP-DM.2385037.pdf
Zorrilla, M. (2010). Data WareHouse y OLAP. Recuperado el 29 de Abril
de
2016:
http://docplayer.es/689025-Data-warehouse-y-olap-martazorrilla-universidad-de-cantabria-2010-11.html
22
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS
OBJETO DE
APRENDIZAJE
SISTEMAS DE INTELIGENCIA
DE NEGOCIOS
Desarrollador de contenido
Experto temático
Ana Yaqueline Chavarro Parra
Edna Mireya Rivera L.
Asesor Pedagógico
Rafael Neftalí Lizcano Reyes
Productor Multimedia
Manuel Francisco Silva Barrera
Víctor Hugo Tabares Carreño
Programadores
Daniel Eduardo Martínez Díaz
Grateful Dead Montaño Sierra
Líder expertos temáticos
Ana Yaqueline Chavarro Parra
Líder línea de producción
Santiago Lozada Garcés
R
PANDORAFMS, es una marca registrada propiedad de PANDORAFMS
Enterprise. Copyright ©
Registered trademark
Atribución, no comercial,compartir igual
Este
material
puede
ser
distribuido, copiado y exhibido por
terceros si se muestra en los
créditos. No se puede obtener
ningún beneficio comercial y las
obras derivadas tienen que estar
bajo los mismos términos de
licencia que el trabajo original.
23
FAVA - Formación en Ambientes Virtuales de Aprendizaje
SENA - Servicio Nacional de Aprendizaje
Descargar