ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
IMPLEMENTACION DE UN DATAMART PARA EL ÁREA DE
CAPACITACIÓN Y CONSULTORÍA DEL CENTRO DE
EDUCACIÓN CONTINUA “CEC”
PROYECTO PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN
SISTEMAS INFORMATICOS Y DE COMPUTACION
JIMÉNEZ CHAMBA FERNANDO SANTIAGO
[email protected]
ZAMBRANO NOGUERA EDGAR ROLANDO
[email protected]
DIRECTOR: MSc. FRANCISCO VILLAVICENCIO
[email protected]
Quito, Diciembre 2009
2
DECLARACIÓN
Nosotros, Jiménez Chamba Fernando Santiago y Zambrano Noguera
Edgar Rolando, declaramos bajo juramento que el trabajo aquí descrito es
de nuestra autoría; que no ha sido previamente presentada para ningún
grado o calificación profesional; y, que hemos consultado las referencias
bibliográficas que se incluyen en este documento.
A través de la presente declaración cedemos nuestros derechos de
propiedad intelectual correspondientes a este trabajo, a la Escuela
Politécnica Nacional, según lo establecido por la Ley de Propiedad
Intelectual, por su Reglamento y por la normatividad institucional vigente.
__________________________
Fernando Santiago Jiménez
_______________________
Edgar Rolando Zambrano
3
CERTIFICACION
Certifico que el presente trabajo fue desarrollado por Jiménez Chamba
Fernando Santiago y Zambrano Noguera Edgar Rolando, bajo mi supervisión.
__________________________
Ing. Francisco Villavicencio
DIRECTOR DE PROYECTO
4
DEDICATORIA
El presente trabajo va dedicado de todo corazón a mi Papá y a mi Mamá,
quienes me han apoyado incondicionalmente a cada momento, por esforzarse
noche y día para ofrecerme siempre lo mejor, por enseñarme valiosos
principios y por incentivarme a ser una mejor persona cada día.
A mi querida hermana, por apoyarme constantemente, por darme muy buenos
consejos y por enseñarme que a pesar de las adversidades que se puedan
presentar uno siempre debe salir adelante y no rendirse.
A mis padrinos Libia y Germán por estar siempre pendientes de mi y por
motivarme a alcanzar mis objetivos.
A mis amigos Alexis, Amanda y Edgar por ser como unos hermanos para mí,
por compartir conmigo gratos momentos y por ofrecerme su apoyo cuando lo
he necesitado.
A mis profesores por haber compartido sus conocimientos y experiencias con la
finalidad de incentivarnos a ser buenos profesionales.
A nuestro tutor, MSc. Francisco Villavicencio, que gracias a su guía y apoyo,
fue posible culminar este proyecto,
Fernando
5
DEDICATORIA
Dedico este proyecto y toda mi vida a Dios por estar a mi lado dia a día,
dándome las fuerzas necesarias par seguir adelante.
A mis padres, Vicente y Ma. Salomé, por su apoyo infinito, amor incondicional y
humildad, sus consejos y paciencia, quienes han sido siempre mi fuente de
inspiración y guía de vida.
A mis hermanos, Carmita (+) que desde el Cielo me cuida y es mi ángel de la
guarda, Nixon por sus consejos, y Jeanneth por ser como mi segunda madre.
A mis sobrino, Esteban por enseñarme lo paciente que puede ser un niño, por
la alegría y pureza con que se pueden realizar las cosas y ser la razón de mi
vida.
A mi amigo Fernando, por su dedicación, empeño y paciencia que tuvo durante
todos los proyectos que se nos presentaron, durante la carrera.
A mis profesores y compañeros de clases por haberme transmitido sus
conocimientos y darme lecciones tanto profesionales como de vida.
A nuestro tutor, MSc. Francisco Villavicencio,
que gracias a su valiosa
orientación, fue posible culminar este proyecto,
Edgar
6
INDICE
CAPITULO 1 ...................................................................................................... 20
1.1
JUSTIFICACIÓN DE LA METODOLOGÍA DE DESARROLLO ........... 20
1.1.1
METODOLOGÍA PROPUESTA POR GILL HARJINDER Y RAO
PRAKASH ................................................................................................... 20
1.1.1.1 Planificación ................................................................................ 20
1.1.1.2 Requerimientos ........................................................................... 23
1.1.1.3 Análisis........................................................................................ 24
1.1.1.4 Diseño ......................................................................................... 25
1.1.1.5 Construcción ............................................................................... 26
1.1.1.6 Despliegue .................................................................................. 26
1.1.1.7 Expansión ................................................................................... 27
1.1.2
METODOLOGÍA PROPUESTA POR SAS INSTITUTE ................ 27
1.1.2.1 Evaluación................................................................................... 28
1.1.2.2 Requerimientos ........................................................................... 29
1.1.2.3 Diseño ......................................................................................... 30
1.1.2.4 Construcción ............................................................................... 30
1.1.2.5 Pruebas Finales .......................................................................... 31
1.1.2.6 Despliegue .................................................................................. 31
1.1.2.7 Revisión ...................................................................................... 32
1.1.3
SELECCIÓN DE LA METODOLOGÍA DE IMPLEMENTACIÓN ... 33
1.1.3.1 Planificación ................................................................................ 33
1.1.3.2 Requerimientos ........................................................................... 34
1.1.3.3 Análisis........................................................................................ 35
1.1.3.4 Diseño ......................................................................................... 36
1.1.3.5 Implementación........................................................................... 36
1.1.3.6 Pruebas....................................................................................... 37
1.2
SELECCIÓN DE HERRAMIENTAS DE IMPLEMENTACIÓN.............. 39
7
1.2.1
HERRAMIENTAS BUSINESS INTELLIGENCE ............................ 39
1.2.1.1 Microsoft SQL Server Business Intelligence MSSBI .................. 39
CAPITULO 2 ...................................................................................................... 42
IMPLEMENTACION DEL DATAMART .......................................................... 42
2.1
PLANIFICACION................................................................................... 42
2.1.1
Objetivo del Datamart..................................................................... 42
2.1.2
Situación actual de la Coordinación de Capacitación y Consultoría
(CCC) 42
2.1.2.1 Generalidades:............................................................................ 42
2.1.2.2 Detalle del Proceso Productivo de la CCC ................................. 43
2.1.2.3 Modelo orgánico funcional de la CCC ........................................ 44
2.1.2.4 Productos de la CCC .................................................................. 46
2.1.2.5 Infraestructura Tecnológica ........................................................ 47
2.1.2.6 Identificación de problemas ........................................................ 50
2.1.3
Desarrollo del cronograma y presupuesto del proyecto ................ 50
2.1.4
Definición de los objetivos de uso empresarial.............................. 51
2.1.4.1 Audiencia de destino:.................................................................. 51
2.1.4.2 Plataforma tecnológica: .............................................................. 52
2.1.4.3 Características y Funciones........................................................ 52
2.1.4.4 Selección de la estrategia de implementación ........................... 53
2.1.4.5 Selección del método de desarrollo............................................ 53
2.1.4.6 Selección del ámbito inicial de implementación ......................... 53
2.1.4.7 Origen de las fuentes de datos ................................................... 53
2.1.4.8 Modelo Empresarial .................................................................... 53
2.1.5
Selección del enfoque arquitectónico ............................................ 54
2.1.6
Desarrollo de escenarios de uso empresarial................................ 55
2.1.7
Recopilación de datos y metadatos ............................................... 56
2.2
REQUERIMIENTOS ............................................................................. 56
2.2.1
Requerimientos del propietario ...................................................... 56
2.2.2
Requerimientos del arquitecto ....................................................... 56
8
2.2.2.1 Bloques del Datamart ................................................................. 57
2.2.2.2 Capas del datamart.................................................................... 60
2.2.3
Requerimientos del desarrollador .................................................. 61
2.2.3.1 Fuentes de Datos........................................................................ 61
2.2.3.2 Datamart ..................................................................................... 61
2.2.3.3 Acceso y Uso .............................................................................. 61
2.2.4
Requerimientos del usuario final.................................................... 61
2.2.4.1 Requerimientos de consulta ....................................................... 62
2.2.4.2 Requerimientos de reporte ......................................................... 63
2.3
ANALISIS .............................................................................................. 64
2.3.1
DIMENSIONES .............................................................................. 64
2.3.2
TABLAS DE HECHO...................................................................... 65
2.3.2.1 Proceso de medición académica................................................ 65
2.3.2.2 Medidas....................................................................................... 65
2.3.2.3 Dimensiones ............................................................................... 65
2.3.2.4 Modelo Lógico............................................................................. 66
2.3.3
Proceso de medición de evaluación a cursos................................ 66
2.3.3.1 Medidas....................................................................................... 66
2.3.3.2 Dimensiones ............................................................................... 66
2.3.3.3 Modelo Lógico............................................................................. 67
2.3.4
Proceso de medición de encuestas realizadas.............................. 67
2.3.4.1 Medidas....................................................................................... 67
2.3.4.2 Dimensiones ............................................................................... 67
2.3.4.3 Modelo Lógico............................................................................. 68
2.3.5
Proceso de medición de rendimiento de cursos ............................ 68
2.3.5.1 Medidas....................................................................................... 69
2.3.5.2 Dimensiones ............................................................................... 69
2.3.5.3 Modelo Lógico............................................................................. 69
2.3.6
Estrategia de Carga y Refrescamiento de datos .......................... 70
9
2.3.6.1 Estrategia de carga de datos ...................................................... 70
2.3.6.2 Estrategia de Refrescamiento de Datos ..................................... 74
2.4
DISEÑO ................................................................................................ 75
2.4.1
Dimensiones................................................................................... 75
2.4.1.1 Diseño físico de la dimensión DIM_OBSERVACION:................ 75
2.4.1.2 Diseño físico de la dimensión DIM_TIEMPO ............................. 75
2.4.1.3 Diseño físico de la dimensión DIM_ITEM................................... 75
2.4.1.4 Diseño físico de la dimensión DIM_INSTRUCTOR.................... 75
2.4.1.5 Diseño físico de la dimensión DIM_EVALUABLE ...................... 75
2.4.1.6 Diseño físico de la dimensión DIM_CURSO .............................. 76
2.4.1.7 Diseño físico de la dimensión DIM_CLIENTE ............................ 76
2.4.2
Proceso de medición académica ................................................... 76
2.4.2.1 Diseño físico de la tabla de hechos FACT_ACADEMICO ......... 76
2.4.2.2 Modelo físico de la tabla de hechos FACT_ACADEMICO......... 76
2.4.3
Proceso de medición de evaluación a cursos................................ 77
2.4.3.1 Diseño físico de la tabla de hechos FACT_EVALUACION ....... 77
2.4.3.2 Modelo físico de la tabla de hechos FACT_EVALUACION ....... 77
2.4.4
Proceso de medición de encuestas realizadas............................. 78
2.4.4.1 Diseño físico de la tabla de hechos FACT_ENCUESTA............ 78
2.4.4.2 Modelo físico de la tabla de hechos FACT_ENCUESTA ........... 78
2.4.5
Proceso de medición de rendimiento de cursos ............................ 79
2.4.5.1 Diseño físico de la tabla de hechos FACT_RENDIMIENTO ...... 79
2.4.5.2 Modelo físico de la tabla de hechos FACT_RENDIMIENTO .... 80
2.4.6
Diseño detallado de la arquitectura de aplicación ......................... 80
2.4.6.1 Fuentes de datos ........................................................................ 81
2.4.6.2 Datamart ..................................................................................... 81
2.4.6.3 Acceso y uso............................................................................... 81
2.4.6.4 Componente de visualización ..................................................... 82
2.4.7
Definición de los niveles de seguridad........................................... 83
10
2.5
IMPLEMENTACIÓN.............................................................................. 84
2.5.1
Implementación de la Estrategia de Carga.................................... 84
2.5.2
Implementación de la Estrategia de Refrescamiento de datos ..... 86
2.5.3
Explotación ..................................................................................... 87
2.5.3.1 Orígenes de datos ...................................................................... 87
2.5.3.2 Vista de orígenes de datos ......................................................... 89
2.5.3.3 Cubos .......................................................................................... 91
2.5.4
Elaboración de Consultas .............................................................. 95
2.5.4.1 Parámetros de consulta .............................................................. 95
2.5.4.2 Estructura del reporte ................................................................. 96
2.6
PRUEBAS ............................................................................................. 97
2.6.1
Pruebas de validación de requerimientos...................................... 97
2.6.2
Pruebas Funcionales...................................................................... 99
2.6.2.1 Pruebas de extracción, transformación y carga ....................... 99
2.6.2.2 Prueba de refrescamiento de datos..........................................101
2.6.2.3 Pruebas de seguridad...............................................................102
2.6.2.4 Pruebas de rendimiento del sistema ........................................103
2.6.3
Despliegue....................................................................................105
2.6.3.1 Instalación inicial del datamart..................................................105
2.6.3.2 Capacitación a los usuarios del datamart.................................105
2.6.4
Revisión y expansión ...................................................................108
2.6.4.1 Requerimientos limitados por el modelo de datos del datamart
108
2.6.4.2 Identificación de otras fuentes de datos externas que no han sido
tomadas en cuenta en el ámbito inicial..................................................109
2.6.4.3 Potenciación y mejoramiento del modelo de datos del datamart
109
2.6.4.4 Coordinaciones no atendidas ..................................................109
CAPITULO 3 ....................................................................................................111
CONCLUSIONES Y RECOMENDACIONES ...............................................111
11
3.1
Conclusiones.......................................................................................111
3.2
Recomendaciones ..............................................................................114
12
ÍNDICE DE FIGURAS
Figura 1: Proceso Iterativo del SAS Rapid Warehousing Methodology ........... 28
Figura 2: Definición de la Fase de Planificación ................................................ 34
Figura 3: Definición de la Fase de Requerimientos ........................................... 35
Figura 4: Definición de la Fase de Análisis........................................................ 35
Figura 5: Definición de la Fase de Análisis y Diseño......................................... 36
Figura 6: Definición de la Fase de Implementación........................................... 37
Figura 7: Definición de la Fase de Implementación........................................... 39
Figura 8: Mapa de Procesos del CEC................................................................ 43
Figura 9: Proceso Productivo de la CCC ........................................................... 43
Figura 10: Organigrama Funcional de la Coordinación de ................................ 45
Figura 11: Infraestructura tecnológica el CEC ................................................... 49
Figura 12: Arquitectura Cliente / Servidor de dos capas ................................... 55
Figura 13: Arquitectura propuesta del datamart ............................................... 57
Figura 14: Modelo Físico de la base de datos SISCEC .................................... 58
Figura 15: Arquitectura del datamart a alto nivel .............................................. 59
Figura 16: Modelo lógico del datamart FACT_ACADEMICO ............................ 66
Figura 17: Modelo lógico del datamart FACT_EVALUACION........................... 67
Figura 18: Modelo lógico del datamart FACT_ENCUESTA .............................. 68
Figura 19: Modelo lógico del datamart FACT_RENDIMIENTO......................... 69
Figura 20: Extracción y carga de datos desde las fuentes de datos ................. 70
Figura 21: Modelo físico del proceso de medición académica .......................... 77
Figura 22: Modelo físico del proceso de medición de evaluación a cursos ...... 78
Figura 23: Modelo físico del proceso de encuestas realizadas ......................... 79
Figura 24: Modelo físico del proceso de medición de rendimiento de cursos... 80
Figura 25: Arquitectura cliente/servidor de la aplicación ................................... 81
Figura 26: Interfaz de autenticación de usuarios ............................................... 82
Figura 27: Interfaz de reportes........................................................................... 83
Figura 28: Proceso de extracción, transformación y carga de la base de datos
SISCEC ....................................................................................................... 85
13
Figura 29: Proceso de extracción, transformación y carga de la base de datos
dmTransformacion a la base de datos dmCCC. ........................................ 86
Figura 30: Calendarización del DTS .................................................................. 87
Figura 31: Selección de la base de datos del datamart como origen de datos. 88
Figura 32: Verificación de conexión con el origen de datos .............................. 88
Figura 33: Selección de credenciales para Analysis Services .......................... 89
Figura 34: Selección del origen de datos relacional .......................................... 89
Figura 35: Selección de las dimensiones y tablas de hechos ........................... 90
Figura 36: Asignación del nombre de la vista de origen de datos..................... 90
Figura 37: Vista de orígenes de datos ............................................................... 91
Figura 38: Selección del método de generación del cubo................................. 91
Figura 39: Selección de la vista de orígenes de datos ...................................... 92
Figura 40: Identificación de las tablas de hechos y de dimensiones................. 92
Figura 41: Identificación de propiedades de tiempo en la dimensión
DIM_TIEMPO.............................................................................................. 93
Figura 42: Medidas a incluir en el cubo ............................................................. 93
Figura 43: Especificación del nombre del cubo ................................................. 94
Figura 43: Esquema del cubo generado............................................................ 95
Figura 45: Extracción, transformación y carga desde la base de datos SISCEC
a la base de datos dmTransformacion .....................................................100
Figura 46: Extracción, transformación y carga desde la base de datos
dmTransformacion a la base de datos dmCCC. ......................................101
Figura 47: Pantalla de inicio de sesión del administrador de reportes SEG_CEC
..................................................................................................................103
Figura 48: Reporte de visualización del indicador de satisfacción del cliente.103
Figura 49: Evaluación de rendimiento del Servidor de datamart.....................105
Figura 50: Porcentaje de aceptación en aprendizaje ......................................106
Figura 51: Porcentaje de aceptación en navegabilidad...................................107
Figura 52: Porcentaje de aceptación en interpretación de resultados ............107
Figura 53: Porcentaje de aceptación en lineamiento.......................................107
14
ÍNDICE DE TABLAS
Tabla 1: Distribución de Laboratorios y Equipos por Sede................................ 47
Tabla 2: Distribución de servidores por Sede .................................................... 47
Tabla 3: Distribución de Base de datos por Sede ............................................. 48
Tabla 4: Identificación de Problemas................................................................. 50
Tabla 5: Tiempo estimado del proyecto............................................................. 50
Tabla 6: Presupuesto del Proyecto .................................................................... 51
Tabla 7: Característica y funciones a ser cubiertas por el datamart ................. 53
Tabla 8: Escenarios de uso empresarial............................................................ 56
Tabla 9: Requerimientos de consulta................................................................. 63
Tabla 10: Diseño de la dimensión DIM_OBSERVACION ................................. 75
Tabla 11: Diseño de la dimensión DIM_TIEMPO .............................................. 75
Tabla 12: Diseño de la dimensión DIM_ITEM ................................................... 75
Tabla 13: Diseño de la dimensión DIM_INSTRUCTOR .................................... 75
Tabla 14: Diseño físico de la dimensión DIM_EVALUABLE ............................. 76
Tabla 15: Diseño de la dimensión DIM_CURSO ............................................... 76
Tabla 16: Diseño de la dimensión DIM_TIEMPO .............................................. 76
Tabla 17: Diseño de la tabla de hechos FACT_ACADEMICO .......................... 76
Tabla 18: Diseño de la tabla de hechos FACT_EVALUACION......................... 77
Tabla 19: Diseño de la tabla de hechos FACT_ENCUESTA ............................ 78
Tabla 20: Diseño físico de la tabla de hechos FACT_RENDIMIENTO ............. 79
Tabla 21: Niveles de Seguridad ......................................................................... 84
Tabla 22: Coordinaciones no atendidas ..........................................................110
15
RESUMEN
El presente trabajo muestra el proceso seguido para el desarrollo de un
Datamart
cuyo objetivo será facilitar la toma de decisiones del Área de
Capacitación y Consultoría del Centro de Educación Continua “CEC” mediante
la generación de reportes que permitirán contestar preguntas relacionadas con
los principales indicadores de rendimiento.
La tesis realizada pone de manifiesto la gran utilidad que tienen las
metodologías para la construcción de Data Warehouse propuestas por Gill
Harjinder - Rao Prakash y
la metodología “SAS Rapid Warehousing
Methodology” propuesta por propuesta por el SAS Institute, ya que
constatamos que ofrecen mucha flexibilidad y ayuda a realizar este tipo de
proyectos de una manera eficiente y eficaz.
Para la implementación del datamart se seleccionó las herramientas proveídas
por Microsoft, en este caso: SQL Server 2005 como motor de base de datos,
Integration Services para la creación de soluciones empresariales de
transformación e integración de datos, Analysis Services para la construcción
de cubos multidimensionales y Reporting Services para la elaboración de
reportes de acceso y uso del usuario final, ya que las mismas se adaptaron
fácilmente a las necesidades de la organización, la cual posee las licencias de
las mismas.
16
INTRODUCCION
El presente documento da a conocer el proceso llevado a cabo para realizar la
implementación del datamart para la Coordinación de Capacitación y
Consultoría (CCC) del Centro de Educación Continua CEC.
Antes de la implementación del datamart, la Coordinación no contaba con una
estrategia de extracción, carga y transformación de datos automática, la
consolidación de la información se realizaba de manera manual en hojas de
cálculo, manteniendo una periodicidad irregular. La realización de los gráficos,
reportes e informes gerenciales eran muy difíciles de elaborar debido a la
consolidación de dicha información, por lo que fue necesario identificar los
problemas encontrados y el impacto que tenía cada uno de estos dentro de la
Coordinación.
A esto fue necesario definir una metodología que permita el desarrollo rápido
de proyectos de data warehouse y datamarts, analizando dos metodologías; la
primera de ellas, propuesta por Gill Harjinder y Rao Prakash enfocada en la
gestión del proyecto, mientras que la segunda metodología SAS Rapid
Warehousing Methodology
propuesta por el SAS Institute enfocada al
desarrollo de procesos iterativos e incrementales.
Para la definición de la metodología propuesta en este trabajo, se tomó las
mejores prácticas de cada una de las metodologías, sin perder el enfoque de
desarrollo rápido e independiente de la herramienta de implementación,
obteniendo como resultado una metodología de desarrollo con seis fases las
cuales son: planificación, requerimientos, análisis, diseño, implementación y
pruebas.
En la fase de planificación de la metodología propuesta, se revisó la situación
actual del CEC y de la CCC, el plan y presupuesto del proyecto, se analizó su
proceso productivo
y se pudieron identificar los principales indicadores de
medición de la Coordinación los
cuales son: el índice de satisfacción del
17
cliente, el número de cursos dictados, el número de participantes, el número
de horas de capacitación y el total de ingresos económicos generados.
Posteriormente, se identificó la audiencia de destino, es decir las personas o
áreas que se beneficiarán de la implementación de datamart y son los
siguientes: el Subcoordinador General, el Subcoordinador de cursos Abiertos,
el Subcoordinador de cursos Cerrados y el Subcoordinador de cursos In
Company. Se definió como estrategia de implementación del datamart el
enfoque bottom up, ya que se requiere satisfacer las necesidades de
información de una área en particular, la que en este caso es la Coordinación
de Capacitación y Consultoría. El método de desarrollo elegido es el método
en Espiral, puesto que pone énfasis en la velocidad de culminación del
proyecto.
En la fase de requerimientos se tomaron en cuenta cuatro tipos de enfoques:
requerimientos del propietario del datamart, en donde se definen los temas de
interés para la Coordinación; requerimientos del arquitecto en el cual se diseña
los componentes del datamart para satisfacer los requerimientos actuales y
posteriores; requerimientos del desarrollador donde se selecciona las
plataformas y herramientas según la infraestructura tecnológica de la
organización a utilizar y finalmente los requerimientos del usuario final, en el
cual se define la funcionalidad que ofrece el datamart, las consultas
empresariales de interés, los requerimientos de reporte y consulta.
En la fase de análisis se identificaron cuatro procesos de medición identificados
de acuerdo al ciclo por el cual pasa un curso o evento de capacitación, los
cuales son los siguientes:
-
Proceso de medición académica
-
Proceso de medición de evaluación a cursos
-
Proceso de medición de encuestas realizadas en cursos
-
Proceso de medición de rendimiento de cursos
Para el modelado de datos del datamart se utilizó el esquema de
almacenamiento en estrella, dividido en cuatro tablas de hecho, cada una
18
definida para los procesos citados anteriormente. Además, en esta etapa se
diseñaron los modelos lógicos correspondientes a cada uno de los procesos de
medición. Adicionalmente, se definieron estrategias de carga y refrescamiento
que se encargarán de la carga inicial y el mantenimiento del datamart.
Finalmente se definió el nivel de seguridad de acceso a los requerimientos
definidos.
En la fase de diseño del datamart se definieron los modelos físicos y
diccionarios de datos correspondientes a cada uno de los procesos de
medición. Se estableció el diseño detallado de la arquitectura de la aplicación,
en el cual se especifican los siguientes componentes:
-
Componente ETL: se aloja en el servidor del datamart y es el encargado del
proceso de extracción, transformación y carga.
-
Componente datamart: se aloja en el servidor y se encarga de realizar la
exploración y explotación del cubo multidimensional.
-
Componente de acceso y uso: componente que se encarga del manejo de
seguridades y autenticación de usuarios a través de un nombre de usuario
y contraseña asignados.
-
Componente de visualización: componente alojado en el servidor encargado
de la creación y visualización de los reportes generados.
Para la construcción del datamart se tomaron los modelos de datos definidos
durante la fase de diseño, adicionalmente se construyó la estrategia de carga y
refrescamiento del datamart como fue definido durante la fase de análisis. Se
crearon los reportes de acuerdo a los requerimientos de consulta identificados
durante la fase de requerimientos y cada uno de estos clasificados según el
proceso de medición. Y finalmente se creó el administrador del sistema, el cual
permite el acceso a los reportes generados según el perfil de usuario definido
en la fase de análisis y la administración de dichos perfiles.
19
Para verificar la conformidad del datamart construido, se procedió a ejecutar las
pruebas con Coordinador de Capacitación y Consultoría, dichas pruebas se
dividieron en: pruebas de validación de requerimientos, pruebas de extracción,
pruebas de refrescamiento de datos pruebas de seguridad y pruebas de
rendimiento de sistema. Finalmente se ejecutó el plan de capacitación a los
usuarios del sistema, con el objetivo de evaluar el grado de aceptación del
datamart dentro de la organización, para tal efecto se consideraron aspectos
como la facilidad de aprendizaje, la navegabilidad del sistema, la facilidad de
interpretación de los resultados obtenidos en las consultas realizadas y la
eficacia con la cual es proporcionada la información estratégica a los usuarios.
20
CAPITULO 1
SELECCIÓN DE LA METODOLOGÍA DE DESARROLLO
1.1 JUSTIFICACIÓN DE LA METODOLOGÍA DE DESARROLLO
Para la selección de la metodología de desarrollo del datamart se ha tomado
en cuenta la propuesta por Gill Harjinder - Rao Prakash y la propuesta por SAS
Institute “SAS Rapid Warehousing Methodology" ya que éstas metodologías
son aplicables para el desarrollo de proyectos de data warehouse y datamart.
1.1.1
METODOLOGÍA PROPUESTA POR GILL HARJINDER Y RAO
PRAKASH
Gill Harjinder y Rao Prakash consideran siete fases en su ciclo de desarrollo
para data warehouse [8], las cuales son:
-
Planificación
-
Requerimientos
-
Análisis
-
Diseño
-
Construcción
-
Despliegue
-
Expansión
1.1.1.1 Planificación
La fase de planificación incluye los siguientes pasos:
1. Selección de la estrategia de implementación: La estrategia depende de la
manera en la que se realizan las tareas dentro de la organización. Se debe
elegir uno de estos tres enfoques: top down1, bottom up2 y paralelo3[20].
[8]
HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la
mejor toma de decisiones
21
-
Selección de la metodología de desarrollo: se toma en cuenta de que
todos los requerimientos no se pueden identificar completamente y con
toda claridad al inicio del proyecto y debido al énfasis en la velocidad de
desarrollo, el método de desarrollo en espiral4 resulta el más
recomendable para la implementación de un data warehouse.
2. Selección del ámbito de implementación: Para la gran parte de las
organizaciones, el motivo principal para la implementación de un data
warehouse es satisfacer las necesidades más urgentes de un grupo bien
determinado de usuarios, por ello hay que definir un conjunto general de
objetivos para el data warehouse,
con el fin de obtener un ámbito
restringido para la primera implementación. El ámbito inicial del proyecto
puede determinarse a través de dimensiones que se dividen en dos
categorías:
-
A partir de la perspectiva del usuario empresarial del data warehouse.
-
En base a consideraciones tecnológicas.
3. Selección del enfoque arquitectónico: Se pueden elegir entre las siguientes
opciones arquitectónicas:
-
Almacenamiento operacional: en donde las consultas del data
warehouse accederán a los datos de las bases de datos operacionales a
través del modelo del data warehouse.
-
Un data warehouse: en este caso sólo un data warehouse lógico
alimenta a todos los usuarios finales.
1
Top Down: parte de la visión de construir datamarts en base a la estructura del data warehouse, el
mismo satisface un conjunto de requerimientos empresariales bien definidos.
2
Bottom up: los datamarts se construyen primero en base a datos aislados necesarios para satisfacer
las funciones o requerimientos de un departamento por medio de los procesos de extracción,
transformación y transportación.
3
Paralelo: toma propiedades de los enfoques top down y bottom up, ya que su proceso de diseño
permite construir paralelamente los datamarts y data warehouse, tomando en cuenta que el modelo de
datos del data warehouse es utilizado por los datamarts en se construcción.
[20]
Generalidades y patrones de desarrollo de datamarts.
4 Método de desarrollo en espiral: en este modelo los productos son creados a través de múltiples
repeticiones dentro del ciclo de vida del proyecto. A cada repetición se le denomina mini-proyectos.
22
-
Un almacén de datos (Datamart): es una base de datos
departamental, especializada en el almacenamiento de los datos de un
área de negocio específica. Se caracteriza por disponer la estructura
óptima de datos para analizar la información al detalle desde todas las
perspectivas que afecten a los procesos de dicho departamento.
-
Un data warehouse y un datamart: esta arquitectura se utiliza cuando
se reconoce la necesidad de implementar un datamart departamental
conjuntamente con un data warehouse corporativo.
-
Separación de plataforma e infraestructura: se refiere a separación en
distintas plataformas los bloques de fuentes de datos, data warehouse,
datamart y las herramientas de usuario final.
-
Arquitectura cliente/servidor de dos capas: en donde una capa
arquitectónica contiene a los clientes y otra capa contiene al servidor.
Con lo cual las herramientas de usuario final se ejecutan en el o los
clientes y las fuentes de datos, el data warehouse y el almacén de
datos residen en los servidores. [21]
-
Arquitectura cliente servidor de tres capas: en esta arquitectura, la
capa cliente consiste en una estación de trabajo, la capa intermedia
consiste en un servidor y la tercera capa se encuentra establecida en
una microcomputadora, la misma que se encarga de las fuentes de
datos y las transformaciones.
4. Desarrollo del plan del proyecto: Esta fase considera cuatro puntos:
-
Plan: al realizar el plan del proyecto se deben identificar los
departamentos que utilizarán el data warehouse y determinar las
medidas para estimar la retribución del mismo.
-
Presupuesto: uno de los puntos más importantes a tener en cuenta en
el momento de decidir implementar un data warehouse es el costo que
conlleva.
[21]
Principalmente los costos asociados a un proyecto data
Fundamentos de Data warehouse.
warehouse son el Costo de Construcción5 y el costo de Mantenimiento
23
y Operación6 una vez construido.
5. Desarrollo de escenarios de uso empresarial: Consiste en incluir al usuario
final en el establecimiento de expectativas de lo que debe hacer el data
warehouse. Un escenario de uso empresarial consta de lo siguiente:
-
Un usuario empresarial claramente identificado y definido, como por
ejemplo: un gerente de ventas.
-
Un área funcional que respalde al data warehouse o al datamart.
-
Una o varias consultas de interés para el área funcional que actualmente
no sean resueltas por los sistemas operacionales existentes.
6. Recopilación de metadatos: Consiste en la definición de los datos que se
deben recolectar y almacenar, es el primer paso para garantizar la
integración y transformación de los datos operacionales y de otras fuentes
en la información analítica. Los metadatos son la guía de todo lo que se
encuentra dentro del data warehouse y de cómo llegó ahí. Los metadatos
correlacionan la información de la fuente al objetivo. [22]
1.1.1.2 Requerimientos
La fase de requerimientos es una especificación precisa de las funciones que
se obtendrán del data warehouse y del ambiente operativo en el que se
desenvolverá. Se identifican cuatro tipos de requerimientos:
1. Requerimientos del propietario: El propietario es el inversionista,
patrocinador o dueño del data warehouse, su interés se limita al análisis de
inversiones y pagos, por ello debe tomar en cuenta lo siguiente:
o Áreas tema. 7
o Granularidad. 8
5
Costo de Construcción: Es similar al costo de construcción de cualquier sistema de tecnología y
considera el tiempo, recursos humanos y tecnología.
6
Costo de Mantenimiento y Operación: una vez que se ha finalizado la construcción y se ha entregado
el producto es necesario dar soporte, que a su vez es una fuente continua de costos. Entre los costos de
operación se consideran: el costo de evolución, costo de crecimiento y costo producido por cambios.
[22]
Guía de productos para crear una solución Data warehouse completa.
7
Areas Tema: consiste en temas de interés para diversas funciones empresariales.
o Dimensiones. 9
24
2. Requerimientos del arquitecto: El arquitecto es el responsable de diseñar
los componentes de la arquitectura del data warehouse de manera que
satisfaga las necesidades a corto y a largo plazo dentro de la organización.
El diseño de los componentes se determina en base a la compilación de un
grupo de requerimientos que coincidan con la visión del propietario.
3. Requerimientos del desarrollador: Los requerimientos del desarrollador
están muy cercanos a la arquitectura de implementación. El desarrollador
necesita que la arquitectura del data warehouse se subdividan en interfaces
de usuario, bases de datos, comunicaciones y aplicaciones bien
establecidas. Por lo tanto los requerimientos del desarrollador son mucho
más específicos que los del arquitecto.
4. Requerimientos de los usuarios finales: El usuario final accede al data
warehouse a través de aplicaciones de alto nivel y a través de herramientas
de consulta y reporte, lo demás queda oculto. Los requerimientos del
usuario final pueden distribuirse en una o varias de las siguientes
categorías:
o Flujo de Trabajo.
o Requerimientos de consulta.
o Requerimientos de reporte.
o Tipos de actividades.
o Visualización de datos.
1.1.1.3 Análisis
Esta fase consiste en transformar el conjunto de requerimientos obtenidos en la
fase de requerimientos en especificaciones que brinden soporte al diseño del
data warehouse. Harjinder y Prakash identifican 3 tipos de especificaciones:
8
9
Granularidad: hace referencia al nivel de detalle de la información requerida por los usuarios finales.
Dimensiones: agrupa los datos de acuerdo al rango de valores de la consulta realizada.
25
1. Requerimientos de enfoque empresarial: Delinean las fronteras de
información que debe comprender el data warehouse.
2. Especificaciones de requerimientos de fuentes de datos: Delinean las
fronteras de información disponible en las fuentes de datos.
3. Especificaciones de requerimientos de usuario final y acceso: Definen
como se utilizará la información del data warehouse.
Básicamente el proceso de análisis se enfoca en la obtención de modelos
físicos y lógicos de datos para el data warehouse y el datamart. También se
encarga de especificar los procesos de conexión a las fuentes de datos, al data
warehouse, al datamart y las herramientas de usuario final.
1.1.1.4 Diseño
En esta fase los modelos lógicos se convierten en modelos físicos, los
procesos establecidos en la etapa de análisis se convierten en diseños para
programas que realizarán las tareas requeridas por los procesos[8]. Esta fase
presenta dos actividades de diseño principales:
1. Diseño detallado de la arquitectura de datos: Esta actividad consiste en
establecer los modelos físicos de datos de las bases de datos de
almacenamiento con las que contará el data warehouse, teniendo en cuenta
que dicho modelo debe coincidir con los modelos físicos de las fuentes de
datos.
2. Diseño detallado de la arquitectura de aplicación: Comprende de varios
grupos de procesos tales como:
o Procesos internos a las fuentes de datos.
o Procesos internos al data warehouse.
o Procesos que conectan al data warehouse con el datamart.
o Procesos internos al datamart.
[8]
HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la
mejor toma de decisiones
26
o Procesos que conectan al data warehouse con las herramientas de
usuario final.
o Procesos de administración del data warehouse como sistema.
1.1.1.5 Construcción
Es responsable de implementar físicamente los diseños desarrollados en la
fase previa. La construcción del data warehouse es muy similar a la de
construcción de un sistema de bases de datos relacional a gran escala. Entre
las aplicaciones más comunes que requieren construir son las siguientes:
-
Programas que creen y modifiquen las bases de datos para el data
warehouse.
-
Programas que extraigan datos de fuentes tanto relacionales como no
relacionales.
-
Programas que realicen transformación de datos.
-
Programas que actualicen bases de datos relacionales.
-
Programas que realicen búsquedas en base de datos muy grandes.
La fase de construcción debe enfrentarse a varios retos como la administración
de metadatos y la capacidad de integración de sistemas.
1.1.1.6 Despliegue
Realiza actividades de implementación del data warehouse en el ambiente
operativo, lo cual incluye procesos de instalación, configuración y uso del data
warehouse. Es de mucha importancia si la organización tiene experiencia
previa en el despliegue de sistemas de información empresarial. A más de los
requerimientos normales de despliegue, el sistema data warehouse tiene los
siguientes requerimientos adicionales:
-
Ya que la mayoría de los usuarios del data warehouse no son personal
técnico, es necesario disponer de definiciones de información contenida en
el data warehouse en un lenguaje comprensivo.
-
Existe la necesidad de promover la información entregada por el data
warehouse entre los usuarios finales.
27
El data warehouse requiere de capacidades adicionales como las siguientes:
-
Comercialización de la información.
-
Directorio / Catálogo de la información.
-
Browsers de información.
1.1.1.7 Expansión
El método en espiral es importante para obtener una implementación rápida del
data warehouse mediante el incremento de características y funciones basadas
en experiencias previas de despliegue[8].
Luego de un tiempo de uso del data warehouse se pueden identificar
oportunidades de mejora en áreas como:
-
Consultas empresariales limitadas por el modelo de datos del data
warehouse.
-
Consultas empresariales que deben considerar fuentes externas de datos
que no fueron tomados en el ámbito inicial de implementación.
-
Rendimiento no satisfactorio de uno o varios componentes del data
warehouse.
-
Incrementar el modelo de datos del data warehouse para ampliar el ámbito
inicial de implementación.
1.1.2
METODOLOGÍA PROPUESTA POR SAS INSTITUTE
El SAS Rapid Warehousing Methodology propuesta por el SAS Institute, es un
conjunto de mejores prácticas, cuyo objetivo es el desarrollo rápido de
proyectos de data warehouse, el cual está basado en procesos iterativos e
incrementales, que divide un proyecto potencialmente grande en varios más
pequeños, llamados entregables. Cada entregable incluye documentación
técnica, administración del proyecto y procesos de aseguramiento de calidad,
dentro de cada una de sus etapas. [10]
[8]
HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de la Información para la
mejor toma de decisiones
[10]
Data Warehousing Implementation with the SAS System
28
Además define responsabilidades, recursos asignados y metas claras para
cada fase del proyecto. Ofrece las siguientes ventajas:
-
Despliegue rápido de los entregables a los usuarios del negocio.
-
Retorno rápido de la inversión.
-
Reducción de riesgos.
-
Procesos iterativos.
En la figura 1 se puede observar las fases del ciclo de desarrollo de data
warehouse como un procesos iterativo basado en la metodología del SAS
INSTITUTE.
Figura 1: Proceso Iterativo del SAS Rapid Warehousing Methodology [11]
1.1.2.1 Evaluación
Esta fase consiste en evaluar si la organización está lista para crear un
proyecto de data warehouse. Está compuesto por dos etapas:
1. Definición del proyecto: define las áreas de la organización que podrían
beneficiarse del data warehouse. En esta etapa los miembros principales
trabajan junto con los miembros del área organizativa, para definir las metas
[11]
SAS Rapid Warehousing Methodology”; SAS e-Intelligence; Paper sas43093_0501
29
del data warehouse, proveer los criterios de evaluación, y los recursos del
área organizativa necesitados para el proyecto. En esta etapa se toma en
cuenta los siguientes factores críticos:
-
Elegir el patrocinador del proyecto.
-
Elegir un equipo de alto nivel tanto por parte del negocio, como de la
unidad de TI10 que llevará a cabo el proyecto.
-
Definir los recursos comprometidos al proyecto.
-
Determinar el propietario del proyecto.
-
Determinar los criterios de evaluación del proyecto.
-
Asegurar la unidad entre los miembros del equipo
-
Determinar el primer módulo del proyecto a implementar.
2. Evaluación de la infraestructura IT: en esta etapa se valida la capacidad de
la infraestructura tecnológica de la organización para alojar las demandas y
requerimientos del data warehouse.
El entregable en esta fase es un documento formal en donde se define la
factibilidad del proyecto, y los responsables de la toma de la decisión, para que
el proyecto se lleve a cabo o no.
1.1.2.2 Requerimientos
Esta fase se lleva a cabo cuando se ha tomado la decisión de construir el data
warehouse, y encamina las necesidades de alto nivel al medio ambiente del
data warehouse. Los requerimientos del negocio y técnicos (incluyendo la
infraestructura) son reunidos durante esta fase. Entrevistas, talleres y análisis
de sistemas y documentos existentes pueden ser usados
confirmar los hechos necesarios
para reunir y
[12]
. Esto se logra a través de dos etapas:
1. Reunión de requerimientos: donde se toma las necesidades de información
de las unidades organizativas a través de varios métodos de recolección de
requerimientos, tales como entrevistas, encuestas, etc., a los miembros de
10
TI: Tecnologías de la Información
[12]
The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562
30
dicha unidad. Se examina los componentes del medio ambiente
tecnológico que sirve actualmente a las unidades organizativas a través de
entrevistas con los miembros del departamento de IT.
2. Análisis: se realiza un análisis entre los requerimientos de los usuarios de la
organización y la capacidad de la infraestructura de IT.
El entregable en esta fase es un documento de definición de requerimientos, el
cual contiene: modelo físico y lógico de datos, diagrama de la infraestructura de
la extracción OLTP a través del uso de data warehouse, estrategia de
refrescamiento, plan del proyecto calendarizado.
1.1.2.3 Diseño
Esta fase toma como entrada el documento de definición de requerimientos, se
enfoca en la construcción del proyecto a tiempo. En esta fase se incluye:
-
Diseño lógico y físico para el modelo de datos del data warehouse.
-
Especificación
detallada
del
modelo
del
proceso
para
extracción,
transformación y carga.
-
Creación del modelo de la aplicación o herramientas de explotación.
-
Diseño de aspectos adicionales tales como: modelos de los metadatos y la
seguridad.
El entregable en esta fase es un documento de diseño detallado el cual
contiene: la descripción detallada de las fuentes de datos, descripción de los
modelos de datos del data warehouse, detalle del proceso de extracción,
transformación y carga.
1.1.2.4 Construcción
Durante esta fase se construye el modelo físico de datos en base al modelo
lógico diseñado. Esto se lleva a cabo dentro de tres etapas:
31
1. Administración: donde los datos transaccionales son extraídos y
transformados en los datos que se cargarán al data warehouse. El proceso
de transformación está compuesto por algunos subprocesos: validación,
depuración e integración:
-
Validación: se identifican datos inválidos, perdidos, fuera de rango, y
duplicados.
-
Depuración: corrige los problemas de los datos identificados en el
proceso de validación mediante una remodificación.
-
Integración: extrae de las variables de datos, significados consistentes,
valores y medidas.
2. Organización: en esta etapa los datos son cargados al data warehouse, las
estructuras de datos son indexadas, y las vistas a ellos son creados, los
metadatos son capturados y creados.
3. Explotación: en esta etapa se encarga de construir los mecanismos de
acceso al data warehouse (GUIs11) para el análisis, reportes y gráficas.
El entregable en esta fase es un cubo dimensional y los mecanismos de
acceso a él disponible para su uso por parte de los usuarios finales y la unidad
IT.
1.1.2.5 Pruebas Finales
Durante esta fase un equipo de aseguramiento de calidad, prueba el sistema
antes de ser entregado al cliente verificando que el sistema incluya todos los
requerimientos funcionales basados en casos de prueba.
1.1.2.6 Despliegue
Tiene que ver con la instalación, puesta en marcha, entrenamiento de los
usuarios, uso del data warehouse.[12] Algunas de las actividades de esta etapa
son:
11
GUI: Grafic User Interface (Interfaz gráfica de usuario)
[12]
The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562
32
-
Instalación inicial incluyendo las conexiones del data warehouse con las
fuentes de datos, actualización y sincronización de los datos.
-
Entrenamiento a los usuarios.
-
Planificación e implementación de la actualización y mantenimiento del data
warehouse cuando sea necesario.
1.1.2.7 Revisión
Durante esa fase se realiza una evaluación del data warehouse planteando
preguntas que permitan mejorar o potenciar la utilización que se haga del
nuevo sistema. En esta fase son conducidas tres ejecuciones con cada
construcción:
-
Seguir la fase de construcción para evaluar el proceso de implementación y
aprendizaje de satisfacciones y contratiempos.
-
Otra vez, de 3 a 6 semanas después del revisar la fase de despliegue y
asegurar que la transición a soportar ha ido sin problemas y que los
usuarios tienen acceso al data warehouse.
-
Una vez más, de 18 a 24 meses después de la construcción inicial, medir
algún beneficio tangible, calcular el ROI12 y asegurar que el medio ambiente
del data warehouse está continuando para conocer los requerimientos de la
comunidad organizativa.
12
ROI: por sus siglas in inglés significa el Retorno de la Inversión, es el beneficio que obtenemos por el
dinero invertido en tecnología durante un periodo de tiempo y suele utilizarse para analizar la viabilidad de
un proyecto y medir su éxito.
33
1.1.3
SELECCIÓN DE LA METODOLOGÍA DE IMPLEMENTACIÓN
Objetivo: el objetivo principal de la metodología a proponer es mantener el
desarrollo rápido de proyectos de data warehouse o datamarts basados en
procesos
iterativos,
cada
uno
de
estos
alineados
a
los
objetivos
organizacionales, tomando mejores prácticas y recomendaciones de las
metodologías descritas.
1.1.3.1 Planificación
En esta etapa se pretende determinar el objetivo principal que tendrá el data
warehouse o datamart y la perspectiva que tiene la organización para
implementarlo.
Para la formulación de esta etapa se ha considerado definir las actividades
principales de la organización y su situación actual, su infraestructura
tecnológica, el desarrollo del cronograma y presupuesto necesarios para su
implementación como lo propone Harjinder y Prakash en la fase de
Planificación de su metodología.
Adicionalmente es conveniente identificar los principales problemas percibidos
que pueden dar su razón de ser al proyecto.
De la fase de planificación propuesta por Harjinder y Prakash se han elegido
aquellos puntos que enfocan el ámbito de aplicación del proyecto durante todo
su ciclo de vida, dichos puntos son los siguientes:
-
Desarrollo del cronograma y presupuesto del proyecto.
-
Definición de los objetivos de uso empresarial.
-
Selección de la estrategia de implementación, el método de desarrollo, el
ámbito de implementación, el enfoque arquitectónico e identificación de
riesgos y problemas.
34
De la fase evaluación propuesta por el SAS INSTITUTE en su metodología
se ha seleccionado el siguiente criterio:
-
Recopilación de metadatos: mediante este criterio se definirá un primer
enfoque del diseño lógico para el datamart. Además se establece como
entregable en esta primera fase un documento formal en donde se define la
factibilidad del proyecto y la planeación.
Finalmente se establece como entregable un documento formal que incluye,
situación actual de la organización, problemas percibidos, cronograma y
presupuesto del proyecto. En la figura 2, se puede observar la definición de la
fase de Planificación.
Figura 2: Definición de la Fase de Planificación
1.1.3.2 Requerimientos
Para la fase de requerimientos se ha tomado los ítems establecidos por
Harjinder y Prakash en la fase de requerimientos, en la cual se toman en
cuenta los requerimientos desde los puntos de vista: del propietario, arquitecto,
desarrollador, y el usuario final. Finalmente se establece como entregable un
documento formal de definición de requerimientos, el cual contiene el alcance
del proyecto. En la figura 3, podemos observar la definición de la fase de
Requerimientos:
35
Figura 3: Definición de la Fase de Requerimientos
1.1.3.3 Análisis
Esta etapa consiste en convertir el conjunto de requerimientos obtenidos en la
fase anterior en descripciones para generar medidas, dimensiones y hechos
que brinden soporte al modelo lógico del datamart, así como también definir la
estrategia de carga y refrescamiento de datos desde las fuentes de datos
hacia el data warehouse o datamart propuesta por el SAS INSTITUTE. [12]
Adicionalmente, es necesario definir los niveles de seguridad que se debe tener
sobre los diferentes componentes y niveles de la solución, debido a lo sensible
que puede ser para la organización la información que suelen manejar este tipo
de aplicaciones.
[5]
El entregable de la fase de análisis contiene, la definición de dimensiones,
tablas de hecho, modelos lógicos y la descripción del proceso de carga y
refrescamiento del data warehouse o datamart. En la figura 4 se puede
observar la definición de la fase de Análisis.
Figura 4: Definición de la Fase de Análisis
[12]
[5]
The SAS Methodology for Solutions Development”; SAS Institute Inc; Paper wp_3562
KIMBALL Ralph; ROSS, Margy; “The Datawarehouse Toolkit, Segunda Edición
36
1.1.3.4 Diseño
En esta etapa se debe detallar la definir la arquitectura de los datos y la
arquitectura de la aplicación
[4]
, según lo definido durante la fase de Análisis.
Finalmente se establece como entregable un documento de análisis y diseño el
cual contiene la descripción detallada de: las fuentes de datos, los modelos de
datos del datamart, la arquitectura de la aplicación, y la estrategia del proceso
de carga y refrescamiento. En la figura 5, se puede observar la definición de la
fase de Diseño.
Figura 5: Definición de la Fase de Análisis y Diseño
1.1.3.5 Implementación
En esta fase se realiza la implementación física los diseños detallados en la
fase anterior. De la fase de construcción propuesta por el SAS INSTITUTE en
su metodología se seleccionaron los siguientes puntos:
-
Administración: donde los datos transacciones son cargados desde las
fuentes de datos hacia el data warehouse o datamart a través de procesos
de validación, depuración e integración de datos en base a la estrategia de
carga de datos. [11]
-
Organización: en donde se implementa la carga inicial del datamart y se
implementa la estrategia de refrescamiento de los datos validados.
-
Explotación: donde se realiza la implementación de GUIs de acceso al data
warehouse o datamart.
[4]
JARKE Matthias, LENZERINI Maurizio, VASSILIOU Yannis, VASSILIADIS Panos. Fundamentals of
Data warehouses.
[11]
SAS Rapid Warehousing Methodology”; SAS e-Intelligence; Paper sas43093_0501
37
Finalmente se establece como entregable en esta fase, la implementación
del datamart disponible para su uso por parte de los usuarios finales y la unidad
IT, como un primer encuentro entre el usuario y el datamart. En la figura 6, se
puede observar la definición de la fase de Implementación.
Figura 6: Definición de la Fase de Implementación
1.1.3.6 Pruebas
La fase de Pruebas es la encargada de cerrar el ciclo iterativo de la
metodología propuesta, con el fin de evaluar la solución planteada a lo largo de
la metodología y mejorar la utilización del data warehouse o datamart. Está
fase se la ha dividido en tres etapas, las cuales son:
1. Pruebas Funcionales del sistema [22]
En esta etapa se realizan las pruebas necesarias que aseguran el grado de
calidad en la implementación del data warehouse o el datamart. Se pueden
considerar las siguientes pruebas funcionales:
-
Pruebas de validación de requerimientos.
-
Pruebas de transformación, proceso y carga.
-
Pruebas de refrescamiento de datos.
-
Pruebas de seguridad
-
Pruebas de rendimiento del sistema.
2. Despliegue
En esta fase se llevan a cabo los procesos para la puesta en marcha y el
uso del datamart en el ambiente operacional. De la fase de despliegue
[22]
Guía de Productos para Crear una Solución Data warehouse Completa
38
propuesta por el SAS INSTITUTE en su metodología, se ha seleccionado
los siguientes puntos:
o Instalación inicial.
o Capacitación a los usuarios.
o Plan de mantenimiento del data warehouse o datamart.
3. Revisión y Expansión
El objetivo en esta fase es la de potenciar el uso del datamart dentro de la
organización. De la fase de expansión de la metodología propuesta por
Harjinder y Prakash se toman en cuenta los siguientes aspectos:
-
Consultas empresariales limitadas por el modelo de datos del data
warehouse.
-
Consultas empresariales que deben considerar fuentes externas de
datos que no fueron tomados en el ámbito inicial de implementación.
Además se debe tener en cuenta los procesos de potenciación y
mejoramiento que se haga al nuevo sistema.
El entregable en esta fase es un documento que contendrá tres secciones: las
pruebas realizadas, resultados sobre la capacitación realizada y plan de
mantenimiento y posibles mejoras a realizar sobre el producto final. En la figura
7 se puede observar la definición de la fase de Pruebas.
39
Figura 7: Definición de la Fase de Implementación
1.2 SELECCIÓN DE HERRAMIENTAS DE IMPLEMENTACIÓN
La selección de las herramientas para la construcción de un data warehouse es
un proceso que debe realizarse tomando en cuenta la infraestructura
tecnológica de la organización y las necesidades de información requeridas por
parte de los usuarios.
1.2.1
HERRAMIENTAS BUSINESS INTELLIGENCE
La solución a desarrollarse se fundamenta en los requerimientos establecidos
por el arquitecto del sistema, por ello se ha definido las siguientes
herramientas:
1.2.1.1 Microsoft SQL Server Business Intelligence MSSBI
Es una plataforma completa de Business Intelligence desarrollada por
Microsoft[18] que proporciona las características, herramientas, funcionalidades
y componentes de servidor para crear:
-
Grandes y complejos data warehouse que resulten fáciles de consultar y
económicos de mantener.
[18]
An introduction to SQL Server data warehousing concepts.
40
-
Pequeña presentación de informes y sistemas de análisis que las
empresas más pequeñas, o los departamentos de las empresas de mayor
tamaño, pueden fácilmente construir y gestionar.
-
Circuito cerrado de análisis y de minería de datos de sistemas.
-
Sistemas integrados que ampliar el alcance de la inteligencia de negocios.
Los componentes que presenta este sistema de Business Intelligence reúne
algunos elementos de Microsoft SQL Server 2000 y SQL Server 2005 y estos
son:
-
Diseño: Microsoft Business Intelligence Development Studio, es el primer
entorno de desarrollo integrado diseñado para el desarrollador de sistemas
business intelligence. Construido sobre Visual Studio ® 2005, el entorno
ofrece una plataforma de desarrollo profesional, variada e integrada. [24]
-
Integración: Microsoft Integration Services ha sido rescrita para llevar a
cabo la integración de datos complejos, transformación, y la síntesis a gran
velocidad en caso de grandes volúmenes de datos. Integration Services,
Analysis Services, y Reporting Services trabajan juntos para presentar una
vista perfecta de los datos pertenecientes a fuentes heterogéneas. [15]
-
Almacenamiento: Microsoft SQL Server 2005 diluye las líneas entre las
bases de datos relacionales y multidimensionales. Se puede almacenar
datos en la base de datos relacional, en la base de datos multidimensional,
o utilizar la nueva característica Proactive Cache para obtener lo mejor de
ambos mundos. [14]
-
Análisis: La minería de datos en SQL Server siempre ha sido fácil de usar.
Ahora es aún mejor con la incorporación de nuevos algoritmos importantes,
incluidas las Reglas de la asociación, de series de tiempo, árboles de
regresión, de secuencia de conglomerados, Neural Nets, y Naïve Bayes. [16]
[24]
[15]
[16]
Business Intelligence and Data Warehousing in SQL Server 2005
MICROSOFT: SQL Server Integration Services
MICROSOFT: SQL Server Analysis Services
41
-
Reporte: Microsoft Reporting Services extiende la plataforma Microsoft
Business Intelligence para llegar al usuario de negocios que necesita
consumir el análisis. Reporting Services es un ambiente empresarial para la
administración de reportes, integrado y gestionado a través de servicios
Web. [23][17]
-
Administración: Microsoft SQL Server Management Studio integra la
administración de todos los componentes Microsoft SQL Server 2005. A
través de Management Studio, los componentes de la plataforma Business
Intelligence ganan
mayor escalabilidad, confiabilidad, disponibilidad y
facilidad de programación. [14]
[23]
[17]
[14]
Características de Reporting Services
MICROSOFT: SQL Server Reporting Services
MICROSOFT: Documentación de SQL Server 2005
42
CAPITULO 2
IMPLEMENTACION DEL DATAMART
2.1 PLANIFICACION
2.1.1
Objetivo del Datamart
El objetivo principal del datamart es, “Facilitar la toma de decisiones a la
Coordinación de Capacitación y Consultoría del Centro de Estudios a la
Comunidad CEC, mediante el uso de herramientas que faciliten el análisis de
información generado por los indicadores definidos, cuya actualización esté
basada en una estrategia de refrescamiento de información según periodos
representativos”.
2.1.2
Situación actual de la Coordinación de Capacitación y Consultoría (CCC)
2.1.2.1 Generalidades:
La Coordinación de Capacitación y Consultoría (CCC), conjuntamente con la
Coordinación de Lingüística del CEC son los encargados de ser el nexo directo
con el medio externo, tales como personas naturales y empresas que requieran
servicios de capacitación continua en las áreas: Tecnológicas, Administrativas
e Idiomas. Estas áreas son apoyadas operativamente por las coordinaciones
de Calidad y Talento Humano, Financiero - Administrativo, Desarrollo
Tecnológico y coordinadas a través de la Dirección de la institución, tal como
se puede observar en el mapa de procesos del CEC de la figura 8.
43
Figura 8: Mapa de Procesos del CEC[1]
2.1.2.2 Detalle del Proceso Productivo de la CCC
El objetivo principal de la CCC es alcanzar al menos el 88% de satisfacción del
cliente en los eventos de capacitación y al menos el 90% del plan operativo. En
la figura 9, se puede observar el proceso productivo de la CCC.
Objetivo:
Alcanzar al menos el 88% de satisfacción del cliente en los eventos de capacitación
Proveedores
1 Sociedad
Entradas
1.Clientes y sus
requerimientos
2 Clientes individuales 2. Resultados de las
encuestas
y corporativos
3. Reglamento CEC
3 EPN
ETAPAS DEL PROCESO
1. Planificación
2. Ejecución
4 Dirección CEC
5 Sistemas y medios
de información
6 Instructores
4. Plan Estratégico y
Objetivos de Calidad
5. Nuevas tendencias
Salidas
1 Clientes capacitados
Clientes
1. Clientes individuales y
corporativos
2 Evaluaciones académicas 2. Clientes individuales y
corporativos
y certificados
3 Evaluaciones del evento 3. Sub coordinación, apoyo
técnico, Instructor.
4. Clientes corporativos
4 Informe final
3. Evaluación
6. Sugerencias de
cursos (DCC-RP-02)
Responsable del proceso:
Parámetros/Medición/seguimiento
Documentos
1. Número de cursos
Procedimiento DCC-PP-01
2. Ingresos Económicos
Instructivos de trabajo
Involucrados:
3. Número de participantes
Registros
Subcoordinadores y asistentes
4. Número de horas de capacitación
Coordinador
5. Ïndice de satisfacción de clientes
Recursos
Procesos/Actividades de soporte
Requisitos a cumplir
Humanos: Coordinadora, 2 Sub coordinadora
Proceso Administrativo Financiero
Reglamentos internos
3 Asistentes, Diseñador gráfico
Gestión de la Calidad y Talento Humano
Contratos/Convenios
Tecnicos : Laboratorios informáticos
Dirección CEC
ISO 9001:2000
en red y con salida a internet,
Unidad Técnica
cañones de proyección, proyectores
de transparencias, pizarras, manuales
Figura 9: Proceso Productivo de la CCC[1]
[1]
[1]
Centro de Educación Continua - CEC. Procedimiento Proceso Productivo “Capacitación y Consultoría”
Centro de Educación Continua - CEC. Procedimiento Proceso Productivo “Capacitación y Consultoría”
44
En resumen, los proveedores del proceso está compuesta por:
-
La sociedad, a través de los clientes y sus demandas;
-
Los clientes, y el resultado de las encuestas generadas en cada evento de
capacitación generado.
-
EPN, a través del reglamento interno del CEC-EPN.
-
Medios de difusión y publicaciones.
-
Instructores capacitados que están alineados a los objetivos de la
institución.
El proceso está siendo medido través de los siguientes parámetros, que son
generados en las diversas etapas por las que pasa el proceso:
-
Número de cursos
-
Ingresos Económicos generados
-
Numero de Participantes
-
Número de horas de capacitación
-
Índice de Satisfacción de clientes
Como resultado del proceso se tiene Clientes Capacitados y las diferentes
evaluaciones generadas en base a los estándares de calidad definidos por la
certificación con la que actualmente cuenta el CEC.
2.1.2.3 Modelo orgánico funcional de la CCC
En la figura 10, podemos observar el Organigrama de la CCC.
45
Coordinador
Subcoordinador General
Ejecutivo de
Cuenta
Subcoordinador
Cursos Abiertos
Subcoordinador
Cursos Virtuales
Asistente
Académico 1
Asistente
Académico 2
Subcoordinador
Cursos Cerrados
Asistente
Académico
Figura 10: Organigrama Funcional de la Coordinación de
Capacitación y Consultoría
-
Funciones del Coordinador: se encarga de planificar las programaciones
anuales y trimestrales de capacitación de cursos abiertos, preparar
propuestas de capacitación de cursos cerrados, aprobar el contenido de los
cursos y programas ofertados, dirigir la ejecución de los eventos de
capacitación y consultoría y evaluar los cursos, programas y demás
servicios ofertados por la Coordinación.
-
Funciones
del Subcoordinador General: se encarga de proporcionar
información de los eventos de capacitación a los clientes, a demás se
encarga de revisar y verificar los requerimientos previos al inicio de los
cursos en general.
-
Funciones del Subcoordinador de Cursos Abiertos, Cerrados y Virtuales: se
encarga de seleccionar los instructores para los eventos de capacitación,
coordinar clases demostrativas con instructores nuevos y administrar
sugerencias y pedidos de los clientes.
-
Funciones del Asistente Académico: se encarga de la apertura y cierre de
cursos, atención telefónica y personal a los clientes, apoyo y seguimiento a
los instructores de Capacitación y Consultoría, inscripción de participantes,
proporcionar información de las alternativas de financiamiento
y
proporcionar información de los cursos a través de medios tales como: mail,
dípticos, cartilla, entre otras.
46
-
Funciones del Ejecutivo de Cuenta: se encarga de comercializar los
productos/servicios que oferta el CEC-EPN en el área de capacitación y
consultoría, recolectar información referente al mercado, competencia,
precios y otros indicadores para el mejoramiento de su gestión, establecer
contacto con los clientes con el fin de detectar sus necesidades para
levantar requerimientos para la elaboración de propuestas, realizar
actividades de cobranza de las ventas realizadas y elaborar el informe
semanal de actividades, incrementar el número de clientes con la apertura
de mercado.
2.1.2.4 Productos de la CCC
La CCC actualmente cuenta con 4 tipos de productos:
-
Cursos Abiertos: son todos aquellos eventos de capacitación13 que se
realiza bajo especificaciones establecidas por el CEC-EPN y bajo demanda
del mercado. Los eventos son ofrecidos al público en general y son
realizados en las instalaciones definidas por el CEC-EPN.
-
Cursos Cerrados: son aquellos eventos de capacitación que el CEC-EPN
realiza bajo demanda del cliente, en cuyo caso los contenidos, horarios y
demás especificaciones se establecen con el mismo. Los cursos cerrados
se los
puede realizar en las instalaciones del CEC-EPN ó en lugares
establecidos por el cliente. En el caso en el que el evento de capacitación
se realice en las instalaciones del cliente empresarial, el curso cerrado se
denomina Curso In Company.
-
Cursos Virtuales: comprenden aquellos eventos de capacitación que son
ofrecidos al público en general en la modalidad virtual de acceso a través
del Internet.
-
Consultoría: el CEC-EPN ofrece servicios de asesoría y consultoría a
organizaciones de distinta índole en las áreas de desarrollo de software y
aplicaciones, gestión de sistemas de calidad, gestión estratégica y
organizacional, gestión de proyectos, entre otros.
13
Evento de capacitación: un evento está compuesto por cursos o seminarios en las áreas de:
Informática aplicada y ciencias de la computación, Tecnologías de la información y comunicaciones,
Diseño y evaluación de proyectos, Gestión empresarial, entre otros.
47
2.1.2.5 Infraestructura Tecnológica
En cuanto a la infraestructura tecnológica usada actualmente por el CEC,
según lo descrito por la Coordinación de Desarrollo Tecnológico, se cuenta con
lo siguiente:
-
Hardware:
o
Existen 47 equipos distribuidos entre el personal administrativo de las
diferentes unidades. Se cuentan con 108 equipos distribuidos en siete
laboratorios tal como lo ilustra la tabla 1:
Ubicación
Laboratorio
Nro. de Equipos
Laboratorio 1
21
Laboratorio 2
21
Laboratorio 3
17
Sede EPN
Laboratorio 4
12
Laboratorio 5
17
Laboratorio 6
10
Laboratorio
Sede Araucaria
10
TOEFL
Tabla 1: Distribución de Laboratorios y Equipos por Sede
-
Servidores:
o CEC cuenta actualmente con 7 servidores distribuidos en sus dos sedes
tal como lo ilustra la tabla 2:
Ubicación
Sede EPN
Sede
Araucaria
-
Laboratorio
Nro. de Equipos
Servidor de base de datos SQL Server
1
Firewall
1
Servidor de Datos
1
Servidor de base de datos SQL Server
1
Servidor de Datos
1
Servidor de Correo y Firewall
1
Servidor de Correo
1
Tabla 2: Distribución de servidores por Sede
Software:
o Licenciamiento: CEC pertenece al Campus Agreement de la Escuela
Politécnica Nacional en cuanto a licenciamiento de productos Microsoft.
De la misma manera cuenta con licencias de otros paquetes como
Autocad, Swish, Flash, etc.
o Sistemas de Información: CEC cuenta con sistemas de información
para: Facturación, Contabilidad, Sistemas Académicos.
48
o Bases de datos: CEC cuenta con base de datos para los sistemas de
información distribuidas tal como lo ilustra la tabla 3.
Ubicación
Base de Datos
Base de Datos Facturación: SISFAC
Sede EPN
Base de Datos Sistema Contable: CADILAC
Base de Datos Sistema Académico: SISCEC
Base de Datos Facturación: SISFAC
Sede Araucaria
Base de Datos Sistema Contable: CADILAC
Base de Datos Sistema Académico: SISCEC
Tabla 3: Distribución de Base de datos por Sede
-
Red:
o Acceso a Internet: El CEC-EPN cuenta con dos enlaces de 512 Mbps
clear channel. La conexión a Internet es de libre acceso para todos los
integrantes de la organización según requerimientos de la coordinación
a la que pertenecen.
-
Seguridades:
o El CEC, cuenta actualmente con un plan de políticas de seguridad para
respaldos de información, e identificación y mitigación de riesgos. La
figura 11, ilustra la infraestructura tecnológica del CEC.
RED DE EQUIPOS
ADMINISTRATIVOS
LABORATORIO 6
LABORATORIO 5
LABORATORIO 4
LABORATORIO 3
LABORATORIO 2
LABORATORIO 1
192.168.56.*
Servidor de BDD
SQL Server 2000
Internet
512 Kbps Clear channel
1:1
Firewall
Linux CentOS 4.5:
192.168.56.1
Firewall
Linux CentOS 5.0:
192.168.57.3
Internet
512 Kbps Clear channel
1:1
Enlace de radio inalámbrico: 2Mbps
Figura 11: Infraestructura tecnológica el CEC
Servidor de Datos
SEDE: ESCUELA POLITECNICA NACIONAL
49
Servidor de BDD
CADILAC
Servidor de Correo
192.168.57.1
192.168.57.*
Servidor de BDD
SISFAC y datos
RED DE EQUIPOS
ADMINISTRATIVOS
LABORATORIO TOEFL
SEDE: EDIF. ARAUCARIA
50
2.1.2.6 Identificación de problemas
En la tabla 4 se detallan los problemas internos identificados de la CCC en
cuanto a la elaboración de reportes gerenciales.
Problema
Actualmente, no se cuenta con una estrategia de refrescamiento,
carga y transformación de información: la consolidación de la
información se la realiza de forma manual recolectada en hojas de
cálculo, de forma no periódica.
Impacto Prioridad
ALTO
ALTO
ALTO
ALTO
MEDIO
BAJO
MEDIO
ALTO
ALTO
ALTO
ALTO
ALTO
No se encuentra disponible la información histórica de encuestas y
evaluaciones realizadas por el estudiante.
ALTO
ALTO
Heterogeneidad en los rangos de valores de las evaluaciones a través
del tiempo.
ALTO
ALTO
Existe redundancia de información de estudiantes, cursos e
instructores.
MEDIO
MEDIO
La base de datos transaccional con diseño no normalizado.
BAJO
MEDIO
No se cuenta con una herramienta formal, que apoye a la toma de
decisiones dentro de la Coordinación.
No existen perfiles de usuario para el acceso a la información
establecidos.
La realización de gráficos, reportes e informes son muy complicados
de elaborar.
No existe información básica del cliente almacenada como el género,
fecha de nacimiento del estudiante para definir rangos de edad y tipo
de cargo debido a la variabilidad de la naturaleza del negocio.
No existe información de encuestas y evaluaciones realizadas por el
estudiante, sino únicamente a nivel de curso con datos totalizados.
Tabla 4: Identificación de Problemas
2.1.3
Desarrollo del cronograma y presupuesto del proyecto
Cronograma: en la tabla 5 se detallan los tiempos estimados en semanas para
el desarrollo del proyecto en sus diferentes fases.
Fase
Planificación
Tiempo Estimado (semanas)
2
Requerimientos
3
Análisis
3
Diseño
2
Implementación
4
Pruebas
5
Duración Total
19
Tabla 5: Tiempo estimado del proyecto
51
Presupuesto: en la tabla 6, se detalla los rubros considerados para la
elaboración del presupuesto del proyecto.
Elemento
Cantidad
Costo Unidad
(USD)
Subtotal
(USD)
HARDAWARE
Servidor para el Datamart
1
1100
1100
Equipos para desarrollo
2
400
800
Total:
1900
SOFTWARE
1 Licencia SQL 2005 con:
Analysis, Integration y
Reporting Service.
1 Licencia Windows 2003
Server
Total:
1
800
0
1
600
600
600
RECURSO HUMANO
Analista
2
500
1000
Programador
1
400
400
Total (mes)
1400
Total(19 semanas)
6650
SUMINISTROS
Resmas de papel bond
5
3,5
17,5
Torre de CD´s (25 unidades)
2
18
36
Tonner para impresora Láser
1
37
37
Total :
90,5
TOTAL:
9240,5
Tabla 6: Presupuesto del Proyecto
2.1.4
Definición de los objetivos de uso empresarial
A continuación se definen los objetivos de la CCC en base a la definición de los
objetivos empresariales:
2.1.4.1 Audiencia de destino:
La solución servirá de apoyo al proceso de toma decisiones que realiza la CCC
a través de:
-
El Subcoordinador General.
-
El Subcoordinador de cursos Abiertos,
-
El Subcoordinador de cursos Cerrados.
-
El Subcoordinador de cursos In Company.
52
Adicionalmente, la solución brindará apoyo al área de Marketing a través de
reportes sobre las encuestas generadas en cada evaluación.
2.1.4.2 Plataforma tecnológica:
La solución se adaptará a la plataforma con la que actualmente cuenta el CEC,
la cual se detalla a continuación:
-
Servidor de las fuentes de datos: MS SQL Server 2000 sobre Windows
2000 Server.
-
Servidor del datamart: MS SQL Server 2005, IIS, sobre Windows 2003
Server.
-
Clientes: navegador de Internet.
2.1.4.3 Características y Funciones
En la tabla 7 se describen las características y funciones que son planteadas
en base a los problemas percibidos dentro de la CCC:
Problemas percibidos
Actualmente, no se cuenta con una
estrategia de refrescamiento, carga
y transformación de información: la
consolidación de la información se la
realiza de forma manual recolectada
en hojas de cálculo, de forma no
periódica.
No se cuenta con una herramienta
formal, que apoye a la toma de
decisiones
dentro
de
la
Coordinación.
No existen perfiles de acceso a la
información definidos.
La realización de gráficos, reportes e
informes son muy complicados de
elaborar.
No existe información básica del
cliente almacenada como el género,
fecha de nacimiento del estudiante
para definir rangos de edad y tipo de
cargo debido a la variabilidad de la
naturaleza del negocio.
Características y funciones
Automatización de los procesos de extracción,
carga y transformación de información.
Definición de una estrategia de refrescamiento de
información.
Acoplamiento con las plataformas tanto de software
como de hardware disponibles en la organización.
Consolidación de la Información histórica en un
servidor central.
Disponibilidad de la información las 24 horas del
día.
Procesamiento rápido, preciso y confiable de datos.
Definición de perfiles de usuario.
Acceso eficiente y oportuno a la información de
acuerdo a los perfiles de usuario establecidos.
Variedad de criterios de navegación o filtrado de
información para solución de consultas y reportes.
Entrega a los usuarios de herramientas que
permitan la fácil generación de reportes.
Agregar los campos de género, fecha de
nacimiento y tipo de cargo en la tabla CLIENTE.
Propuesta para la redefinición de datos del
estudiante.
Generación de un proceso de identificación de
género a partir del nombre del cliente.
53
No existe información de encuestas
y evaluaciones realizadas por el
estudiante, sino únicamente a nivel
de curso con datos totalizados.
No se encuentra disponible la
información histórica de encuestas y
evaluaciones
realizadas por el
estudiante.
Generar una estructura a nivel de base de datos
que permita el almacenamiento de las evaluaciones
y encuestas realizadas por el estudiante.
Se tendrá como carga inicial de información los
datos tabulados a nivel de curso de la tabla
evaluación.
Para el refrescamiento de datos, se deberá tomar
en cuenta la información almacenada en la
estructura definida para el registro de las
evaluaciones y encuestas por cada estudiante.
Homogeneización de los rangos de calificaciones
de evaluación, en base a entrevistas al Coordinador
del la CCC.
Carga de información a una base de datos
intermedia para facilitar la carga al datamart.
Heterogeneidad en los rangos de
valores de las evaluaciones a través
del tiempo.
La base de datos transaccional con
diseño
no
normalizado
y
redundancia de información.
Tabla 7: Característica y funciones a ser cubiertas por el datamart
2.1.4.4 Selección de la estrategia de implementación
Para la implementación del datamart se seleccionará el enfoque bottom up, ya
que se requiere satisfacer los requerimientos de una área particular del CEC
que en este caso será la CCC, debido a que no cuenta con un datamart
construido actualmente.
2.1.4.5 Selección del método de desarrollo
El método de desarrollo en Espiral es el más recomendable para la
implementación de un data warehouse, considerando el énfasis en la velocidad
culminación del proyecto.
2.1.4.6 Selección del ámbito inicial de implementación
La implementación del datamart se realizará tomando en cuenta la información
detallada en los siguientes puntos.
2.1.4.7 Origen de las fuentes de datos
La sede EPN cuenta con un servidor de base de datos en el cual se almacena
la información académica de la CCC y un repositorio donde se almacenan
hojas de cálculo los cuales contienen las metas de los indicadores principales.
2.1.4.8 Modelo Empresarial
La solución a implementar proveerá respuestas a preguntas relacionadas a las
perspectivas de la CCC de acuerdo a las siguientes perspectivas:
54
-
Cliente: es la persona o grupo de personas individuales o corporativas que
acceden a los diferentes productos ofertados por la CCC.
-
Curso: son todos los eventos de capacitación generados, los cuales son
sometidos a evaluaciones y encuestas.
-
Tipo de Curso: se puede clasificar a los cursos o eventos de capacitación
como: abiertos, cerrados, in-company y virtuales.
-
Programa: se refiere a la programación a la cual pertenece el curso
-
Instructor: es el principal proveedor de la CCC, rigurosamente seleccionado
de tal forma que permita el cumplimiento de los objetivos y contenido del
evento de capacitación.
-
Tiempo: Una clasificación según el tiempo permitirá obtener información
sobre los cursos o eventos de capacitación realizados.
-
Ítems de Evaluación: son todos los puntos de revisión de la evaluación
realizada por el alumno con el fin de medir su nivel satisfacción.
-
Ítems de Encuesta: son todos los puntos de revisión de encuestas
realizadas al alumno.
Por lo tanto lo que se pretende monitorear con el datamart implementado son
los proceso de medición de académica, evaluación, encuestas y rendimiento de
los cursos generados relacionados con los principales índices de medición del
CEC los cuales son:
-
Número de estudiantes
-
Número de cursos
-
Total de ingresos económicos
-
Numero de horas dictadas
-
Nivel de satisfacción del cliente
2.1.5
Selección del enfoque arquitectónico
La solución propuesta, utilizará la arquitectura para datamarts ya que cubrirá
las necesidades específicas de la CCC. Adicionalmente la solución se
implementará bajo una arquitectura cliente/servidor de dos capas en la cual las
55
herramientas de usuario final se ejecutarán en el cliente y, las fuentes de
datos y datamart se alojarán en un servidor como se puede observar en la
figura 12.
Figura 12: Arquitectura Cliente / Servidor de dos capas
2.1.6
Desarrollo de escenarios de uso empresarial
La solución deberá resolver las necesidades especificadas en la tabla 8.
Descripción
Fuente
Medir la satisfacción del cliente con el servicio del CEC.
Proceso de planificación
estratégica del CEC.
Medir el porcentaje de estudiantes por género
CCC-RQ-04 Evaluación
final
Medir el porcentaje de estudiantes que recomiendan el producto.
CCC-RQ-04 Evaluación
final
Medir el porcentaje de estudiantes por tipo de institución.
CCC-RQ-04 Evaluación
final
Medir el porcentaje de estudiantes de acuerdo al medio de difusión
por el cual se enteraron de los productos.
CCC-RQ-04 Evaluación
final
Medir el porcentaje de estudiantes por rango de edad.
CCC-RQ-04 Evaluación
final
Medir el porcentaje de estudiantes por nivel o cargo profesional.
CCC-RQ-04 Evaluación
final
Medir el porcentaje de estudiantes por grupo de clientes
(empresarial, individual).
Proceso de planificación
estratégica del CEC.
Medir el total de ingresos que general cada grupo de cliente.
Proceso de planificación
estratégica del CEC.
Medir la cantidad de clientes del CEC por periodo académico.
Proceso de planificación
estratégica del CEC.
Indicar cual ha sido el curso de mayor demanda.
Entrevista.
Indicar el curso con mayor número de alumnos matriculados.
Entrevista.
Medir el número de alumnos que aprobaron los cursos ofertados.
Procedimiento CCC V6.
56
Cantidad de estudiantes matriculados por curso.
Medir la cantidad de cursos y consultorías realizadas por el CEC.
Medir el crecimiento de los ingresos.
Procedimiento CCC V6.
Proceso de planificación
estratégica del CEC.
Proceso de planificación
estratégica del CEC.
Identificar cual ha sido el instructor que más ha dictado cursos.
Entrevista.
Identificar cual ha sido el instructor que ha obtenido la mejor
evaluación.
Entrevista.
Tabla 8: Escenarios de uso empresarial
2.1.7
Recopilación de datos y metadatos
Recopilación de datos: Actualmente la CCC cuenta con un modelo entidad relación y una hoja de cálculo con las metas mensuales de los indicadores de
rendimiento.
Recopilación de metadatos: El diccionario de datos correspondiente a la base
de datos académica y las metas mensuales de los indicadores de rendimiento..
2.2 REQUERIMIENTOS
2.2.1
Requerimientos del propietario
Mantener la información actualizada de forma transparente ya que la
consolidación de información con la que actualmente cuenta la CCC se la
realiza de forma manual y con más de un mes de retraso.
Resolver preguntas referentes al desarrollo de escenarios de uso empresarial.
Disponer de una herramienta que facilite el análisis para la toma de decisiones
en base a los indicadores y metas definidas.
2.2.2
Requerimientos del arquitecto
Los requerimientos del arquitecto han sido formulados tomando en cuenta la
arquitectura de referencia para el datamart, como se muestra en la Figura 12:
57
Figura 13: Arquitectura propuesta del datamart [5]
2.2.2.1 Bloques del Datamart
Los bloques de: Fuentes de datos, Datamart, Acceso y uso, nos permitirán
establecer el ámbito operativo que tendrá el datamart.
1. Fuentes de Datos:
Datos de Producción: se cuenta con una base de datos transaccional llamada
SISCEC con información académica generada por la CCC. En la figura 14 se
muestra el modelo físico de la base de datos SISCEC.
[5]
KIMBALL Ralph; ROSS, Margy; “The Datawarehouse Toolkit”, Segunda Edición.
FK_CURSO_RELATIONS_EMPRESA
int
char(65)
char(12)
char(12)
char(12)
char(65)
char(50)
char(50)
char(11)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(10)
varchar(50)
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
smallint
varchar(70)
INSTRUCTOR
CURSO
int
int
int
int
int
int
datetime
int
char(256)
numeric
datetime
datetime
float
text
varchar(200)
text
text
int
int
float
float
<fk3>
TIPO
Id_curso int
<pk,fk>
Id_fecha int
<pk>
Fecha
datetime
Fecha_Curso
int
<pk>
ID_PROG
NOMBRE_PROGRAMA
char(60)
DESCRIPCION_PROGRAMA char(55)
PROGRAMA
ID_TIPO_CURSO
int
<pk>
DESCRIPCION_TIPO char(55)
Id_Curso
int
<pk>
Id_Est
int
<pk>
Id_Contador int
<pk>
Valor
char(5)
Asistencia
FK_Fecha_Curso_CURSO
FK_CURSO_INCLUIDO_PROGRAMA
FK_CURSO_TIENE___TIPO
ID_CURSO
int <pk,fk1>
ID_FACTURA int <pk,fk2>
GENERA
FK_GENERA_GENERA2_FACTURA
int
<pk>
int
<fk>
decimal(6,2)
decimal(6,2)
text
text
int
FK_FACTURA_PAGA_ESTUDIAN
FK_GENERA_GENERA_CURSO
FK_SALDO_CANCELA_ESTUDIAN
ID_SALDO
ID_EST
ABONO
SALDO1
NUMERO_FACTURA
COMENTARIO
NUM_COMPROBANTE
SALDO
IMPUESTO
int
<pk>
ID_IMPUESTO
ID_FACTURA
int
<fk>
VALOR1
money
DESCRIPCION_TIPO_PAGO char(65)
DESCUENTO
<pk>
ID_CHEQUE int
NUMERO1
int
BANCO
char(65)
CHEQUE
FK_TIPO_PAG_ES_CHEQUE
ID_TIPO_PAGO
ID_CHEQUE
ID_FACTURA
TIPO
DESCRIPCION_TIPO_PAGO
int
<pk>
int
<fk>
money
char(65)
ROL_DE_PAGOS
int
<pk>
ID_ROL_PAGOS
int
<pk>
int
<fk1>
ID_TIPO_PAGO
int
<fk>
int
<fk2>
FK_ROL_DE_P_ES___TIPO_PAG
TIPO_EMPLEADO
char(15)
char(45)
RESPONSABLE
char(45)
char(65)
ID_DESCUENTO
ID_FACTURA
VALOR1
DESCRIPCION_TIPO_PAGO
TIPO_PAGO
int
<pk>
int
<fk>
datetime
char(65)
FK_DESCUENT_TIENE_FACTURA
char(65)
char(65)
char(12)
char(65)
decimal(2,2)
FK_TIPO_PAG_CONTIENE_FACTURA
decimal(2,2)
FK_IMPUESTO_TIENE__FACTURA
ID_FACTURA
ID_EST
FECHA_EMISION_FACTURA
NOMBRE
DIRECCION
CIUDAD
TELEFONO
DEPENDENCIA
SUBTOTAL
TOTAL
FACTURA
FK_DETALLE__GENERA__FACTURA
int
<pk>
int
<fk>
int
char(65)
decimal(3,2)
DETALLE_FACTURA
ID_DETALLE
ID_FACTURA
NUMERO1
DESCRIPCION_TIPO_PAGO
PRECIO
Figura 14: Modelo Físico de la base de datos SISCEC
ID_CURSO
ID_EMPRESA
ID_EVALUACION
ID_TIPO_CURSO
ID_PROG
MANUAL
FECHA_MANUAL
<pk>
ID_INSTRUCTOR
NOMBRE_CURSO
DURACION_CURSO
FECHA_INICIO_CURSO
FECHA_FIN_CURSO
COSTO_CURSO
LUGAR_CURSO
CONTENIDO_CURSO
DESCRIPCION_HORARIO
FK_CURSO_DICTA_INSTRUCTDIAS
ID_MANUAL_INSTRUCTOR
Duracion_Dias
costo_hora
costo_total
<pk>
<fk1>
<fk2>
<fk5>
<fk4>
int
<pk,fk2>
int
<pk,fk1>
float
float
float
varchar(20)
varchar(5)
varchar(50)
int
varchar(50)
float
float
char(10)
char(10)
varchar(50)
float
FK_CURSO_PO_RECIBE2_CURSO
ID_EST
ID_CURSO
NOTA
ASISTENCIA
NOTA_PROGRAMA
Diploma
Parqueadero
Como
Id_saldo
Observación
Descuento
Abono
Factura
Comprob
Factura1
Abono1
CURSO_POR_ESTUDIANTE
FK_CURSO_PO_RECIBE_ESTUDIAN
int
<pk>
int
<fk>
char(40)
char(65)
char(20)
char(12)
char(12)
char(12)
char(65)
char(47)
char(60)
ESTUDIANTE
FK_DIPLOMA_OBTIENE_ESTUDIAN
int
<pk>
int
<fk>
datetime
datetime
text
DIPLOMA
ID_DIPLOMA
ID_EST
FECHA_EMISION
FECHA_ENTREGA
ESTADO_DIPLOMA
int
<pk>
ID_EST
int
<fk>
ID_EMPRESA
char(65)
APELLIDO_EST
char(85)
NOMBRE_EST
char(15)
CI_EST
char(15)
FK_ESTUDIAN_ES_AUSPIC_EMPRESA TELEF_CASA__EST
char(15)
TELEF_OFICI_EST
char(15)
TELEF_CELULAR_EST
char(15)
DIRECCION_EST
char(40)
EMAIL_EST
char(45)
Nombres_completos
char(20)
FK_CURSO_ES_GENERA_EVALUACI
ID_EMPRESA
ID_TIPO
NOMBRE_EMPRE
DIRECCION_EMPRE
TELEFONO_EMPRE
RUC_EMPRE
TELEFONO1_EMPRE
TELEFONO2_EMPRE
FAX_EMPRE
EMAIL_EMPRE
REPRESENTANTE_EMPRE
TIPO_EMPRESA
EMPRESA
FK_EMPRESA_PUEDE_SER_TIPO_EMP
ID_INSTRUCTOR
NOMBRE_INST
TELEF_CASA_INST
TELEF_OFICI_INST
TELEF_CELULAR_INST
DIRECCION_INST
EMAIL_INST
EMAIL2_INST
CI_INST
titulo
titulo2
maestria1
maestria2
otro1
CONTRATO
otro2
experiencia
ID_CONTRATO
int
<pk>
area
ID_INSTRUCTOR
int
<fk>
marketing_ventas
NUMERO_CONTRATO char(25)
FK_CONTRATO_FIRMA_INSTRUCT
proyectos
COSTO_HORA
decimal(3,2)
administracion
FECHA_FIRMA
datetime
finanzas
ESTADO1
text
rrhh
leyes
procesos
redes
bases
windows
linux
tcp
programacion_web
visual
ofimatica
diseno_web
proyectos_informaticos
otros
int
<pk>
float
float
float
nvarchar(50)
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
float
EVALUACION
ID_EVALUACION
EVALUACION_EST
EVALUACION_COOR
EVALUACION_SCLIENTE
ENLACE_ARCHIVO
EVALUACION_4
EVALUACION_5
PROMEDIO
EVALUACION_EQ
MAS
FEM
RECSI
RECNO
EPUBLICA
EPRIVADA
PRENSA
REVISTAS
REFERENCIA
WEB
EMAIL
OTROS
MENOSV
ENTREV
ENTRET
MAST
MASC
EJECUTIVO
MEDIOS
OPERATIVO
OTRO
TIPO_EMP
ID_TIPO
int <pk>
TIPO_EMPRESA text
58
59
Datos de Heredados: se cuenta con respaldos de la base de datos académica
SISCEC el cual comprenden aquellos datos históricos de los eventos de
capacitación generados como fecha de inicio a partir del 07 de Enero del 2005.
Adicionalmente se cuenta con hojas electrónicas que contiene las metas
mensuales de los indicadores de rendimiento.
Metadatos de las Fuentes: La definición de los metadatos del datamart será
referente a la información extraída de los datos de producción y datos heredados.
2. Datamart
Este componente es el encargado de estandarizar, transformar, integrar y cargar
la información proveniente de las diferentes fuentes de datos, el manejo de los
metadatos y la lista de consultas y reportes diseñados para el datamart, como se
muestra en la figura 15.
Figura 15: Arquitectura del datamart a alto nivel [9]
[9]
CONNOLLY Thomas, BEGG Carolyn. DATABASE SYSTEMS. A practical Approach to Design,
Implementation and Management.
60
3. Acceso y Uso
Este componente permitirá el análisis del cubo multidimensional, la elaboración de
reportes, herramientas de explotación, exploración del datamart y la obtención de
gráficos y reportes según los perfiles de los usuarios.
Como
herramienta
de
construcción,
análisis
y
explotación
del
cubo
multidimensional se utilizará MSS Analysis Services. De igual manera, como
herramienta de visualización y reportería se utilizará MSS Reporting Services.
Finalmente se contará con un módulo de autenticación de usuarios, en el cual se
controlará el acceso a los reportes generados de acuerdos a los perfiles
establecidos para la aplicación.
2.2.2.2 Capas del datamart
Las capas de: Administración de datos, metadatos, transporte, infraestructura, y
herramientas, tecnología y funciones, determinan el ambiente necesario para la
implementación y funcionamiento del datamart.
Administración de Datos: Esta capa se encargará de realizar el proceso de
extracción, transformación y carga de las fuentes de datos y ubicarlos en el
datamart, divididos por fases de tiempo y la administración de los metadatos.
Administración de metadatos: Esta capa se encargará de administrar la definición
de los datos depositados en el datamart.
Transporte: esta capa se encarga de proveer el componente de transporte entre
los distintos bloques de la arquitectura.
Infraestructura: Se utilizará una arquitectura cliente / servidor.
Herramientas,
tecnología
y
funciones:
Herramientas:
los
tecnológicos que se utilizarán para el desarrollo del datamart serán:
componentes
61
-
Herramienta de definición y diseño de datos.
-
Herramientas de documentación.
-
Herramientas de administración de bases de datos.
-
Herramientas de extracción, transformación y carga.
-
Herramientas de generación y análisis de cubos
-
Herramientas de reporte.
-
Herramientas de acceso para el usuario final.
-
Hojas electrónicas.
Tecnología: se utilizará la infraestructura tecnológica base con la que actualmente
dispone el CEC.
2.2.3
Requerimientos del desarrollador
La tecnología a utilizarse se dividirá de acuerdo a los bloques detallados en la
arquitectura del datamart:
2.2.3.1 Fuentes de Datos
Microsoft SQL Server 2005 como sistema de administración de bases de datos.
Power Designer 12 como herramienta para definición, diseño y documentación de
metadatos.
2.2.3.2 Datamart
Integration Service de SQL Server 2005 como herramienta de extracción,
transformación y carga de datos.
Analysis Services de SQL Server 2005 como herramienta de generación de cubos
multidimensionales.
2.2.3.3 Acceso y Uso
Reporting Services de SQL Server 2005 como herramienta de generación de
reportes y gráficos.
Microsoft .NET 2008 como herramienta de construcción de interfaz de usuario.
2.2.4
Requerimientos del usuario final
62
Para satisfacer las necesidades de los usuarios finales se ha dividido los
requerimientos en dos grupos:
2.2.4.1 Requerimientos de consulta
A la CCC le interesa resolver preguntas con respecto a los indicadores principales
de medición, como se muestra en la tabla 9:
63
Indicador
Pregunta
¿Cuál es el nivel de satisfacción del cliente (total general) por
evento de capacitación e instructor?
¿Cuál es el nivel de satisfacción del cliente con respecto al diseño
del curso?
Nivel de Satisfacción del
cliente
¿Cuál es el nivel de satisfacción del cliente con respecto al
instructor del curso?
¿Cuál es el nivel de satisfacción del cliente con respecto al
material didáctico del curso?
¿Cuál es el nivel de satisfacción del cliente con respecto a la
organización y desarrollo del curso?
¿Cuál es el nivel de satisfacción del cliente con respecto a la
infraestructura del curso?
¿Cuál es el número de estudiantes total matriculados por curso el
instructor en un período de tiempo determinado?
¿Cuál es el porcentaje de estudiantes por género?
¿Cuál es el porcentaje de estudiantes que recomiendan el curso?
Número de estudiantes
¿Cuál es el porcentaje de estudiantes que han tomado cursos
según el tipo de institución del que provienen?
¿Cuál es el porcentaje de estudiantes que han tomado un curso,
de acuerdo al medio de difusión por el cual se enteraron del
mismo?
¿Cuál es el porcentaje de estudiantes que han tomado un curso
según rangos de edad?
¿Cuál es el porcentaje de estudiantes que han tomado un curso
según el cargo profesional?
¿Cuál es el porcentaje de crecimiento de la CCC en cuanto
clientes con respecto al año base?
¿Cuál es el curso con mayor número de alumnos matriculados?
¿Cuál es el número de estudiantes que aprobaron un
dictado?
curso
Ingresos económicos
¿Cuál es el porcentaje de crecimiento de la CCC en cuanto a
ingresos económicos con respecto al año base?
Número de horas
¿Cuál es el porcentaje de crecimiento de la CCC en cuanto al
número de horas dictadas?
¿Cuál es el porcentaje de crecimiento de la CCC en cuanto a
ingresos económicos con respecto al año base?
Número de cursos
¿Cuál es el instructor que dictó mayor número de cursos?
¿Cuál es el curso con mayor demanda?
Tabla 9: Requerimientos de consulta
2.2.4.2 Requerimientos de reporte
Los usuarios finales de la CCC requieren las siguientes características:
64
-
Acceso a través del un navegador de Internet.
-
Interfaz de acceso a los reportes previa autenticación de usuarios.
-
Acceso autorizado a los reportes en base a perfiles definidos.
-
Visualización gráfica de los datos.
2.3 ANALISIS
Para el modelado de datos del Datamart propuesto, se utilizará el esquema de
almacenamiento en estrella[13]14, dividido en 4 tablas de hechos que representan
los procesos de medición definidas en las etapas del Proceso Productivo de la
CCC (planificación, ejecución, evaluación), las cuales son las siguientes:
-
Proceso de medición académica
-
Proceso de medición de evaluación a cursos.
-
Proceso de medición de encuestas realizadas en cursos.
-
Proceso de medición de rendimiento de cursos.
2.3.1
-
DIMENSIONES
DIM_OBSERVACION: dimensión que almacena las observaciones referentes
al desempeño de los cursos dictados.
-
DIM_TIEMPO: Esta dimensión contiene los periodos de tiempo en base al cual
se realizará la visualización de las consultas.
-
DIM_ITEM: dimensión que almacena los ítems en base a los cuales se
realizan las encuestas a los estudiantes que tomaron un curso.
-
DIM_INSTRUCTOR: dimensión que almacena la información correspondiente
a cada instructor, lo que incluye la experiencia y las competencias adquiridas
por el mismo, así como también el número de cursos que ha dictado.
-
DIM_EVALUABLE: dimensión que almacena los parámetros de medida de la
evaluación final correspondiente al curso dictado.
[13]
Diseño de un Dataware house: Estrella y Copo de nieve
Esquema en Estrella: es el esquema de almacenamiento multidimensional mas simple y se representa
cuando la jerarquía de los atributos de una dimensión es lineal.
14
65
-
DIM_CURSO: Dimensión que contiene el nombre asignado al curso dictado, el
tipo de curso al que pertenece y su programación correspondiente.
-
DIM_CLIENTE: dimensión que almacena los datos personales de los clientes
y empresas que toman el evento de capacitación.
2.3.2
TABLAS DE HECHO
2.3.2.1 Proceso de medición académica
Permite medir los parámetros de seguimiento del proceso académico de los
estudiantes matriculados en eventos de capacitación que se han llevado a cabo
por parte de la CCC. La figura 16 muestra el modelo lógico del datamart para el
proceso de medición académica (FACT_ACADEMICO).
2.3.2.2 Medidas
-
Nota promedio del estudiante.
-
Asistencia promedio del estudiante.
-
Porcentaje de descuento por estudiante.
-
Ingreso económico generado por estudiante.
-
Número de diplomas entregados.
-
Número de parqueaderos asignados.
2.3.2.3 Dimensiones
- DIM_TIEMPO
- DIM_CURSO
- DIM_INSTRUCTOR
- DIM_CLIENTE
- DIM_OBSERVACIÓN
66
2.3.2.4 Modelo Lógico
DIM_TIEMPO
id_tie
<pi> Integer
fecha_tie
Date & Time
horario_tie
Variable characters (250)
nombre_mes_tie
Variable characters (40)
bimestre_tie
Integer
trimestre_tie
Integer
semestre_tie
Integer
anio_tie
Integer
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
DIM_INSTRUCTOR
id_ins
<pi> Integer
<M>
nombre_ins
Variable characters (80) <M>
titulo_principal_ins
Variable characters (50) <M>
maestria_principal_ins
Variable characters (50) <M>
titulo_adicional_uno_ins
Variable characters (50) <M>
area_experiencia_ins
Variable characters (50) <M>
anio_experiencia_ins
Variable characters (20) <M>
Identifier_1 <pi>
Identifier_1 <pi>
TIE_ACA
INS_ACA
FACT_ACADEMICO
est_nota
est_asistencia
est_descuento
est_ingreso
est_diploma_entrega
est_parqueadero
DIM_CURSO
id_cur
<pi> Integer
descripcion_tipo_cur
Variable characters (80)
nombre_programa_cur
Variable characters (80)
nombre_cur
Variable characters (260)
CUR_ACA
<M>
<M>
<M>
<M>
Decimal (9,2)
Decimal (9,2)
Decimal (9,2)
Decimal (15,2)
Short integer
Short integer
<M>
<M>
<M>
<M>
<M>
<M>
CLI_ACA
Identifier_1 <pi>
DIM_CLIENTE
OBS_ACA
id_obs
<pi> Integer
<M>
nombre_obs
Variable characters (50) <M>
id_cli
<pi> Integer
<M>
id_emp_cli
Integer
<M>
id_est
Integer
<M>
nombre_emp_cli
Variable characters (80) <M>
representante_emp_cli
Variable characters (50) <M>
tipo_convenio_emp_cli
Variable characters (50) <M>
nombre_est
Variable characters (80) <M>
genero_est
Characters (1)
tipo_cargo_est
Variable characters (30)
Identifier_1 <pi>
Identifier_1 <pi>
DIM_OBSERVACION
Figura 16: Modelo lógico del datamart FACT_ACADEMICO
2.3.3
Proceso de medición de evaluación a cursos
Este proceso tiene como objetivo medir el índice de satisfacción de los
estudiantes en base a los parámetros de evaluación realizados a los estudiantes
en cada evento de capacitación. La figura 17 muestra el modelo lógico del
datamart
para
el
proceso
de
medición
de
(FACT_EVALUACION).
2.3.3.1 Medidas
-
Índice de satisfacción por parámetro de evaluación.
2.3.3.2 Dimensiones
evaluación
a
cursos
67
-
DIM_TIEMPO
-
DIM_CURSO
-
DIM_INSTRUCTOR
-
DIM_EVALUABLE
2.3.3.3 Modelo Lógico
DIM_TIEMPO
id_tie
<pi> Integer
fecha_tie
Date & Time
horario_tie
Variable characters (250)
nombre_mes_tie
Variable characters (40)
bimestre_tie
Integer
trimestre_tie
Integer
semestre_tie
Integer
anio_tie
Integer
DIM_INSTRUCTOR
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<pi> Integer
<M>
id_ins
nombre_ins
Variable characters (80) <M>
titulo_principal_ins
Variable characters (50) <M>
maestria_principal_ins
Variable characters (50) <M>
titulo_adicional_uno_ins
Variable characters (50) <M>
area_experiencia_ins
Variable characters (50) <M>
anio_experiencia_ins
Variable characters (20) <M>
Identifier_1 <pi>
Identifier_1 <pi>
TIE_EVA
INS_EVA
FACT_EVALUACION
ind_satisfaccion Decimal (9,2) <M>
EVAL_EVA
CUR_EVA
DIM_CURSO
DIM_EVALUABLE
id_eval
<pi> Integer
<M>
nombre_evaluable
Variable characters (30) <M>
Identifier_1 <pi>
<pi> Integer
id_cur
descripcion_tipo_cur
Variable characters (80)
nombre_programa_cur
Variable characters (80)
nombre_cur
Variable characters (260)
<M>
<M>
<M>
<M>
Identifier_1 <pi>
Figura 17: Modelo lógico del datamart FACT_EVALUACION
2.3.4
Proceso de medición de encuestas realizadas
El proceso medición de encuestas tiene como finalidad medir el número de
estudiantes por evento de capacitación según ítems de encuesta. La figura 18
muestra el modelo lógico del datamart para el proceso de medición de encuestas
realizadas (FACT_ENCUESTA).
2.3.4.1 Medidas
-
Número de estudiantes que realizaron la encuesta.
2.3.4.2 Dimensiones
-
DIM_TIEMPO
68
-
DIM_CURSO
-
DIM_INSTRUCTOR
-
DIM_ÍTEM
2.3.4.3 Modelo Lógico
DIM_TIEMPO
DIM_INSTRUCTOR
id_tie
<pi> Integer
fecha_tie
Date & Time
horario_tie
Variable characters (250)
nombre_mes_tie
Variable characters (40)
bimestre_tie
Integer
trimestre_tie
Integer
semestre_tie
Integer
anio_tie
Integer
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<pi> Integer
<M>
id_ins
nombre_ins
Variable characters (80) <M>
titulo_principal_ins
Variable characters (50) <M>
maestria_principal_ins
Variable characters (50) <M>
titulo_adicional_uno_ins
Variable characters (50) <M>
area_experiencia_ins
Variable characters (50) <M>
anio_experiencia_ins
Variable characters (20) <M>
Identifier_1 <pi>
Identifier_1 <pi>
INS_ENC
TIE_ENC
FACT_ENCUESTA
num_estudiantes_enc Integer <M>
ITM_ENC
CUR_ENC
DIM_ITEM
<pi> Integer
<M>
id_item
nombre_item
Variable characters (30) <M>
nombre_subitem
Variable characters (50) <M>
Identifier_1 <pi>
DIM_CURSO
<pi> Integer
id_cur
descripcion_tipo_cur
Variable characters (80)
nombre_programa_cur
Variable characters (80)
nombre_cur
Variable characters (260)
<M>
<M>
<M>
<M>
Identifier_1 <pi>
Figura 18: Modelo lógico del datamart FACT_ENCUESTA
2.3.5
Proceso de medición de rendimiento de cursos
Este proceso tiene como objetivo medir el grado de cumplimiento de los
indicadores principales de rendimiento de los cursos dictados con respecto a las
siguientes metas:
-
Nivel de satisfacción del cliente
-
Número de cursos dictados
-
Número de participantes por curso
-
Ingresos generados por curso
-
Número de horas de capacitación dictadas
69
La figura 19 muestra el modelo lógico del datamart para el proceso de medición
de rendimiento de cursos (FACT_RENDIMIENTO).
2.3.5.1 Medidas
-
Nivel de satisfacción del cliente
-
Número de cursos dictados
-
Número de participantes por curso
-
Ingresos generados por curso
-
Número de horas de capacitación dictadas
2.3.5.2 Dimensiones
-
Tiempo
-
Curso
-
Instructor
2.3.5.3 Modelo Lógico
DIM_TIEMPO
<pi> Integer
id_tie
fecha_tie
Date & Time
horario_tie
Variable characters (250)
nombre_mes_tie
Variable characters (40)
bimestre_tie
Integer
trimestre_tie
Integer
semestre_tie
Integer
anio_tie
Integer
DIM_INSTRUCTOR
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<pi> Integer
<M>
id_ins
nombre_ins
Variable characters (80) <M>
titulo_principal_ins
Variable characters (50) <M>
maestria_principal_ins
Variable characters (50) <M>
titulo_adicional_uno_ins
Variable characters (50) <M>
area_experiencia_ins
Variable characters (50) <M>
anio_experiencia_ins
Variable characters (20) <M>
Identifier_1 <pi>
Identifier_1 <pi>
INS_REN
TIE_REN
FACT_RENDIMIENTO
num_participantes_cur
num_participantes_met
tot_ingresos_cur
tot_ingresos_met
tot_horas_cur
tot_horas_met
ind_satisfaccion_cur
ind_satisfaccion_met
Integer
Integer
Decimal
Decimal
Integer
Integer
Decimal
Decimal
<M>
<M>
(9,2) <M>
(9,2) <M>
<M>
<M>
(9,2) <M>
(9,2) <M>
CUR_REN
DIM_CURSO
id_cur
<pi> Integer
descripcion_tipo_cur
Variable characters (80)
nombre_programa_cur
Variable characters (80)
nombre_cur
Variable characters (260)
<M>
<M>
<M>
<M>
Identifier_1 <pi>
Figura 19: Modelo lógico del datamart FACT_RENDIMIENTO
70
2.3.6
Estrategia de Carga y Refrescamiento de datos
2.3.6.1 Estrategia de carga de datos
A partir del análisis a las fuentes de datos descrito en la fase de Planificación, se
ha determinado la necesidad de crear un modelo de datos auxiliar, el mismo que
servirá para realizar un proceso de carga de información previa a la extracción,
transformación y carga de datos hacia la base de datos del datamart, como se
muestra en la figura 20.
Extracción
Fuentes
de datos
SISCEC: OLTP +
histórico
Archivos Planos: Metas de indicadores
de rendimiento
Primera etapa de
carga
Transformación
Base de
datos
auxiliar
dmTransformacion
Segunda etapa de
carga
Carga
Datamart
dmCCC
Figura 20: Extracción y carga de datos desde las fuentes de datos
Por lo tanto el proceso de carga de datos se la realizará en dos etapas:
-
Primera etapa: comprende en la carga y transformación de los datos
transaccionales e históricos provenientes de la fuente de datos SISCEC y las
metas de los indicadores almacenadas en las hojas de cálculo hacia una base
de datos intermedia denominada dmTransformacion, de la siguiente manera:
71
o AUX_EVALUACION: se tomará la información de la tabla EVALUACION,
concerniente a las evaluaciones y encuestas generadas en cada evento de
capacitación.
o AUX_EMPRESA:
se
tomará
información
de
la
tabla
EMPRESA
concerniente a instituciones o empresas que han tomado algún tipo de
curso o evento de capacitación.
o AUX_ESTUDIANTE: se tomará información de la tabla ESTUDIANTE
concerniente a estudiantes que han tomado algún tipo de curso o evento
de capacitación.
o AUX_TIPO_CURSO: se tomará información de la tabla TIPO_CURSO
concerniente a los tipos de curso con la que cuenta actualmente el CEC.
o AUX_INDICADOR: se tomará información de la hoja electrónica llamada
INDICADORES.xls, concerniente a las metas definidas según indicadores
de medición de rendimiento de la CCC.
o AUX_PROGRAMA: se tomará información de la tabla PROGRAMA
concerniente a los programas al que pertenece el curso o evento de
capacitación.
o AUX_CURSO: se tomará información de la tabla CURSO el cual va a ser
considerado una sola vez en el proceso de carga, concerniente al nombre
de cursos o eventos de capacitación con los que cuenta el CEC.
o AUX_DETALLE_CURSO: se tomará información de la tabla CURSO con el
detalle de cada curso o evento de capacitación clasificado en la tabla
AUX_CURSO.
o AUX_CURSO_POR_ESTUDIANTE: se tomará información de la tabla
CURSO_POR_ESTUDIANTE,
correspondiente
a
la
información
de
estudiantes matriculados en cada curso o evento de capacitación.
o AUX_EVALUABLE: se tomará información de la tabla EVALUABLE,
correspondiente los ítems de evaluación del curso o evento de capacitación
y de la tabla AUX_EVALUACION, los ítems de evaluacion ya definidos en
dicha estrucutura mediante el uso de tablas temporales para la clasificación
de información.
72
En el anexo B se muestra el modelo entidad-relación de la base de datos
auxiliar (dmTransformacion).
-
Segunda etapa: comprende en el cálculo y carga de datos desde la base de
datos auxiliar (dmTransformacion) hacia la base de datos del datamart
(dmCCC), tanto a las dimensiones como a las tablas de hecho según procesos
de medición definidos.
DIMENSIONES:
o DIM_TIEMPO: se tomará información de la tabla AUX_DETALLE_CURSO,
concerniente a la fecha de inicio de cursos o eventos de capacitación. Esta
dimensión estará compuesto por las siguientes jerarquías: fecha, mes,
bimestre, trimestre, semestre y año.
o DIM_CURSO: se tomará información de la tabla AUX_CURSO, el nombre
único
de
cada
curso
AUX_TIPO_CURSO
o
se
evento
tomarán
de
el
capacitación.
nombre
del
De
tipo
la
de
tabla
curso
correspondiente al curso, y de la tabla AUX_PROGRAMA el nombre del
programa al que pertenece. Esta dimensión estará compuesta por 3 niveles
de jerarquía: tipo de curso, programa, curso.
o DIM_OBSERVACION:
se
tomará
AUX_CURSO_POR_ESTUDIANTE
observación
ingresada
por
cada
información
correspondiente
estudiante
de
al
la
detalle
matriculado.
tabla
de
Estas
observaciones, pueden ser descripciones de descuentos, pronto pago,
estudiante EPN, convenios, etc. Esta dimensión no contiene niveles de
jerarquía.
o DIM_CLIENTE: se tomará información de la tabla AUX_ESTUDIANTE el
nombre del estudiante, de la tabla AUX_EMPRESA el nombre de la
empresa a la q pertenece el estudiante y TIPO_EMP el tipo de empresa.
Esta dimensión tendrá las siguientes jerarquías: tipo de empresa, empresa,
estudiante.
o DIM_INSTRUCTOR:
se
tomará
información
de
la
tabla
AUX_INSTRUCTOR el nombre de los instructores que han dictados los
73
diferentes curso o eventos de capacitación. Esta dimensión no contiene
niveles de jerarquía.
o DIM_ITEM: se tomará información de la tabla AUX_EVALUACION el
nombre de los ítems de medición de encuestas, mediante una clasificación
previa de la información en tablas temporales. Esta dimensión tendrá las
siguientes jerarquías: item, subitem de medición de encuesta.
o DIM_EVALUACION: se tomará información de la tabla AUX_EVALUABLE
el nombre de los ítems de medición de evaluaciones, mediante una
clasificación previa de la información en tablas temporales. Esta dimensión
no contiene niveles de jerarquía.
TABLAS DE HECHO:
o FACT_ACADEMICO:
se
tomará
información
de
la
tabla
AUX_ESTUDIANTE_CURSO la nota promedio, asistencia promedio,
porcentaje
de
descuento,
ingreso
generado,
diploma
entregado,
parqueadero solicitado por el estudiante matriculado, según instructor,
periodo de tiempo, curso, estudiante, y observación registrada.
o FACT_EVALUACION:
se
tomará
la
información
de
las
tablas
PREGUNTAENCUESTA, EVALUABLEENCUESTA, el valor promedio del
ítem de evaluación del curso, si el curso está registrado en la tabla
CASOEVALUACION de la base de datos SISCEC si el curso no está
registrado en dicha tabla el valor promedio deberá ser calculado de la tabla
AUX_EVALUACION, según ítem de evaluación, periodo de tiempo, curso e
instructor.
o FACT_ENCUESTA:
se
tomará
la
información
de
las
tablas
DETALLEINFOGENERAL, INFORMACIONGENERAL el valor de número
de estudiantes si el curso está registrado en la tabla CASOEVALUACION
de la base de datos SISCEC, si el curso no está registrado en dicha tabla
el valor promedio deberá ser calculado de la tabla AUX_EVALUACION,
según ítem de encuesta, periodo de tiempo, curso e instructor.
o FACT_RENDIMIENTO:
se
tomará
AUX_CURSO_POR_ESTUDIANTE
la
el
información
número
de
de
la
tabla
participantes
matriculados, total de ingresos generados por estudiante, de la tabla
74
AUX_DETALLE_CURSO el número de cursos generados, número de
horas por curso dictado,
de la
tabla CASOEVALUACION el valor
promedio de la evaluación total general ponderada del curso si el curso
existe en dicha tabla de la base de dato SISCEC. Si el curso no existe en
dicha tabla, se tomará el valor promedio de la evaluación desde la tabla
AUX_EVALUACION y de la tabla AUX_INDICADOR, el valor de las metas
de: número de estudiantes, número de cursos, ingresos, horas curso, nivel
de satisfacción del cliente, según periodo de tiempo, curso, instructor.
2.3.6.2 Estrategia de Refrescamiento de Datos
La carga inicial de los datos se realizará tomando todos los cursos, capitaciones y
consultorías realizadas a partir de enero del 2005 a través del DTS15
implementado anteriormente, debido a que un previo análisis de la información,
existe mucha información incorrecta y no estandarizada.
El proceso de refrescamiento de datos al datamart dependerá de la programación
planificada de forma mensual por la CCC, según la demanda que se genere por
cada uno de los cursos o eventos de capacitación en la modalidad abiertos,
cerrados, virtuales, in-company. Por lo tanto la estrategia de refrescamiento de
datos tiene una carga transaccional acumulada con frecuencia mensual, por lo
que esta estrategia deberá ser ejecutada después de que se hayan cerrado
dichos eventos de capacitación y se hayan ingresado los resultados de las
evaluaciones realizadas a los mismos. Este proceso generalmente se cierra los
10 primeros días de cada mes, por lo que es necesario realizar el refrescamiento
posterior a esta fecha de forma mensual. También a este proceso debe permitir
que el refrescamiento de información se lo haga de forma reprocesable, es decir
que la nueva información solo actualice al periodo actual de carga únicamente.
15
DTS (Data Transformation Service): servicio que permite realizar múltiples tareas sobre base de datos a
través del uso de varios tipos de conexiones a las fuentes de datos.
75
2.4 DISEÑO
2.4.1
Dimensiones
2.4.1.1 Diseño físico de la dimensión DIM_OBSERVACION:
Campo
Tipo de Dato
Longitud
ID_OBS
INTEGER
4
NOMBRE_OBS
VARCHAR
50
Tabla 10: Diseño de la dimensión DIM_OBSERVACION
2.4.1.2 Diseño físico de la dimensión DIM_TIEMPO
Campo
Tipo de Dato
ID_TIE
INTEGER
FECHA_TIE
DATETIME
HORARIO_TIE
NVARCHAR
NOMBRE_MES_TIE
NVARCHAR
BIMESTRE_TIE
INTEGER
TRIMESTRE_TIE
INTEGER
SEMESTRE_TIE
INTEGER
ANIO_TIE
INTEGER
Tabla 11: Diseño de la dimensión DIM_TIEMPO
Longitud
4
8
250
80
4
4
4
4
2.4.1.3 Diseño físico de la dimensión DIM_ITEM
Campo
Tipo de Dato
ID_ITEM
INTEGER
NOMBRE_ITEM
VARCHAR
NOMBRE_SUBITEM
VARCHAR
Tabla 12: Diseño de la dimensión DIM_ITEM
Longitud
4
30
50
2.4.1.4 Diseño físico de la dimensión DIM_INSTRUCTOR
Campo
Tipo de Dato
Longitud
ID_INS
INTEGER
4
NOMBRE_INS
VARCHAR
80
TITULO_PRINCIPAL_INS
VARCHAR
50
MAESTRIA_PRINCIPAL_INS
VARCHAR
50
TITULO_ADICIONAL_UNO_INS
VARCHAR
50
AREA_EXPERIENCIA_INS
VARCHAR
50
ANIO_EXPERIENCIA_INS
VARCHAR
20
Tabla 13: Diseño de la dimensión DIM_INSTRUCTOR
2.4.1.5 Diseño físico de la dimensión DIM_EVALUABLE
76
Campo
Tipo de Dato
Longitud
ID_EVAL
INTEGER
4
NOMBRE_EVALUABLE
VARCHAR
30
Tabla 14: Diseño físico de la dimensión DIM_EVALUABLE
2.4.1.6 Diseño físico de la dimensión DIM_CURSO
Campo
Tipo de Dato
ID_CUR
INTEGER
DESCRIPCION_TIPO_CUR
VARCHAR
NOMBRE_PROGRAMA_CUR
VARCHAR
NOMBRE_CUR
VARCHAR
Tabla 15: Diseño de la dimensión DIM_CURSO
Longitud
4
80
80
260
2.4.1.7 Diseño físico de la dimensión DIM_CLIENTE
Campo
Tipo de Dato
ID_CLI
INTEGER
ID_EMP_CLI
INTEGER
ID_EST
INTEGER
NOMBRE_EMP_CLI
VARCHAR
REPRESENTANTE_EMP_CLI
VARCHAR
TIPO_CONVENIO_EMP_CLI
VARCHAR
NOMBRE_EST
VARCHAR
GENERO_EST
CHAR
TIPO_CARGO_EST
VARCHAR
Tabla 16: Diseño de la dimensión DIM_TIEMPO
2.4.2
Longitud
4
4
4
80
50
50
80
1
30
Proceso de medición académica
2.4.2.1 Diseño físico de la tabla de hechos FACT_ACADEMICO
Campo
Tipo de Dato
Longitud
ID_INS
INTEGER
4
ID_CLI
INTEGER
4
ID_TIE
INTEGER
4
ID_CUR
INTEGER
4
ID_OBS
INTEGER
4
EST_NOTA
DECIMAL
(5,2)
EST_ASISTENCIA
DECIMAL
(5,2)
EST_DESCUENTO
DECIMAL
(5,2)
EST_INGRESO
DECIMAL
(5,2)
EST_DIPLOMA_ENTREGA
SMALLINT
2
EST_PARQUEADERO
SMALLINT
2
Tabla 17: Diseño de la tabla de hechos FACT_ACADEMICO
2.4.2.2 Modelo físico de la tabla de hechos FACT_ACADEMICO
77
DIM_INSTRUCTOR
ID_INS
NOMBRE_INS
TITULO_PRINCIPAL_INS
MAESTRIA_PRINCIPAL_INS
TITULO_ADICIONAL_UNO_INS
AREA_EXPERIENCIA_INS
ANIO_EXPERIENCIA_INS
DIM_CURSO
int
<pk>
varchar(80)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(20)
ID_CUR
DESCRIPCION_TIPO_CUR
NOMBRE_PROGRAMA_CUR
NOMBRE_CUR
int
<pk>
varchar(80)
varchar(80)
varchar(260)
FK_FACT_ACA_CUR_ACA_DIM_CURS
FK_FACT_ACA_INS_ACA_DIM_INST
FACT_ACADEMICO
FK_FACT_ACA_OBS_ACA_DIM_OBSE
DIM_OBSERVACION
int
<pk>
ID_OBS
NOMBRE_OBS varchar(50)
ID_INS
ID_CLI
ID_T IE
ID_CUR
ID_OBS
EST_NOTA
EST_ASISTENCIA
EST_DESCUENTO
EST_INGRESO
EST_DIPLOMA_ENTREGA
EST_PARQUEADERO
int
int
int
int
int
decimal(9,2)
decimal(9,2)
decimal(9,2)
decimal(15,2)
smallint
smallint
<pk,fk3>
<pk,fk1>
<pk,fk5>
<pk,fk2>
<pk,fk4>
FK_FACT_ACA_CLI_ACA_DIM_CLIE
FK_FACT_ACA_T IE_ACA_DIM_TIEM
DIM_TIEMPO
ID_TIE
FECHA_TIE
HORARIO_TIE
NOMBRE_MES_TIE
BIMESTRE_TIE
TRIMESTRE_TIE
SEMESTRE_TIE
ANIO_T IE
int
<pk>
datetime
varchar(250)
varchar(40)
int
int
int
int
DIM_CLIENTE
ID_CLI
ID_EMP_CLI
ID_EST
NOMBRE_EMP_CLI
REPRESENTANTE_EMP_CLI
TIPO_CONVENIO_EMP_CLI
NOMBRE_EST
GENERO_EST
TIPO_CARGO_EST
int
<pk>
int
int
varchar(80)
varchar(50)
varchar(50)
varchar(80)
char(1)
varchar(30)
Figura 21: Modelo físico del proceso de medición académica
2.4.3
Proceso de medición de evaluación a cursos
2.4.3.1 Diseño físico de la tabla de hechos FACT_EVALUACION
Campo
Tipo de Dato
Longitud
ID_INS
INTEGER
4
ID_EVAL
INTEGER
4
ID_CUR
INTEGER
4
ID_TIE
INTEGER
4
IND_SATISFACCION
DECIMAL
(5,2)
Tabla 18: Diseño de la tabla de hechos FACT_EVALUACION
2.4.3.2 Modelo físico de la tabla de hechos FACT_EVALUACION
78
DIM_EVALUABLE
int
<pk>
ID_EVAL
NOMBRE_EVALUABLE varchar(200)
FK_FACT_EVA_EVAL_EVA_DIM_EVAL
DIM_INSTRUCTOR
ID_INS
NOMBRE_INS
TITULO_PRINCIPAL_INS
MAESTRIA_PRINCIPAL_INS
TITULO_ADICIONAL_UNO_INS
AREA_EXPERIENCIA_INS
ANIO_EXPERIENCIA_INS
FACT_EVALUACION
<pk>
int
varchar(80)
ID_INS
int
FK_FACT_EVA_INS_EVA_DIM_INST
varchar(50)
ID_EVAL
int
varchar(50)
ID_CUR
int
varchar(50)
ID_TIE
int
varchar(50)
IND_SATISFACCION decimal(9,2)
varchar(20)
DIM_CURSO
<pk,fk3>
int
<pk>
ID_CUR
FK_FACT_EVA_CUR_EVA_DIM_CURS
<pk,fk2>
DESCRIPCION_TIPO_CUR
varchar(80)
<pk,fk1>
NOMBRE_PROGRAMA_CUR varchar(80)
<pk,fk4>
NOMBRE_CUR
varchar(260)
FK_FACT_EVA_TIE_EVA_DIM_TIEM
DIM_TIEMPO
ID_TIE
FECHA_TIE
HORARIO_TIE
NOMBRE_MES_TIE
BIMESTRE_TIE
TRIMESTRE_TIE
SEMESTRE_TIE
ANIO_TIE
<pk>
int
datetime
varchar(250)
varchar(40)
int
int
int
int
Figura 22: Modelo físico del proceso de medición de evaluación a cursos
2.4.4
Proceso de medición de encuestas realizadas
2.4.4.1 Diseño físico de la tabla de hechos FACT_ENCUESTA
Campo
Tipo de Dato
Longitud
ID_ITEM
INTEGER
4
ID_CUR
INTEGER
4
ID_TIE
INTEGER
4
ID_INS
INTEGER
4
NUM_ESTUDIANTES_ENC
INTEGER
4
Tabla 19: Diseño de la tabla de hechos FACT_ENCUESTA
2.4.4.2 Modelo físico de la tabla de hechos FACT_ENCUESTA
79
DIM_INSTRUCTOR
ID_INS
NOMBRE_INS
TITULO_PRINCIPAL_INS
MAESTRIA_PRINCIPAL_INS
TITULO_ADICIONAL_UNO_INS
AREA_EXPERIENCIA_INS
ANIO_EXPERIENCIA_INS
int
<pk>
varchar(80)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(20)
FK_FACT_ENC_INS_ENC_DIM_INST
DIM_CURSO
ID_CUR
DESCRIPCION_TIPO_CUR
NOMBRE_PROGRAMA_CUR
NOMBRE_CUR
FACT_ENCUESTA
ID_ITEM
int
<pk>
FK_FACT_ENC_CUR_ENC_DIM_CURS
ID_CUR
varchar(80)
ID_TIE
varchar(80)
ID_INS
varchar(260)
NUM_ESTUDIANTES_ENC
int
int
int
int
int
DIM_ITEM
<pk,fk3>
FK_FACT_ENC_ITM_ENC_DIM_ITEM
<pk,fk1>
ID_ITEM
int
<pk>
<pk,fk4>
NOMBRE_ITEM
varchar(30)
<pk,fk2>
NOMBRE_SUBITEM varchar(50)
FK_FACT_ENC_TIE_ENC_DIM_TIEM
DIM_TIEMPO
ID_TIE
FECHA_TIE
HORARIO_TIE
NOMBRE_MES_TIE
BIMESTRE_TIE
TRIMESTRE_TIE
SEMESTRE_TIE
ANIO_TIE
int
<pk>
datetime
varchar(250)
varchar(40)
int
int
int
int
Figura 23: Modelo físico del proceso de encuestas realizadas
2.4.5
Proceso de medición de rendimiento de cursos
2.4.5.1 Diseño físico de la tabla de hechos FACT_RENDIMIENTO
Campo
Tipo de Dato
Longitud
ID_CUR
INTEGER
4
ID_INS
INTEGER
4
ID_TIE
INTEGER
4
NUM_PARTICIPANTES_CUR
INTEGER
4
NUM_PARTICIPANTES_MET
INTEGER
4
TOT_INGRESOS_CUR
DECIMAL
(5,2)
TOT_INGRESOS_MET
DECIMAL
(5,2)
TOT_HORAS_CUR
INTEGER
4
TOT_HORAS_MET
INTEGER
4
IND_SATISFACCION_CUR
DECIMAL
(5,2)
IND_SATISFACCION_MET
DECIMAL
(5,2)
Tabla 20: Diseño físico de la tabla de hechos FACT_RENDIMIENTO
80
2.4.5.2 Modelo físico de la tabla de hechos FACT_RENDIMIENTO
DIM_TIEMPO
id_tie
fecha_tie
horario_tie
nombre_mes_tie
bimestre_tie
trimestre_tie
semestre_tie
anio_tie
DIM_INSTRUCTOR
int
<pk>
datetime
varchar(250)
varchar(40)
int
int
int
int
id_ins
nombre_ins
titulo_principal_ins
maestria_principal_ins
titulo_adicional_uno_ins
area_experiencia_ins
anio_experiencia_ins
int
<pk>
varchar(80)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(20)
FK_FACT_REN_INS_REN_DIM_INST
FK_FACT_REN_TIE_REN_DIM_TIEM
FACT_RENDIMIENTO
id_cur
id_ins
id_tie
num_participantes_cur
num_participantes_met
tot_ingresos_cur
tot_ingresos_met
tot_horas_cur
tot_horas_met
ind_satisfaccion_cur
ind_satisfaccion_met
int
<fk1>
int
<fk2>
int
<fk3>
int
int
decimal(9,2)
decimal(9,2)
int
int
decimal(9,2)
decimal(9,2)
FK_FACT_REN_CUR_REN_DIM_CURS
DIM_CURSO
id_cur
descripcion_tipo_cur
nombre_programa_cur
nombre_cur
int
<pk>
varchar(80)
varchar(80)
varchar(260)
Figura 24: Modelo físico del proceso de medición de rendimiento de cursos
El diseño físico final del datamart se encuentra detallado en el anexo D.
2.4.6
Diseño detallado de la arquitectura de aplicación
Como se describió en la fase de Requerimientos, la solución se implementará
bajo una arquitectura cliente/servidor de dos capas. La figura 25, muestra los
componentes creados y los componentes individuales de acuerdo a los bloques
detallados en el ambiente operativo del datamart.
81
Figura 25: Arquitectura cliente/servidor de la aplicación
2.4.6.1 Fuentes de datos
-
Componente ETL16: este componente alojado en el servidor, se encargará de
realizar el proceso de extracción, transformación y carga desde las fuentes de
datos hacia el datamart. Este componente se lo implementará a través de la
elaboración de paquetes de Business Intelligence SQL Server Integration
Services 2005.
2.4.6.2 Datamart
-
Componente Datamart: este componente alojado en el servidor se encargará
de realizar la exploración y explotación del cubo multidimensional. Este
componente se lo implementará a través de la elaboración de proyectos con
SQL Server Analysis Services 2005.
2.4.6.3 Acceso y uso
-
Componente Módulo de Seguridades: Este componente alojado en el servidor
se encargará de controlar el acceso adecuado a los reportes en base a una
previa autenticación y asignación de perfiles de acceso.
-
Diseño de Interfaz de autenticación: Como se muestra en la figura 26, el
usuario deberá identificarse previamente a través del nombre de usuario y
contraseña asignados.
16
ETL: por sus siglas en inglés se define como el componente encargado de la Extracción, Transformación y
Carga de datos desde las fuentes.
82
Figura 26: Interfaz de autenticación de usuarios
2.4.6.4 Componente de visualización
Este componente alojado en el servidor se encargará de realizar la creación y
visualización de reportes generados a partir del análisis al cubo multidimensional.
Este componente se lo implementará a través de la elaboración de proyectos con
SQL Server Reporting Services 2005.
-
Diseño de Interfaz de Usuario: Como se muestra en la figura 27, se
proporcionará listas de selección para los criterios de búsqueda, a partir de los
cuales el usuario determinará la información que desea visualizar en las áreas
de: gráfico de resultados y tabla de resultados. Estos criterios de búsqueda
estarán localizados en la parte superior de la interfaz. En la parte superior
izquierda se tendrá el menú mediante el cual se accederá a los diferentes
reportes definidos para cada perfil de usuario.
83
100
Curso1
50
0
Curso2
1er 2do 3er 4to
trim. trim. trim. trim.
Curso3
Figura 27: Interfaz de reportes
-
Componente Navegador Web: Este componente estará alojado en cada
cliente, se encargará de permitir el acceso, navegación y visualización de la
aplicación a través de la intranet.
2.4.7
Definición de los niveles de seguridad
Los niveles de seguridad de acceso a los reportes se lo hará a través de un
módulo de seguridad, en el cual, se definirán los perfiles de acceso en base a la
audiencia de destino y los indicadores señalados en los requerimientos de
consulta, como se detalla en la tabla 21:
84
INDICADOR
Nivel de Satisfacción del cliente
Índice de estudiantes por género.
Índice de estudiantes que recomiendan un curso
Índice de estudiantes por tipo de institución
Índice de estudiantes por medio de difusión.
Índice de estudiantes por grupos de edad.
Índice de estudiantes por nivel o cargo profesional.
Coordinador
x
x
x
x
x
x
x
Índice de estudiantes por grupo de clientes
Ingresos económicos por grupo
de clientes
Nivel de crecimiento de la CCC
respecto a clientes
Nivel de crecimiento de la CCC respecto a ingresos
económicos
Curso más dictado
Curso con mayor número de alumnos
x
Instructores que mas cursos dictó
Tabla 21: Niveles de Seguridad
x
Subcoordinador
x
x
x
x
x
x
x
x
x
x
x
x
x
x
2.5 IMPLEMENTACIÓN
El desarrollo del Datamart se realizará utilizando las siguientes herramientas:
-
Microsoft SQL Server 2005 como Sistema de Administración de Bases de
Datos Relacionales en el bloque de fuentes de datos[14].
-
Microsoft Business Intelligence, Proyecto de Integration Services: como
herramienta de Extracción, transformación y carga de datos.[15]
-
Microsoft Business Intelligence, Proyecto de Analysis Services: como
herramienta de generación y explotación de cubos multidimensionales.[16]
-
Microsoft Business Intelligence, Proyecto de Reporting Services herramientas
OLAP para el acceso del usuario final. [17]
2.5.1
[14]
Implementación de la Estrategia de Carga
MICROSOFT: Documentación de SQL Server 2005
MICROSOFT: SQL Server Integration Services
[16]
MICROSOFT: SQL Server Analysis Services
[17]
MICROSOFT: SQL Server Reporting Services
[15]
85
Para la implementación de la estrategia de carga de datos del datamart se
crearon DTS realizados con Microsoft Business Intelligence, Integration Services
de MS SQL Server, el cual se encargará de realizar el proceso de extracción,
transformación, carga y despliegue del cubo multidimensional[15].
Este paquete contiene dos grupos de carga según la estrategia definida, de la
siguiente manera:
-
Cargar base de datos Transformación: Este grupo se encarga de realizar el
proceso de extracción, transformación y carga de la información de la base de
datos histórica y transaccional SISCEC para su respectiva normalización en la
base de datos dmTransformacion, como se puede observar en la figura 28.
Figura 28: Proceso de extracción, transformación y carga de la base de datos SISCEC
a la base de datos dmTransformacion.
-
Cargar Datamart: Este grupo se encarga de realizar el proceso de extracción,
transformación y carga de la información desde la base de datos
dmTransformacion hacia la las dimensiones y tabla de hechos del datamart en
la base de datos dmCCC, como se puede observar en la figura 29.
[15]
MICROSOFT: SQL Server Integration Services
86
Figura 29: Proceso de extracción, transformación y carga de la base de datos dmTransformacion a
la base de datos dmCCC.
La descripción de las tareas que componen el paquete DTS se encuentra
detallado en el anexo D.
2.5.2
Implementación de la Estrategia de Refrescamiento de datos
Para la implementación de la estrategia de refrescamiento de datos del datamart
se creó una nueva tarea que ejecute el DTS de forma periódica en el agente de
MS SQL Server, tomando en encuentra la definición de la estrategia de
refrescamiento en la fase de análisis. La figura 30 muestra la configuración y
calendarización de la tarea, que contiene la ejecución del paquete DTS de
refrescamiento y carga del datamart de forma mensual.
87
Figura 30: Calendarización del DTS
2.5.3
Explotación
Para la creación del cubo multidimensional se utilizó el asistente de creación de
cubos de Microsoft SQL Server Business Intelligence Analysis Services[28][29],
mediante el cual se deben definir los siguientes aspectos:
2.5.3.1 Orígenes de datos
Utilizamos el asistente para orígenes de datos para seleccionar la base de datos
del datamart cuyo nombre es dmCCC, como se observa en la figura 31.
[28]
[29]
Microsoft: Best Practices for the Data Warehouse
INFORMATION MANAGMENT: Best Practices for Data Warehouse Database Developers
88
Figura 31: Selección de la base de datos del datamart como origen de datos
En la figura 32 muestra la conexión con el origen de datos seleccionado y sus
propiedades.
Figura 32: Verificación de conexión con el origen de datos
En la figura 33, podemos observar la definición de las credenciales que utilizará
Analysis Services para conectarse con el origen de datos.
89
Figura 33: Selección de credenciales para Analysis Services
2.5.3.2 Vista de orígenes de datos
Para la creación de la vista de orígenes de datos relacionales, se selecciona el
origen de datos previamente creado. Se eligen las tablas de dimensiones y las
tablas de hechos que serán incluidas dentro de la vista como se observa en las
figuras 34 y 35 respectivamente.
Figura 34: Selección del origen de datos relacional
90
Figura 35: Selección de las dimensiones y tablas de hechos
Por convención, el nombre de la vista de orígenes de datos estará compuesto por
el prefijo “vw” seguido del nombre de la base de datos del datamart, como se
puede observar en la figura 36.
Figura 36: Asignación del nombre de la vista de origen de datos
Finalmente en la figura 37 podemos observar el modelo físico del datamart
dmTransformacion.
91
Figura 37: Vista de orígenes de datos
2.5.3.3 Cubos
Iniciamos el asistente para cubos y seleccionamos como método de generación
del cubo la “Generación automática”. [16]
Figura 38: Selección del método de generación del cubo
[16]
MICROSOFT: SQL Server Analysis Services
92
Se selecciona la vista vwdmCCC a partir de la cual se definen las tablas de
hechos
FACT_ACADEMICO,
FACT_RENDIMIENTO
FACT_ENCUESTA,
FACT_EVALUACION
y
y sus correspondientes tablas de dimensiones como se
observa en la figura 39.
Figura 39: Selección de la vista de orígenes de datos
En la figura 40 se observa la especificación de las tablas de hechos, las tablas de
dimensiones y como dimensión de tiempo la tabla DIM_TIEMPO.
Figura 40: Identificación de las tablas de hechos y de dimensiones
93
En la figura 41 se observa la definición de las propiedades de tiempo de acuerdo
a la dimensión DIM_TIEMPO.
Figura 41: Identificación de propiedades de tiempo en la dimensión DIM_TIEMPO
Posteriormente en la figura 42 se observa la selección de las medidas que se van
a incluir en el cubo y que servirán para definir nuevos miembros calculados.
Figura 42: Medidas a incluir en el cubo
94
Finalmente, por convención se asigna como nombre del cubo qbDMCCC, el cual
servirá de referencia para realizar la futura explotación como se puede observar
en la figura 43.
Figura 43: Especificación del nombre del cubo
Finalmente en la figura 44, se puede observar el esquema del cubo generado, de
tal manera que se pueden identificar las dimensiones de las tablas de hecho.
95
Figura 44: Esquema del cubo generado
2.5.4
Elaboración de Consultas
Los reportes[25] han sido elaborados tomando en cuenta los indicadores de mayor
interés para el CCC, dichos reportes han sido organizados de la siguiente
manera:
2.5.4.1 Parámetros de consulta
Los reportes tienen definidos parámetros que permiten establecer el grado de
detalle con que se presentarán la información y son los siguientes:
-
AÑO
-
SEMESTRE
-
TRIMESTRE
-
MES
-
TIPO DE CURSO
-
CURSO
-
INSTRUCTOR
[25]
SQL Server Reporting Services Fast Guide
96
2.5.4.2 Estructura del reporte
El contenido de los reportes ha sido organizado por año, semestre, trimestre y
mes, de modo que facilite el análisis de la información desde un nivel general
hasta un nivel más detallado.
Los reportes elaborados se detallan a continuación:
1. Desempeño curso: Muestra el desempeño de los cursos dictados tomando en
cuenta los siguientes parámetros:
-
Número de estudiantes que han asistido a los eventos de capacitación.
-
Porcentaje de estudiantes retirados.
-
Porcentaje de alumnos con nota menor a 7.
-
Porcentaje de estudiantes que han recibido descuento por prontopago.
-
Porcentaje de estudiantes que han recibido algún tipo de descuento.
-
Porcentaje de estudiantes con convenio con el CEC.
-
Porcentaje de estudiantes que han sido becados.
-
Nota promedio.
-
Porcentaje de fidelidad de los estudiantes con respecto a los cursos de
capacitación ofertados.
2. Evaluación Instructor: Muestra un listado de los instructores que prestan sus
servicios al CEC desplegados en orden descendente de acuerdo a la
evaluación obtenida por cada uno de ellos, además se incluye los ingresos
económicos generados por instructor y el número de cursos dictados por cada
uno.
3. Nivel de Satisfacción: Muestra el nivel de satisfacción de los clientes que han
tomado los cursos ofertados, dicho nivel ha sido obtenido en base al promedio
de las evaluaciones totales efectuadas. Además se muestra el valor objetivo,
el porcentaje de crecimiento del nivel de satisfacción y el logro alcanzado.
97
4. Número de Cursos: Muestra el número total de eventos de capacitación
dictados, así como también el número de cursos objetivo en base al cual se
determina el porcentaje de crecimiento de cursos dictados y el logro
alcanzado.
5. Número de horas capacitación: Muestra el número total de horas de
capacitación que se han dictado, el número de horas objetivo, el porcentaje
de crecimiento que se ha producido y el logro alcanzado.
6. Ingresos Económicos: Muestra los ingresos económicos totales que han
generado los eventos de capacitación dictados, el ingreso económico trazado
como objetivo para cada período de tiempo en base al que se determina el
porcentaje de crecimiento alcanzado y el logro de la CCC.
7. Número de participantes: Muestra la cantidad de participantes ó número de
alumnos que han tomado los eventos de capacitación ofertados por el CCC,
se muestra también un número referencial de participantes en base a los
cuales se han calculado
el porcentaje de crecimiento del número de
participantes y el correspondiente logro.
8. Evaluación cursos: Muestra las calificaciones totales desglosados por cada
ítem de las evaluaciones finales de los cursos dictados, con las cuales se
puede determinar la tendencia de los parámetros de evaluación.
2.6 PRUEBAS
Una vez que se ha implantado el datamart en el servidor de la CCC, se procedió a
realizar las pruebas[22] con el Coordinador de Capacitación y Consultoría. Las
pruebas se han dividido en dos categorías:
2.6.1
[22]
Pruebas de validación de requerimientos
Guía de Productos para Crear una Solución Data warehouse Completa
98
Permite verificar la consistencia de datos y visualización de resultados[20] entre el
reporte de seguimiento de indicadores mensuales que actualmente utiliza la CCC
y los reportes obtenidos por el del datamart.
a. Resultado esperado:
-
Los resultados generados por el datamart deben coincidir con los
resultados mostrados en el reporte de seguimiento de indicadores
mensuales obtenido por el Coordinador de la CCC para cada indicador
establecido.
-
El cuadro de resumen general debe reflejar el estado de cada uno de los
indicadores a través de colores ó símbolos que lo represente.
-
El reporte debe mostrar la meta para cada año y el logro obtenido para
cada indicador de interés.
-
Las tablas de contenido deben tener la opción de abrir o desglosar los
resultados, de modo que permitan un análisis mas granular de la
información.
-
El gráfico debe evidenciar a simple vista la evolución de los indicadores a
través del tiempo y además debe mostrar los valores correspondientes.
-
Debe existir consistencia entre los datos presentados en los resúmenes y
su correspondiente gráfico.
b. Resultado obtenido:
-
Los resultados obtenidos por el datamart son muy semejantes a los
obtenidos por el Coordinador de Capacitación. Existen datos que varían
levemente debido a que el datamart controla automáticamente rangos y
promedios definidos, mientras que el Coordinador realiza el control de los
datos de manera manual.
-
Los reportes obtenidos por el datamart muestran solamente valores totales
de los indicadores ordenados por orden de prioridad y no muestran sus
estados mediante algún símbolo o color descriptivo.
[20]
Generalidades y patrones de desarrollo de datamarts
99
-
El cuadro de resumen anual muestra únicamente los totales de cada
indicador de rendimiento.
-
El grafico solamente muestra datos agrupados por tipo de curso y año,
careciendo de valores para cada dato mostrado.
-
Existe coincidencia entre los datos mostrados en las tablas de resumen y
su correspondiente gráfico.
c. Procedimiento de corrección:
-
Para el control de rangos de las evaluaciones, se han tomado como válidas
aquellas realizadas a partir del año 2005, puesto que en años anteriores
las evaluaciones sobrepasan el valor máximo de 4. En los casos en los que
fue necesario, se recalculo el promedio de las evaluaciones para obtener
datos confiables.
-
A más de los valores totales de los indicadores, se agregaron las columnas
Meta, Crecimiento y Cumplimiento.
-
Para los mostrar el grado de cumplimiento de los indicadores se han
considerado intervalos de tiempo anual, semestral, trimestral, bimestral y
mensual para facilitar el seguimiento de los resultados en los reportes.
-
Los gráficos han sido complementados ubicando el valor de los indicadores
a través del tiempo. En los casos en que la legibilidad de los datos no sea
óptima se omiten los valores.
2.6.2
Pruebas Funcionales
2.6.2.1 Pruebas de extracción, transformación y carga
a. Resultado Esperado:
La ejecución del paquete ETL debe llevarse a cabo sin ningún inconveniente
en las dos etapas de carga definidos, además no deberá existir duplicación de
datos en ninguna dimensión y tabla de hechos.
b. Resultado Obtenido:
100
-
Primera Etapa: el proceso de extracción, transformación y carga de los
datos transaccionales e históricos de la base de datos SISCEC hacia la
base de datos dmTransformacion se ha realizado satisfactoriamente, tal
como se muestra en la figura 45.
-
Segunda Etapa: Una vez migrados los datos a la base de datos intermedia,
la segunda etapa de carga de datos se ha llevado a cabo con éxito, así
como se muestra en la figura 46.
Figura 45: Extracción, transformación y carga desde la base de datos SISCEC a la base de datos
dmTransformacion
101
Figura 46: Extracción, transformación y carga desde la base de datos dmTransformacion a la base
de datos dmCCC.
2.6.2.2 Prueba de refrescamiento de datos
a. Resultado Esperado:
El proceso de refrescamiento de datos debe realizarse de manera satisfactoria
de acuerdo al período representativo17 que maneja la CCC.
b. Resultado Obtenido:
En la ejecución del proceso de refrescamiento se presentó un error de
desbordamiento numérico sobre el campo tot_ingresos_cur de la tabla de
hechos FACT_RENDIMIENTO.
c. Procedimiento de Corrección:
17
Periodo representativo: periodo en el cual el flujo de información
organización.
tiene alta incidencia para la
102
Se realizó la conversión del tipo dato a cargar sobre el atributo
tot_ingresos_cur de la tabla de hechos FACT_RENDIMIENTO, mediante el
casting del mismo.
2.6.2.3 Pruebas de seguridad
El acceso a los reportes por parte del Coordinador y Subcoordinadores de la CCC
debe
realizarse
de
acuerdo
los
esquemas
de
seguridad
establecidos
anteriormente.
a. Resultado Esperado
Para controlar el acceso a los reportes proporcionados por el administrador de
reportes la solución se han tomado en cuenta dos consideraciones:
-
El usuario del sistema deberá acceder a los reportes que le correspondan a
su perfil, a través del componente módulo de seguridades mostrado en la
figura 47.
-
El usuario accederá a los reportes no debe tener conocimiento de la
ubicación de los reportes (ruta) para su posterior acceso mediante el uso
de su URL a través del navegador.
b. Resultado Obtenido
Los reportes son visualizados mediante el administrador de reportes
SEG_CEC de acuerdo a los perfiles de usuario establecidos, tal como se
muestra en la figura 48.
103
Figura 47: Pantalla de inicio de sesión del administrador de reportes SEG_CEC
Figura 48: Reporte de visualización del indicador de satisfacción del cliente
2.6.2.4 Pruebas de rendimiento del sistema
104
Haciendo uso del Monitor de Sistema que ofrece Windows Server 2003 se ha
creado un registro de rendimiento del sistema, en el cual se han definidos los
siguientes contadores:
-
Páginas por segundo.
-
Longitud media de cola en disco.
-
Porcentaje de tiempo de procesador.
-
Porcentaje de tiempo de disco.
-
MBytes disponibles.
-
Asignaciones de bloque paginado.
a. Resultado Esperado
Durante el proceso de carga de datos, se espera que el servidor asignado por
parte de la CCC para lojar nuestro datamart funcione adecuadamente y que
los contadores definidos en el monitor del sistema se mantengan en los
parámetros normales.
b. Resultado Obtenido
Luego de realizar el proceso de carga de datos se pudo observar que se
presentaron valores altos para los contadores de porcentaje de tiempo de
procesador y porcentaje de tiempo de disco, tal como se muestra en la figura
49.
Los valores para los contadores mencionados es alto durante el proceso de
refrescamiento de información al datamart, por un tiempo aproximado de 1
minuto, por lo tanto el rendimiento del servidor del datamart cubre las
necesidades de procesamiento del datamart.
c. Procedimiento de corrección
105
Para minimizar el impacto que produce la carga de datos en procesador y
disco, se recomienda acortar los tiempos de refrescamiento de datos, de esta
forma se tendrá una menor cantidad de información a procesar.
Figura 49: Evaluación de rendimiento del Servidor de datamart
2.6.3
Despliegue
2.6.3.1 Instalación inicial del datamart
Para la instalación inicial y puesta en marcha del datamart fue necesario crear un
manual de instalación y configuración descrito en el anexo A
2.6.3.2 Capacitación a los usuarios del datamart
Debido a que el CEC cuenta con una certificación a la calidad, fue necesario crear
un plan de capacitación para los usuarios del sistema con el apoyo de la
Coordinación de Calidad y Talento Humano, para de esta manera encaminar a la
mejora de la satisfacción de los clientes pero sin perder de vista los objetivos
106
empresariales de la organización en base al uso adecuado del sistema y a la
interpretación adecuada de los resultadas obtenidos.
Este plan de capacitación fue desarrollado en base a los siguientes parámetros de
evaluación:
-
Aprendizaje: Permite evaluar la capacidad de la aplicación para permitir el
aprendizaje del usuario.
-
Navegabilidad: Permite evaluar la facilidad de exploración y navegación que
tiene el usuario a través del sistema.
-
Interpretación de resultados: permite evaluar la interpretación de resultados
obtenidos y generados en gráficos y tablas.
-
Lineamiento: Permite evaluar el lineamiento de los requerimientos solventados
con respecto a los indicadores de medición descritos en el
manual de
procesos de calidad del CEC.
De acuerdo a la encuesta realizada a diversos usuarios del datamart se obtuvieron
los siguientes resultados:
APRENDIZAJE
10%
20%
ACEPTACION
RECHAZO
NEUTRAL
70%
Figura 50: Porcentaje de aceptación en aprendizaje
107
NAVEGABILIDAD
0%
ACEPTACION
RECHAZO
NEUTRAL
100%
Figura 51: Porcentaje de aceptación en navegabilidad
INTERPRETACION DE RESULTADOS
0%
28%
ACEPTACION
RECHAZO
NEUTRAL
72%
Figura 52: Porcentaje de aceptación en interpretación de resultados
LINEAMIENTO
10%
20%
ACEPTACION
RECHAZO
NEUTRAL
70%
Figura 53: Porcentaje de aceptación en lineamiento
108
De los resultados obtenidos, podemos concluir:
-
La figura 50, muestra que el 80% de las personas encuestadas aceptan haber
aprendido como utilizar correctamente el producto.
-
La figura 51, muestra que el 100% de las personas encuestadas aceptan que
el sistema tiene una alta capacidad de navegabilidad y fácil control por parte
del usuario.
-
La figura 52, indica que el 72% de las personas encuestadas interpretaron
correctamente los resultados desplegados por el sistema tanto en forma
gráfica como en datos, sin embargo el 28% de los encuestados presentaron
problemas debido a que existía confusión entre los gráficos generados en los
diferentes períodos de tiempo (anual, semestral, trimestral, bimestral y
mensual).
-
La figura 53, indica que el 70% de los encuestados está de acuerdo a que los
indicadores generados en los reportes están alineados con los indicadores
descritos en el cuadro de mando integral señalada en la planificación
estratégica del CEC.
2.6.4
Revisión y expansión
2.6.4.1 Requerimientos limitados por el modelo de datos del datamart
Para potenciar el uso del datamart dentro de la CCC, se han considerados los
siguientes aspectos:
-
Complejidad en la estandarización de información: existen consultas que no se
consideraron en el ámbito inicial de implementación del datamart debido la
complejidad para estandarizar
datos almacenados en la fuente de datos
SISCEC tales como:
o Número de quejas presentadas en los diferentes cursos.
o Número de sugerencias presentadas.
109
-
Consultas empresariales limitadas por el modelo de datos inicial del datamart:
Las consultas proporcionadas a la CCC están limitadas a cinco indicadores de
rendimiento principales, los cuales son:
o Nivel de satisfacción del cliente.
o Número de estudiantes que han tomado un curso.
o Ingresos económicos.
o Número de horas dictadas.
o Número de cursos dictados.
2.6.4.2 Identificación de otras fuentes de datos externas que no han sido tomadas en
cuenta en el ámbito inicial
Para incluir información financiera al datamart, será necesaria la inclusión de la
fuente de datos SISFAC, la misma que contiene información referente a los
ingresos que recibe el CEC por concepto de cursos dictados.
2.6.4.3 Potenciación y mejoramiento del modelo de datos del datamart
Para la potenciación y mejoramiento del sistema, es conveniente considerar los
siguientes aspectos:
-
Implementar de forma estandarizada la información que generan las consultas
que no pudieron ser incluidas en el ámbito inicial del datamart.
-
Generación de las metas de los indicadores directamente en la base de datos
y no en horas de cálculo como actualmente se lo realiza.
-
Normalización y mejoramiento del modelo de la base de datos transaccional,
se controle el flujo de información de forma mas adecuada.
2.6.4.4 Coordinaciones no atendidas
En la tabla 22 se detalla las coordinaciones que no se han tomado en cuenta en la
implementación inicial del datamart, debido a que no se encontraron fuentes de
110
datos para el indicador de rendimiento señalado, sin embargo ofrecen una
oportunidad de mejora.
COORDINACION
LINGÜÍSTICA
CALIDAD Y
TALENTO
HUMANO
FINANCIERO ADMINISTRATIVO
DESARROLLO
TECNOLÓGICO
ÁREA CLAVE DE RESULTADO
CAPACITACION A LA MEDIDA
INDICADOR
Índice de satisfacción
Nivel de mejoramiento en procesos
Tasa
de
inconformidades
y
observaciones en auditorias.
TALENTO HUMANO PROFESIONAL Número de horas de capacitación anual
Y CALIFICADO
Nivel de desempeño.
Nuevos cursos y programas abiertos.
MARKETING
Nivel de fidelización de clientes.
PRODUCTIVIDAD INTERNA
Reporcesos y errores.
Tasa de rotación de personal.
CLIMA LABORAL
Porcentaje de satisfacción con el clima
laboral.
Tasa de ejecución presupuestal por área
CUMPLIMIENTO PRESUPUESTAL
y total.
SUPERÁVIT
Superávit.
Nivel de satisfacción con la tecnología.
TECNOLOGÍA AVANZADA
Tasa de actualizaciones realizadas.
Tasa de automatización de procesos.
Tabla 22: Coordinaciones no atendidas
111
CAPITULO 3
CONCLUSIONES Y RECOMENDACIONES
3.1 Conclusiones
-
La metodología propuesta combina la gestión de proyectos propuesta en la
metodología de Harjinder y Prakash y los ciclos iterativos e incrementales que
incluyen entregables establecidos en la metodología propuesta por el SAS
Institute, sin perder el enfoque rápido de desarrollo.
-
La metodología propuesta para la implementación del datamart nos permite
aprovechar las mejores prácticas de las metodologías propuestas por
Harjinder – Prakash y
SAS Institute, con lo cual se cubren aspectos
necesarios para alcanzar una solución efectiva, mantenible y escalable, de
forma independiente de la plataforma tecnológica y de las herramientas de
desarrollo que se utilicen para su implementación.
-
La metodología de desarrollo en espiral permitió establecer de manera rápida
los requerimientos de la implementación inicial del datamart, brindando así
información clara y oportuna.
-
Sí bien en la actualidad existen diversas herramientas para el desarrollo de
datamarts, tanto propietario como software libre, es importante considerar
aquella que se integre adecuadamente a la infraestructura existente en la
empresa en la cual se va a implementar la solución.
-
La implementación del datamart permitió integrar los datos transaccionales e
históricos con los que dispone la CCC de forma consolidada, por lo cual la
información estratégica requerida por la coordinación se encuentra a plena
112
disponibilidad, dejando de lado el acceso a la base de datos transaccional
para su obtención.
-
La estrategia de implementación bottom-up escogida en nuestra metodología,
permitió solventar de manera satisfactoria los requerimientos de información
más urgente de la CCC, lo cual sienta el precedente para que se implementen
datamarts para el resto de coordinaciones utilizando la misma estrategia.
-
Para el análisis y diseño del datamart para la CCC fue necesario identificar los
procesos de medición que se llevan a cabo durante el ciclo académico de un
curso o evento de capacitación, de acuerdo a lo establecido en el Proceso
Productivo de la CCC.
-
La selección adecuada de las estrategias de carga y refrescamiento de
información garantizan la confiabilidad y disponibilidad total que requiere en el
futuro el uso del datamart implementado.
-
Los reportes generados, han sido elaborados tomando en cuenta los
indicadores de rendimiento de mayor importancia para la CCC y cuya
información se puede analizar a través de los filtros de consulta establecidos
para el efecto.
-
El plan de capacitación a los usuarios llevado a cabo permite determinar que
el datamart construido alcanzó niveles de aceptación satisfactorios en los
parámetros de evaluación definidos.
-
La fase de revisión y expansión permite ampliar el alcance inicial del datamart
con lo cual se podrán cubrir requerimientos
Coordinación de Capacitación y Consultoría.
no atendidos dentro de la
113
-
Para la CCC el aspecto mas importante fue consolidación automática de
información en periodos calendarizados, ya que anteriormente estos se los
realizaba de forma manual con un retraso de dos meses cada uno.
-
De acuerdo al análisis realizado en el plan de capacitación de usuarios, se
pudo determinar, que la satisfacción de los mismos debe ser independiente de
la metodología que se siga.
114
3.2 Recomendaciones
-
Es recomendable que la CCC reestructure los procesos mediante los cuales
se llevan a cabo el registro de los cursos o eventos de capacitación que se
ofrecen, puesto que la información no tiene un alto grado de verificación.
-
Se recomienda a la CCC establecer tiempos de refrescamiento de datos al
final de cada cierre en el ciclo de programación de cursos o eventos de
capacitación, para garantizar la carga adecuada de información del datamart.
-
Se recomienda tomar en cuenta el modelo de datos establecido para la base
de datos intermedia dmTransformacion como referencia para un posible
proceso de reingeniería que se pueda llevar a cabo.
-
Es recomendable definir los procesos que se llevan a cabo en la CCC de tal
forma que se puedan aprovechar los beneficios que brinda el datamart
implementado.
-
Definir el rango correcto o relativo de los valores entre los cuales se
encontrarán las evaluaciones realizadas a los cursos o eventos de
capacitación generados, puesto que existen valores que no pudieron ser
tomados en cuenta.
-
Para la visualización de los reportes de los indicadores de rendimiento se
recomienda acceder desde el administrador de reportes puesto que se
garantiza el acceso seguro a la información generada en base a perfiles de
usuario definidos.
-
Incorporar los datos almacenados en archivos planos a fuentes más confiables
de almacenamiento como la base de datos transaccional.
115
-
Se debe considerar a futuro la posibilidad de desarrollar datamarts para las
demás coordinaciones con las que cuenta el CEC, con lo cual se lograría
obtener una solución integral para todos los procesos de negocio de la
organización (data warehouse).
116
REFERENCIAS BIBLIOGRÁFICAS
LIBROS Y MANUALES
[1] Centro de Educación Continua - CEC. Procedimiento Proceso Productivo
“Capacitación y Consultoría”, Código: CCC-PP-01, versión 05.
[2] Cuadro de mando Integral, Perspectiva Cliente Usuario del Manual de Proceso
de Planificación Estratégica del CEC.
[3] INMON W.H, Building the Data warehouse, Second Edition 1996.
(Evaluación de sistemas de soporte de decisión, medio ambiente del data
warehouse, diseño, granularidad, tecnología, sistemas de información
ejecutiva y Data warehouse).
[4] JARKE Matthias, LENZERINI Maurizio, VASSILIOU Yannis, VASSILIADIS
Panos. Fundamentals of Data warehouses.
(Componentes, Diseño, Estructura Física, Repositorios, Integración de
fuentes, Mantenimiento de Metadatos, Modelos de datos Multidimensionales,
OLAP).
[5] KIMBALL Ralph; ROSS, Margy; “The Datawarehouse Toolkit, Segunda
Edición.
(Técnicas Prácticas para la construcción de un Datawarehouse. Definición
OLAP, Casos de Estudio).
[6] STANEK R. William. SQL Server 2005: Manual del administrador. I Edición.
México, 2006.
(Integration Services, administración de datos, esquemas, tablas, índices,
seguridades, afinamiento y monitoreo del servidor, configuraciones).
117
[7] MICROSOFT Oficial Course. 2780A Maintaining a Microsoft SQL Server
Server 2005 Database.
(Integration Services, administración de datos, esquemas, tablas, índices,
seguridades, afinamiento y
monitoreo del servidor, configuraciones. Guía
Práctica).
[8] HARJINDER S. GILL, PRAKASH C. Rao. Datawarehousing. La Integración de
la Información para la mejor toma de decisiones.
[9] CONNOLLY Thomas, BEGG Carolyn. DATABASE SYSTEMS. A practical
Approach to Design, Implementation and Management.
Segunda Edición.
Addison Wesley.
PÁGINAS INTERNET
[10]
“Data Warehousing Implementation with the SAS System”; SAS Institute
Inc; Paper 132.
http://www2.sas.com/proceedings/sugi22/DATAWARE/PAPER132.pdf
[11]
“SAS Rapid Warehousing Methodology”; SAS e-Intelligence; Paper
sas43093_0501.
http://www.rrc.si/papers/sas43093_0501.pdf
[12]
“The SAS Methodology for Solutions Development”; SAS Institute Inc;
Paper wp_3562.
http://www.sas.com/apps/forms/index.jsp;jsessionid=5CBA9F13B3C2F577F
BD1A2DA47E9B329.tomcat2?id=wp&cid=3562
[13]
Diseño de un datawarehouse: estrella y copo de nieve.
http://informationmanagement.wordpress.com/2007/11/19/diseno-de-undata-warehouse-estrella-y-copo-de-nieve
118
[14]
MICROSOFT: Documentación de SQL Server 2005
http://technet.microsoft.com/es-es/library/ms203721.aspx
[15]
MICROSOFT: SQL Server Integration Services
http://technet.microsoft.com/es-es/library/ms141026.aspx
[16]
MICROSOFT: SQL Server Analysis Services
http://technet.microsoft.com/es-es/library/ms175609.aspx
[17]
MICROSOFT: SQL Server Reporting Services
http://technet.microsoft.com/es-es/library/ms159106.aspx
[18]
An introduction to SQL Server data warehousing concepts
http://searchsqlserver.techtarget.com/video/0,297151,sid87_gci1354593,00.
html?track=NL-465&ad=713024&asrc=EM_USC_8324042&uid=8602382
[19]
Fases de Implantación de un Datawarehouse
http://www.dataprix.com/fases-de-implantacion-de-un-data-warehouse
[20]
Generalidades y patrones de desarrollo de datamarts.
http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=66640714&iCveNu
m=9392
[21]
Fundamentos de Data warehouse
http://afrodita.unicauca.edu.co/~ecaldon/docs/bd/fundamentosdedatawareh
ouse.pdf
[22]
Guía de Productos para Crear una Solución Data warehouse Completa.
http://iesbaixcamp.org/~jcuesta/apunts/oracle/oracle/DataWarehouse.pdf
[23]
Características de Reporting Services.
http://msdn2.microsoft.com/es-es/library/ms159273.aspx
119
[24]
Business Intelligence and Data Warehousing in SQL Server 2005
http://www.microsoft.com/technet/prodtechnol/sql/2005/dwsqlsy.mspx#ED5
AE
[25]
SQL Server Reporting Services Fast Guide
http://searchsqlserver.techtarget.com/generic/0,295582,sid87_gci1172656_
mem1,00.html?track=NL-420&ad=720757&asrc=EM_NLT_8981330
[26]
Desarrollo de un datamart de información académica
http://biblioteca.usac.edu.gt/tesis/08/08_7974.pdf
[27]
INFORMATION MANAGMENT: DATA QUALITY
http://www.information-management.com/channels/data_quality.html
[28]
Microsoft: Best Practices for the Data Warehouse
http://msdn.microsoft.com/en-us/library/bb219347.aspx
[29]
INFORMATION MANAGMENT: Best Practices for Data Warehouse
Database Developers
http://www.information-management.com/issues/20011201/4340-1.html
[30]
IEEE: Best Practices in Data Warehousing to Support Business Initiatives
and Needs
http://www2.computer.org/plugins/dl/pdf/proceedings/hicss/2004/2056/08/20
5680223a.pdf?template=1&loginState=1&userData=anonymousIP%253A%253A190.152.169.158
[31]
OPEN METHODOLOGY: ETL Best Practices Deliverable Template
http://mike2.openmethodology.org/wiki/ETL_Best_Practices_Deliverable_T
emplate
120
ANEXOS
121
ANEXO A
MANUAL DE INSTALACION DEL DATAMART
122
ANEXO A
MANUAL DE INSTALACION DEL DATAMART
INTRODUCCIÓN:
El presente Manual está dirigido a la(s) persona(s) de la Coordinación de
Desarrollo Tecnológico que se encargará(n) de la puesta en marcha del datamart
para la Coordinación de Capacitación y Consultoría del CEC versión 1.0 en toda
su extensión; principalmente se dirige a los usuarios con perfil Administrador.
Este documento explicará de una manera más técnica el proceso de instalación
del sistema.
REQUERIMIENTOS:
1. de Software:
1.1. Servidor Datamart:
-
Sistema Operativo: Windows XP, 2003 Server o Superior
-
Internet Information Service (IIS).
-
Microsoft SQL Server 2005 + (Agent Service)
-
Microsoft SQL Server 2005 Analysis Services.
-
Microsoft SQL Server 2005 Integration Services.
-
Microsoft SQL Server 2005 Reporting Services
-
Internet Explorer 6 o superior.
-
DOT NET Framework 3.5, lo puede encontrar en la página de instalación,
en la sección pre-requisitos.
1.2. Cliente Datamart:
-
Sistema Operativo: Windows XP o superior
123
-
Explorador Web
2. de Hardware:
2.1. Servidor Datamart
-
Procesador Intel Duo Core 2.8 GHz de 64 bits
-
Memoria RAM de 2 GB o superior
-
Espacio libre en Disco Duro de 500 GB
-
Mouse y teclado estándar
-
Monitor de 14’ con resolución de 1280 x 760 píxeles y color verdadero de
32 bits o superior
-
Interface de Red Ethernet
2.2. Cliente Datamart:
-
Procesador Pentium IV o superior
-
Memoria RAM de 1GB o superior
-
Espacio libre en Disco Duro de 10 GB
-
Mouse y teclado estándar
-
Monitor de 14’ con resolución de 1280 x 760 píxeles y color verdadero de
32 bits o superior
-
Interface de Red Ethernet
124
CONFIGURACIÓN E INSTALACIÓN
1. Creación del usuario USRCEC
Previamente a la instalación del sistema, es necesario crear en el servidor un
usuario con permisos de Administrador que tenga acceso a la base de datos tanto
del datamart como de Reporting Services y al Sitio Web en donde se realizará la
publicación de reportes y el módulo de Administración y Seguridad llamado
SEG_CEC, realizando los siguientes pasos:
-
Acceder al Administrador del equipo.
-
Seleccionar Usuarios Locales y Grupos, abrir la carpeta usuarios y en el menú
contextual seleccionar Usuario Nuevo.
125
-
-
Ingresar en la ventana Usuario Nuevo, la siguiente información, por default:
USUARIO:
USRCEC
CONTRASEÑA:
dm09okmCEC
Ingresar a las propiedades del usuario USRCEC desde el menú contextual
126
-
Seleccionar la pestaña Miembro de
y agregar el usuario al grupo
Administradores.
-
Finalmente iniciar la sesión en el sistema operativo con el usuario creado.
2. Instalación de Fuentes de Datos y Sitio Web
2.1. Instalación de la Base de Datos dmTransformacion:
Para la instalación de la base de datos dmTransformacion, descargamos el
archivo correspondiente desde la página de instalación segmento fuentes de
datos, opción dmTransformación
127
El instalador automáticamente solicitará el servidor en donde se debe crear
la base de datos dmTransformacion, por defecto se lo hará en el servidor
local.
2.2. Instalación de la Base de Datos dmCCC:
Para la instalación de la base de datos dmCCC, descargamos el archivo
correspondiente desde la página de instalación segmento fuentes de datos,
opción dmCCC.
El instalador automáticamente solicitará el servidor en donde se debe crear la
base de datos dmCCC, por defecto se lo hará en el servidor local.
128
2.3. Instalación de la Base de Datos dmSeguridad y Sitio Web SEG_CEC:
Para la instalación de la base de datos dmSeguridad, descargamos el archivo
correspondiente desde la página de instalación segmento fuentes de datos,
opción dmSeguridad, Sitio Web SEG_CEC.
El instalador automáticamente solicitará el servidor en donde se debe crear la
base de datos dmSeguridad, por defecto se lo hará en el servidor local.
129
Adicionalmente se instalará el directorio virtual SEG_CEC en el Sitio Web
Predeterminado del servidor local, en el Internet Information Server.
Para verificar la instalación del Sitio Web, ingresamos al Administrador de
Internet Information Services y verificamos que el directorio virtual SEG_CEC
se haya creado correctamente.
En las propiedades del directorio virtual SEG_CEC, podemos verificar lo
siguiente:
-
En la pestaña Directorio Virtual, verificar que se encuentre habilitado el
nombre de la aplicación
130
-
En la pesaña Seguridad de Directorios, Autenticación y Control de Acceso,
hacer clic en el botón Modificar y verificar que se encuentre marcada la
opción Habilitar el Acceso Anónimo, el cual deberá contener el usuario
USRCEC y contraseña por default creado previamente y en el bloque
Acceso Autenticado deberá estar marcada la opción Autenticación de
Windows Integrada.
Si no se desea ejecutar el Sitio Web con el usuario predeterminado será
necesario especificar en este sitio el usuario con el que se desee trabajar.
131
2.4. Instalación del archivo Indicadores.xls
Descargar el archivo desde la página de instalación sección Fuentes de datos
y lo ubicamos en la ruta C:\indicadoresCCC del servidor local o en una ruta
relativa. Esta ruta deberá ser especificada en la configuración del paquete
DTSX.
2.5. Configuración del Servidor Vinculado SISCEC
Una vez finalizada la instalación de las bases de datos del sistema y el módulo
de administración y seguridad SEG_CEC, es necesario crear el Servidor
Vinculado (Link Server) a la base de datos SISCEC histórica desde el servidor
del datamart dmCCC con el nombre SISCEC (si no se dispone de la base de
datos SISCEC se puede obtener un backup desde la página de instalación en
el segmento Componentes), realizando los siguientes pasos:
-
Ingresar al SQL Server Managment Studio y nos conectamos a la servidor
del datamart donde fue instalado.
132
-
Seleccionar la carpeta Objetos del Servidor, Servidores Vinculados (Link
Server) y desde el menú contextual Agregar Servidor Vinculado.
.
-
En la ventana Nuevo Servidor Vinculado, en la página General, realizar la
configuración, teniendo en cuenta que en el campo Origen de datos el
nombre del servidor puede cambiar.
133
-
En la pestaña Seguridad, establecer las credenciales de acceso al servidor
de la base de datos SISCEC proporcionado por la Coordinación de
Desarrollo Tecnológico.
-
En la pestaña Opciones del servidor, habilitar la entrada y salida de RPC
2.6. Configuración del paquete DTS.
Descargar desde la página de instalación el paquete pckDMCCC desde el
segmento Componentes.
134
Configurar el paquete DTS en el servidor de base de datos, como una tarea
calendarizada periódica en el Agente de SQL Server, para lo cual es necesario
verificar que el servicio se encuentra levantado, realizando los siguientes
pasos:
-
Crear un nuevo trabajo haciendo clic derecho sobre la carpeta Trabajos
-
En la pestaña general ingresar el nombre del trabajo y el propietario.
135
-
Crear un nuevo paso en la pestaña pasos
-
Ingresar el nombre del paso,
136
-
Seleccionar el tipo de ejecución del paquete:
-
Paquete SQL Server Integration Services: en donde seleccionamos la
ubicación del DTS
-
Transact SQL utilizando el comando dtexec: para lo cual es necesario
habilitar el procedimiento almacenado xp_cmdshell que se encarga de
ejecutar comandos del sistema operativo a través de la Configuracion de
Superficie de SQL Server. Para generar el comando de ejecución del DTS
se puede utilizar la herramienta gráfica de dtexec conocida como
DTEXECUI.
-
Verificar los orígenes de datos de ser necesario realizar los cambios de
acuerdo al Administrador de Conexión independientemente del tipo de
ejecución que se realice.
137
-
Finalmente crear uno nueva programación para ejecutar el DTS de forma
periódica o bajo demanda.
2.7. Publicación de Reportes
Descargar desde la página de instalación, Reportes desde el segmento
Componentes.
138
Ingresar a la solución y seleccionar las propiedades de la solución.
Ingresar los datos del servidor de aplicaciones web configurado y especificar el
nombre del sitio web predeterminado para la publicación de reportes para
Reporting Services.
Finalmente hacer clic nuevamente sobre la solución y seleccionamos
Implementar.
139
ACCESO Y CONFIGURACIÓN DEL SISTEMA
Para acceder por primera vez al sistema, debemos hacerlo con las siguientes
credenciales:
-
Usuario:
ADMINISTRADOR
-
Clave:
[email protected]
Hacer clic en el menú Sistema, Administración y se despliega la pantalla de
Administración de Usuarios y Perfiles
140
En la pestaña Usuario, podemos crear, gestionar, definir perfiles y establecer
contraseñas a los usuarios del sistema.
141
En la pestaña Perfil, administrar las opciones definidas en los perfiles de acceso
al sistema.
Adicionalmente podemos crear varios perfiles según como sea definido. Por
defecto, las perfiles ingresados y habilitados actualmente en el sistema son las
que fueron definidas en el documento de Análisis de Requerimientos.
142
En la pestaña Opción podemos administrar menús, submenús y las opciones que
tiene actualmente el sistema.
Adicionalmente podemos crear nuevas opciones estableciendo rutas de acceso
específicas.
Si se desea crear un nuevo reporte publicado en el servidor de Reporting Service
se deberá ingresar la siguiente ruta:
143
~/pages/frmReporting.aspx?reporte=NombreDelReporte
Por defecto, las opciones ingresadas y habilitadas actualmente en el sistema son
las que fueron definidas en el documento de Análisis de Requerimientos.
144
ANEXO B
MODELO RELACIONAL DE LA BASE DE DATOS INTERMEDIA
(dmTransformacion)
float
float
ID_TIPO_CURSO
int
<pk>
DETALLE_TIPO_CURSO varchar(60)
AUX_TIPO_CURSO
int
<pk>
ID_PROG
NOMBRE_PROGRAMA varchar(60)
int
<pk>
float
float
float
FK_AUX_DETA_REFERENCE_AUX_EVAL
FK_AUX_DETALLE_CURSO_AUX_CURSO
nvarchar(50)
float
float
float
float
AUX_CURSO
float
ID_CUR
int
<pk>
float
ID_TIPO_CURSO
int
<fk1>
float
ID_PROG
int
<fk2>
float
ID_GRUPO_CLIENTE int
float
NOMBRE CUR
varchar(256)
float
float
float
float
float
float
float
float
FK_AUX_CURS_REFERENCE_AUX_PROG
float
FK_AUX_CURS_REFERENCE_AUX_TIPO
float
float
float
float
float
float
float
AUX_PROGRAMA
float
AUX_EVALUACION
ID_EVALUACION
EVALUACION_EST
EVALUACION_COOR
EVALUACION_SCLIENTE
ENLACE_ARCHIVO
EVALUACION_4
EVALUACION_5
PROMEDIO
EVALUACION_EQ
MAS
FEM
RECSI
RECNO
EPUBLICA
EPRIVADA
PRENSA
REVISTAS
REFERENCIA
WEB
EMAIL
OTROS
MENOSV
ENTREV
ENTRET
MAST
MASC
EJECUTIVO
MEDIOS
OPERATIVO
OTRO
EVALUACION_SOFT
EVALUACION_RED
PROME_EQ
int
<pk>
int
<fk1>
int
datetime
datetime
float
text
varchar(200)
varchar(250)
varchar(100)
int
float
float
int
int
<fk2>
int
int
AUX_DETALLE_CURSO
ID_DETALLE_CUR
ID_CUR
DURACION_CUR
FECHA_INICIO_CUR
FECHA_FIN_CUR
COSTO_CUR
LUGAR_CUR
CONTENIDO_CUR
DESCRIPCION_HORARIO_CUR
DIAS_CUR
DURACION_DIAS_CUR
COSTO_HORA_CUR
COSTO_TOTAL_CUR
ID_EMPR
ID_EVA
ID_TIPO_CUR
ID_INS
TER varchar(20)
PG varchar(1)
AUX_INDICADOR
indicadorId
indicadorAnio
indicadorMes
indicadorNivelSatisfaccion
indicadorNumeroCurso
indicadorNumeroParticipantes
indicadorIngresos
indicadorHoras
int
<pk>
float
float
float
float
float
float
float
int
<pk>
int
char(65)
char(85)
char(15)
char(15)
char(15)
char(15)
char(15)
char(40)
char(45)
char(20)
ID_EVALUABLEF
int
EVF_TIPO
varchar(200)
EVF_DESCRIPCION varchar(200)
AUX_EVALUABLE
ID_EMPRESA
ID_TIPO
NOMBRE_EMPRE
DIRECCION_EMPRE
TELEFONO_EMPRE
RUC_EMPRE
TELEFONO1_EMPRE
TELEFONO2_EMPRE
FAX_EMPRE
EMAIL_EMPRE
REPRESENTANTE_EMPRE
TIPO_EMPRESA
AUX_EMPRESA
FK_AUX_ESTUDIANTE_AUX_EMPRESA
int
<pk,fk1>
int
<pk,fk2>
float
float
float
varchar(20)
varchar(5)
varchar(50)
int
varchar(50)
float
float
char(10)
AUX_ESTUDIANTE
char(10)
FK_AUX_CURSO_POR_ESTUDIANTE_AUX_ESTUDIANTE
varchar(50)
int
<pk>
ID_EST
float
ID_EMPRESA
int
<fk>
APELLIDO_EST
char(40)
NOMBRE_EST
char(65)
CI_EST
char(20)
TELEF_CASA__EST
char(12)
TELEF_OFICI_EST
char(12)
TELEF_CELULAR_EST
char(12)
DIRECCION_EST
char(65)
EMAIL_EST
char(47)
NOMBRES_COMPLETOS char(60)
NOMBRES
char(60)
GENERO
char(1)
AUX_POSIBLE_GENERO
ID_DETALLE_CUR
ID_EST
NOTA
ASISTENCIA
NOTA_PROGRAMA
Diploma
Parqueadero
Como
Id_saldo
Observacion
Descuento
Abono
Factura
Comprob
Factura1
FK_AUX_CURSO_POR_ESTUDIANTE_AUX_DETALLE_CURSO
Abono1
AUX_CURSO_POR_ESTUDIANTE
ANEXO B
MODELO RELACIONAL DE LA BASE DE DATOS INTERMEDIA (dmTransformacion)
145
146
ANEXO C
DICCIONARIO DE DATOS DE LA BASE DE DATOS INTERMEDIA
(dmTransformacion)
147
ANEXO C
DICCIONARIO DE DATOS DE LA BASE DE DATOS INTERMEDIA
(dmTransformacion)
AUX_CURSO: Entidad que almacena la descripción general de un curso.
CAMPO
ID_CUR
ID_TIPO_CURSO
ID_PROG
ID_GRUPO_CLIENTE
NOMBRE_CUR
TIPO DE DATO
INTEGER
INTEGER
INTEGER
INTEGER
VARCHAR
AUX_CURSO_POR_ESTUDIANTE:
LONGITUD
4
4
4
4
256
Entidad
DESCRIPCION
Identificador de curso.
Identificador de tipo curso.
Identificador de programación
Identificar de grupo de cliente
Nombre del curso.
que
almacena
los
datos
resultantes a la asistencia del estudiante al evento de capacitación.
TIPO
DE
DATO
INTEGER
INTEGER
FLOAT
LONGITUD
4
4
8
FLOAT
8
Diploma
VARCHAR
20
Parqueadero
VARCHAR
5
Como
VARCHAR
50
Id_saldo
INTEGER
4
Observacion
VARCHAR
50
Descuento
FLOAT
8
Abono
FLOAT
8
Factura
CHAR
10
CAMPO
ID_DETALLE_CUR
ID_EST
NOTA
ASISTENCIA
DESCRIPCION
Identificador de detalle curso.
Identificador de estudiante.
Nota del estudiante.
Porcentaje de asistencia del estudiante
al curso dictado.
Campo que indica si el diploma de
aprobación de curso ha sido emitido o
no.
Campo que indica si se ha asignado un
parqueadero o no.
Campo que indica el medio mediante el
cual se enteraron de los eventos de
capacitación.
Identificador de saldo a cancelar como
pago del curso tomado.
Campo
que
especifica
alguna
observación referente al estudiante que
ha tomado el curso.
Especifica el porcentaje de descuento
que ha obtenido el estudiante al tomar
el evento de capacitación.
Cantidad en dólares que el estudiante
abona como parte de pago del curso a
dictar.
Número de factura emitida por concepto
de pago del curso.
AUX_DETALLE_CURSO: Entidad que almacena los datos correspondientes a
la programación de un curso.
148
FECHA_FIN_CUR
COSTO_CUR
LUGAR_CUR
TIPO DE
DATO
INTEGER
INTEGER
INTEGER
DATETIM
E
DATETIM
E
FLOAT
TEXT
CONTENIDO_CUR
VARCHAR 200
DESCRIPCION_HORARIO_
CUR
VARCHAR 250
DIAS_CUR
VARCHAR 100
DURACION_DIAS_CUR
INTEGER
4
COSTO_HORA_CUR
FLOAT
8
COSTO_TOTAL_CUR
ID_EMPR
ID_EVA
ID_TIPO_CUR
ID_INS
FLOAT
INTEGER
INTEGER
INTEGER
INTEGER
8
4
4
4
4
CAMPO
ID_DETALLE_CUR
ID_CUR
DURACION_CUR
FECHA_INICIO_CUR
LONGITU
D
4
4
4
DESCRIPCION
Identificador de detalle de curso.
Identificador de curso.
Duración en horas del curso dictado.
8
Fecha de inicio del curso.
8
8
16
Fecha de fin de curso.
Costo del curso dictado.
Lugar en donde se dictó el curso.
Descripción general con relación al
curso dictado.
Descripción de los horarios en los
cuales de dictó un curso.
Día de la semana en los cuáles se
dictó un curso.
Número de días en los cuales se dictó
un curso.
Costo por hora correspondiente al
curso dictado.
Costo total del curso dictado.
Identificador de empresa.
Identificador de evaluación.
Identificador de tipo de curso.
Identificador de instructor.
AUX_EMPRESA: Entidad que guarda los datos básicos referentes a la
empresa que ha tomado ó solicitado un evento de capacitación.
CAMPO
TIPO
DATO
ID_EMPRESA
INT
4
Identificador de empresa.
ID_TIPO
INT
4
Identificador de tipo de empresa.
NOMBRE_EMPRE
CHAR
65
Nombre del cliente empresarial.
DIRECCION_EMPRE
CHAR
85
Dirección donde se encuentra ubicada la empresa.
TELEFONO_EMPRE
CHAR
15
Número telefónico de contacto.
RUC_EMPRE
CHAR
15
Número de RUC.
TELEFONO1_EMPRE
CHAR
15
Número telefónico de referencia como primer contacto.
TELEFONO2_EMPRE
CHAR
15
Número telefónico de referencia como segundo contacto.
FAX_EMPRE
CHAR
15
Número telefónico de fax.
EMAIL_EMPRE
CHAR
40
Dirección de correo electrónico de contacto.
REPRESENTANTE_EMPRE CHAR
45
TIPO_EMPRESA
20
Nombre del representante legal de la empresa.
Campo que especifica si la empresa es de tipo Pública y
Privada.
CHAR
DE
LONGITUD DESCRIPCION
AUX_ESTUDIANTE: Entidad que guarda los datos básicos referentes al
estudiante que toma un curso de capacitación.
149
ID_EMPRESA
TIPO DE
LONGITUD DESCRIPCION
DATO
INT
4
Identificador de Estudiante.
INT
4
Identificador de empresa.
APELLIDO_EST
CHAR
40
Apellidos del estudiante.
NOMBRE_EST
CHAR
65
CI_EST
CHAR
20
Nombres del estudiante.
Número de cédula de
estudiante.
TELEF_CASA__EST
CHAR
12
Número telefónico de domicilio.
TELEF_OFICI_EST
CHAR
12
Número telefónico de oficina.
TELEF_CELULAR_EST
CHAR
12
Número de celular.
DIRECCION_EST
CHAR
65
Dirección de residencia del estudiante.
EMAIL_EST
CHAR
47
NOMBRES_COMPLETOS CHAR
60
Dirección de correo electrónico de contacto.
Campo que contiene los nombres y
apellidos completos del estudiante.
GENERO
1
CAMPO
ID_EST
CHAR
identidad
del
Género del estudiante (M,F).
AUX_EVALUABLE: Entidad que almacena el ítem evaluable del curso dictado
organizado por género, medio de difusión,
recomendación curso, tipo de
institución, grupos de edad y nivel o cargo que desempenian los estudiantes.
CAMPO
TIPO DE DATO
LONGITUD
DESCRIPCION
ID_EVALUABLEF
INT
4
Identificador de evaluable.
EVF_TIPO
VARCHAR
200
Tipo de evaluable.
EVF_DESCRIPCION
VARCHAR
200
Descripción del evaluable.
AUX_EVALUACION: entidad que almacena el registro de las evaluaciones
realizadas a los cursos dictados.
TIPO DE
DATO
LONGITUD
INT
4
EVALUACION_EST
FLOAT
8
EVALUACION_COOR
FLOAT
8
EVALUACION_SCLIENTE
FLOAT
8
Identificador de evaluación.
Evaluación ponderada por
instalaciones
Evaluación ponderada por
organización y desarrollo
Evaluación ponderada por material
didáctico
NVARCHAR
100
Nombre del archivo de evaluación.
EVALUACION_4
FLOAT
8
Evaluación ponderada por instructor
EVALUACION_5
FLOAT
8
Evaluación ponderada por diseño
PROMEDIO
FLOAT
8
Evaluación total general
EVALUACION_EQ
FLOAT
8
MAS
FLOAT
8
Evaluación ponderada por equipos
Número de personas de género
masculino.
CAMPO
ID_EVALUACION
ENLACE_ARCHIVO
DESCRIPCION
150
FEM
FLOAT
8
RECSI
FLOAT
8
RECNO
FLOAT
8
Número de personas de género
femenino.
Número de personas que
recomendarían el curso.
Número de personas que no
recomendarían el curso.
EPUBLICA
FLOAT
8
Personas por empresa pública.
EPRIVADA
FLOAT
8
PRENSA
FLOAT
8
REVISTAS
FLOAT
8
REFERENCIA
FLOAT
8
WEB
FLOAT
8
EMAIL
FLOAT
8
OTROS
FLOAT
8
MENOSV
FLOAT
8
ENTREV
FLOAT
8
ENTRET
FLOAT
8
MAST
FLOAT
8
MASC
FLOAT
8
Personas por empresa privada.
Personas que se enteraron por
prensa.
Personas que se enteraron por
revistas.
Personas que se enteraron por
referencia personal.
Personas que se enteraron por la
Web.
Personas que se enteraron por
Email.
Personas que se enteraron por
otros medios.
Personas con edad menor a veinte
años.
Personas con edad entre 20 a 25
años.
Personas con edad entre 26 a 35
años.
Personas con edad mayor a 35
años.
Personas con edad mayor a 45
años.
EJECUTIVO
FLOAT
8
MEDIOS
FLOAT
8
OPERATIVO
FLOAT
8
Personas con cargo ejecutivo.
Personas con cargos de nivel
medio.
Personas con cargos de nivel
operativo.
OTRO
FLOAT
8
Personas con otros cargos.
EVALUACION_SOFT
FLOAT
8
Evaluación ponderada por software.
EVALUACION_RED
FLOAT
8
Evaluación ponderada por red.
PROME_EQ
FLOAT
8
Evaluación ponderada por equipos.
AUX_INDICADOR: Entidad que almacena las metas de los indicadores de
rendimiento.
CAMPO
indicadorId
TIPO DE
DATO
INT
LONGITUD
DESCRIPCION
4
Identificador de indicador.
8
Indicador del año.
indicadorAnio
FLOAT
indicadorMes
FLOAT
8
indicadorNivelSatisfaccion
FLOAT
8
indicadorNumeroCurso
FLOAT
8
Indicador de mes.
Meta del indicador de nivel de
satisfacción por año y mes.
Meta del indicador de número de
151
cursos por año y mes.
indicadorNumeroParticipantes
FLOAT
8
indicadorIngresos
FLOAT
8
indicadorHoras
FLOAT
8
Meta del indicador de número de
participantes por año y mes.
Meta del indicador del número de
ingresos por año y mes.
Meta del indicador del número de
horas dictadas por año y mes.
AUX_PROGRAMA: Entidad que almacena el detalle de los programas de los
cursos dictados por la CCC.
CAMPO
ID_PROG
NOMBRE_PROGRAMA
TIPO DE DATO
LONGITUD
DESCRIPCION
INT
4
Identificador de programa.
VARCHAR
60
Nombre de programa.
AUX_TIPO_CURSO: Entidad que almacena los tipos de curso dictados por la
CCC.
CAMPO
ID_TIPO_CURSO
DETALLE_TIPO_CURSO
TIPO DE DATO
LONGITUD
INT
4
DESCRIPCION
Identificador de tipo de
curso.
VARCHAR
60
Detalle del tipo de curso.
152
ANEXO D
MODELO RELACIONAL DE LA BASE DE DATOS DEL DATAMART (dmCCC)
int
<pk>
varchar(80)
varchar(80)
varchar(260)
DIM_CURSO
id_cur
descripcion_tipo_cur
nombre_programa_cur
nombre_cur
int
<pk>
datetime
varchar(250)
varchar(40)
int
int
int
int
FK_FACT_EVA_TIE_EVA_DIM_TIEM
FK_FACT_REN_TIE_REN_DIM_TIEM
FK_FACT_ACA_TIE_ACA_DIM_TIEM
FK_FACT_EVA_REFERENCE_DIM_CURS
FK_FACT_EVA_EVAL_EVA_DIM_EVAL
id_eval
int
<pk>
nombre_evaluable varchar(30)
DIM_EVALUABLE
FK_FACT_ENC_REFERENCE_DIM_CURS
FK_FACT_ENC_REFERENCE_DIM_TIEM
FK_FACT_REN_REFERENCE_DIM_CURS
id_tie
fecha_tie
horario_tie
nombre_mes_tie
bimestre_tie
trimestre_tie
semestre_tie
anio_tie
DIM_TIEMPO
FK_FACT_ACA_CUR_ACA_DIM_CURS
int
int
int
int
int
int
int
decimal(9,2)
decimal(9,2)
decimal(9,2)
decimal(15,2)
smallint
smallint
int
int
int
int
int
int
int
int
int
id_ins
id_eval
id_cur
id_tie
DIM_id_cur
DIM_id_ins
ind_satisfaccion
int
int
int
int
int
int
decimal(9,2)
FACT_EVALUACION
id_item
id_cur
id_tie
id_ins
DIM_id_cur
DIM_id_tie
DIM_id_ins
DIM_id_item
num_estudiantes_enc
<pk>
<pk>
<pk,fk1>
<pk>
<fk2>
<fk3>
<pk>
<pk,fk1>
<pk,fk3>
<pk,fk2>
<pk>
<fk4>
<fk5>
<pk>
<pk,fk2>
<pk>
<pk,fk1>
<fk3>
<fk4>
<pk>
<pk>
<pk>
<pk>
<fk1>
<fk2>
<fk3>
<fk4>
int
int
int
int
int
int
int
decimal(9,2)
int
decimal(9,2)
FACT_ENCUESTA
id_cur
id_ins
id_tie
id_met
DIM_id_cur
DIM_id_ins
num_participantes_cur
tot_ingresos_cur
tot_horas_cur
ind_satisfaccion_cur
FACT_RENDIMIENTO
id_ins
id_cli
id_tie
id_cur
id_obs
DIM_id_ins
DIM_id_obs
est_nota
est_asistencia
est_descuento
est_ingreso
est_diploma_entrega
est_parqueadero
FACT_ACADEMICO
FK_FACT_EVA_REFERENCE_DIM_INST
FK_FACT_ENC_REFERENCE_DIM_INST
FK_FACT_ENC_REFERENCE_DIM_ITEM
id_item
int
<pk>
nombre_item
varchar(30)
nombre_subitem varchar(50)
DIM_ITEM
FK_FACT_REN_REFERENCE_DIM_INST
int
<pk>
int
int
varchar(80)
varchar(50)
varchar(50)
varchar(80)
id_ins
nombre_ins
titulo_principal_ins
maestria_principal_ins
titulo_adicional_uno_ins
area_experiencia_ins
anio_experiencia_ins
int
<p
varchar(80)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(20)
DIM_INSTRUCTOR
id_cli
id_emp_cli
id_est
nombre_emp_cli
representante_emp_cli
tipo_convenio_emp_cli
nombre_est
DIM_CLIENTE
int
<pk>
id_obs
nombre_obs varchar(50)
DIM_OBSERVACION
FK_FACT_ACA_REFERENCE_DIM_OBSE
FK_FACT_ACA_REFERENCE_DIM_INST
FK_FACT_ACA_CLI_ACA_DIM_CLIE
MODELO RELACIONAL DE LA BASE DE DATOS DEL DATAMART (dmCCC)
ANEXO D
153
154
ANEXO E
MODELO RELACIONAL DE LA BASE DE DATOS DE SEGURIDAD
(dmSeguridad)
COD_USU
ID_PER
APELLIDOS_USU
NOMBRES_USU
CONTRASENIA_USU
FECHA_INI_USU
FECHA_FIN_USU
ESTADO_USU
varchar(20) <pk>
int
<fk>
varchar(50)
varchar(50)
varchar(20)
datetime
datetime
bit
SEG_USUARIO
FK_SEG_USUA_TIENE_SEG_PERF
ID_PER
NOMBRE_PER
DESCRIPCION_PER
ESTADO_PER
ID_OPC
PADRE_OPC
NOMBRE_OPC
VALOR_OPC
HABILITADO_OPC
ORDEN_PADRE_OPC
ORDEN_OPC
int
<pk>
int
<fk>
varchar(100)
varchar(200)
bit
int
int
SEG_OPCION
FK_SEG_OPCI_OPCION_X__SEG_OPCI
int <pk,fk2>
ID_OPC
ID_PER
int <pk,fk1>
habilitado bit
SEG_OPCION_X_PERFIL
FK_SEG_OPCI_OPCION_X__SEG_PERF
int
<pk>
varchar(20)
varchar(50)
bit
SEG_PERFIL
FK_SEG_OPCI_PERTENECE_SEG_OPCI
MODELO RELACIONAL DE LA BASE DE DATOS DE SEGURIDAD (dmSeguridad)
ANEXO E
155
156
ANEXO F
CREACION DEL PAQUETE DTS PARA EXTRACCION,
TRANSFORMACION Y CARGA
157
ANEXO F
CREACION DEL PAQUETE DTSX PARA EXTRACCION,
TRANSFORMACION Y CARGA
Creación del Paquete DTSX
Este paquete contiene dos grupos de tareas definidas de la siguiente manera:
Cargar base de datos Transformación:
Tarea 1: Limpiar base Transformación
Tipo: Tarea de Ejecución SQL
Descripción: elimina los datos de las tablas de la base de datos intermedia
dmTransformacion para la extracción y transformación de información
previa a la carga del datamart.
Tarea 2: Cargar AUX_EVALUACION
Tipo: Tarea de Flujo de datos
Descripción: carga la información de la tabla EVALUACION de la base de
datos SISCEC a la tabla AUX_EVALUACION de la base de datos
dmTransformacion. La figura 2 muestra el proceso de carga de la tabla
AUX_EVALUACION.
Figura 1: proceso de carga de la tabla AUX_EVALUACION
158
Tarea 3: Cargar AUX_EMPRESA
Tipo: Tarea de Flujo de datos
Descripción: carga la información de la tabla EMPRESA de la base de
datos SISCEC a la tabla AUX_EMPRESA de la base de datos
dmTransformacion. La figura 2 muestra el proceso de carga de la tabla
AUX_EMPRESA.
Figura 2: proceso de carga de la tabla AUX_EMPRESA
Tarea 4: Cargar AUX_ESTUDIANTE
Tipo: Tarea de Flujo de datos
Descripción: carga la información de la tabla ESTUDIANTE de la base de
datos SISCEC a la tabla AUX_ESTUDIANTE de la base de datos
dmTransformacion. La figura 3 muestra el proceso de carga de la tabla
AUX_ESTUDIANTE.
Figura 3: proceso de carga de la tabla AUX_ESTUDIANTE
Tarea 5: Cargar AUX_TIPO_CURSO
Tipo: Tarea de Flujo de datos
159
Descripción: carga la información de la tabla TIPO de la base de datos
SISCEC
a
la
tabla
AUX_TIPO_CURSO
de
la
base
de
datos
dmTransformacion. La figura 4 muestra el proceso de carga de la tabla
AUX_TIPO_CURSO.
Figura 4: proceso de carga de la tabla AUX_TIPO_CURSO
Tarea 6: Cargar INDICADORES
Tipo: Tarea de Flujo de datos
Descripción: carga la información de las metas mensuales de los
principales indicadores de medición de rendimiento ubicados en el archivo
INDICADORESCCC.xls a la tabla AUX_INDICADOR de la base de datos
dmTransformacion. La figura 5 muestra el proceso de carga de la tabla
AUX_INDICADOR.
Figura 5: proceso de carga de la tabla AUX_INDICADOR
Tarea 7: Cargar AUX_PROGRAMA
Tipo: Tarea de Flujo de datos
160
Descripción: carga la información de la tabla PROGRAMA de la base de
datos SISCEC a la tabla AUX_PROGRAMA de la base de datos
dmTransformacion. La figura 6 muestra el proceso de carga de la tabla
AUX_PROGRAMA.
Figura 6: proceso de carga de la tabla AUX_PROGRAMA
Tarea 8: Normalizar tabla Curso
Tipo: Tarea de Ejecución SQL
Descripción: esta tarea se encarga de normalizar la tabla CURSO de la
base de datos SISCEC y copiarlos en las tablas AUX_CURSO y
AUX_DETALLE_CURSO de la base de datos dmTransformacion, tomando
en cuenta el nombre único de cada curso y el código del primer curso
dictado con su nombre.
Tarea 9: Cargar AUX_CURSO_POR_ESTUDIANTE
Tipo: Tarea de Flujo de datos
Descripción: carga la información de la tabla CURSO_POR_ESTUDIANTE
de la base de datos SISCEC a la tabla AUX_CURSO_POR_ESTUDIANTE
de la base de datos dmTransformacion. La figura 7 muestra el proceso de
carga de la tabla AUX_PROGRAMA.
161
Figura 7: proceso de carga de la tabla AUX_CURSO_POR_ESTUDIANTE
Tarea 10: Cargar AUX_EVALUABLE
Tipo: Tarea de Flujo de datos
Descripción: carga la información de la tabla EVALUABLE de la base de
datos SISCEC a la tabla AUX_EVALUABLE de la base de datos
dmTransformacion. La figura 8 muestra el proceso de carga de la tabla
AUX_EVALUABLE.
Figura 8: proceso de carga de la tabla AUX_EVALUABLE
Cargar Datamart:
Tarea 11: Limpiar Datamart
162
Tipo: Tarea de Ejecución SQL
Descripción: elimina los datos de las tablas de la base de datos dmCCC
Tarea 12: Cargar dimensión DIM_TIEMPO
Tipo: Tarea de Flujo de datos
Descripción: carga la información de la fecha de inicio de los cursos o
eventos de capacitación realizados a partir del año 2005 que se encuentra
en la tabla AUX_DETALLE_CURSO de la base de datos dmTransformacion
a la dimensión DIM_ TIEMPO de la base de datos dmCCC. La figura 9
muestra el proceso de carga de la dimensión DIM_TIEMPO.
Figura 9: proceso de carga de la dimensión DIM_TIEMPO
Tarea 13: Cargar dimensión DIM_CURSO
Tipo: Tarea de Flujo de datos
Descripción: carga la información de cursos o eventos de capacitación,
tipos de cursos y programas de la tabla AUX_CURSO, AUX_TIPO_CURSO,
AUX_PROGRAMA de la base de datos dmTransformacion a la dimensión
DIM_CURSO de la base de datos dmCCC. La figura 10 muestra el proceso
de carga de la dimensión DIM_CURSO.
163
Figura 10: proceso de carga de la dimensión DIM_CURSO
Tarea 14: Cargar dimensión DIM_OBSERVACION
Tipo: Tarea de Flujo de datos
Descripción: carga la información de observaciones de los estudiantes que
han tomado un curso determinado de la tabla AUX_CURSO_POR
ESTUDIANTE de la base de datos dmTransformacion a la dimensión
DIM_CURSO de la base de datos dmCCC. La figura 11 muestra el proceso
de carga de la dimensión DIM_ OBSERVACION.
Figura 11: proceso de carga de la dimensión DIM_ OBSERVACION
Tarea 15: Cargar dimensión DIM_CLIENTE
Tipo: Tarea de Flujo de datos
164
Descripción: carga la información de los clientes, empresas y tipos de
empresa
que
han
AUX_ESTUDIANTE,
tomado
un
curso
AUX_EMPRESA
determinado
de
la
de
base
la
de
tabla
datos
dmTransformacion y TIPO_EMP de la base de datos SISCEC a la
dimensión DIM_CLIENTE de la base de datos dmCCC. La figura 12
muestra el proceso de carga de la dimensión DIM_CLIENTE.
Figura 12: proceso de carga de la dimensión DIM_CLIENTE
Tarea 16: Cargar dimensión DIM_INSTRUCTOR
Tipo: Tarea de Flujo de datos
Descripción: carga la información de los instructores que han dictado un
determinado curso o evento de capacitación de la tabla INSTRUCTOR de la
base de datos SISCEC a la dimensión DIM_INSTRUCTOR de la base de
datos dmCCC. La figura 13 muestra el proceso de carga de la dimensión
DIM_INSTRUCTOR.
165
Figura 13: proceso de carga de la dimensión DIM_INSTRUCTOR
Tarea 17: Preparar Encuesta - Cargar DIM_ITEM
Tipo: Tarea de Ejecución SQL
Descripción: prepara y carga la información de las encuestas generadas
en cursos o eventos de capacitación a partir del año 2005 almacenados en
la tabla AUX_EVALUACION de la base de datos dmTransformacion a la
dimensión DIM_ITEM de la base de datos dmCCC.
Tarea 19: Cargar dimensión DIM_EVALUABLE
Tipo: Tarea de Flujo de datos
Descripción: carga la información de los ítems de evalacuión de un curso o
evento de capacitación determinado descritos en la tabla AUX_EVALUABLE
de la base de datos dmTransformacion a la dimensión DIM_EVALUABLE de
la base de datos dmCCC. La figura 14 muestra el proceso de carga de la
dimensión DIM_ EVALUABLE.
166
Figura 14: proceso de carga de la dimensión DIM_EVALUABLE
Tarea 20: Cargar FACT_EVALUACION
Tipo: Tarea de Ejecución SQL
Descripción: carga la información de la evaluación promedio según ítems
de evaluación en un curso o evento de capacitación determinado, a partir de
las tablas CASOEVALUACION y PREGUNTAENCUESTA de la base de
datos
SISCEC
o
AUX_EVALUACION
de
la
base
de
datos
dmTransformacion a tabla de hechos FACT_EVALUACION de la base de
datos dmCCC.
Tarea 21: Cargar FACT_ENCUESTA
Tipo: Tarea de Ejecución SQL
Descripción: carga la información del número de estudiantes según ítems
de medición de encuestas generadas en un curso o evento de capacitación
a partir de las tablas INFORMACIONGENERAL de la base de datos
SISCEC o de la tablas
la
base
de
datos
AUX_EVALUACION, AUX_DETALLE_CURSO de
dmTransformacion
a
FACT_EVALUACION de la base de datos dmCCC.
tabla
de
hechos
167
Tarea 22: Cargar FACT_ACADEMICO
Tipo: Tarea de Flujo de datos
Descripción: prepara y carga la información de estudiantes, nota promedio,
descuentos, asistencia promedio, emisión de diplomas y solicitud de
parqueaderos solicitados por los estudiantes en un curso o evento de
capacitación
a
partir
del
año
2005
almacenados
en
la
tabla
AUX_DETALLE_CURSO, AUX_CURSO_POR_ESTUDIANTE de la base de
datos dmTransformacion a tabla de hechos FACT_EVALUACION de la
base de datos dmCCC. La figura 15 muestra el proceso de carga de la tabla
de hechos FACT_EVALUACION.
Figura 15: proceso de carga de la tabla de hechos FACT_ACADEMICO
Tarea 23: Cargar FACT_RENDIMIENTO
Tipo: Tarea de Flujo de datos
Descripción: prepara y carga la información de los principales indicadores
de medición de rendimiento de la CCC y las metas respectivas generadas
en los diferentes cursos a partir del año 2005 almacenados en la tabla
AUX_EVALUACION,
AUX_DETALLE_CURSO,
AUX_CURSO_POR_ESTUDIANTE, AUX_INDICADOR de la base de datos
168
dmTransformacion a tabla de hechos FACT_EVALUACION de la base de
datos dmCCC. La figura 16 muestra el proceso de carga de la tabla de
hechos FACT_RENDIMIENTO.
Figura 16: proceso de carga de la tabla de hechos FACT_RENDIMIENTO
Tarea 24: Actualizar Metas FACT_RENDIMIENTO
Tipo: Tarea de Ejecución SQL
Descripción:
carga la información de las metas según indicadores de
rendimiento de los cursos o eventos de capaitación durante el transcurso
del
tiempo
almacenados
en
la
tabla
AUX_DETALLE_CURSO,
AUX_INDICADOR de la base de datos dmTransformacion a tabla de
hechos FACT_ RENDIMIENTO de la base de datos dmCCC.
169
ANEXO G
DICCIONARIO DE DATOS DE LA BASE DE DATOS SISCEC
170
ANEXO G
DICCIONARIO DE DATOS DE LA BASE DE DATOS SISCEC
La base de datos SISCEC está compuesta de las siguientes tablas:
ASISTENCIA: Entidad que guarda los registros de asistencia del estudiante de
acuerdo al curso al que asiste.
CAMPO
Id_Curso
Id_Est
Id_Contador
valor
TIPO DE DATO
INTEGER
INTEGER
INTEGER
CHAR
LONGITUD
DESCRIPCION
4
Identificador de Curso.
4
Identificador del estudiante.
4
Identificador del contador.
5
Estado de la asistencia del estudiante.
CHEQUE: Entidad que contiene la información referente al cheque emitido.
CAMPO
ID_CHEQUE
NUMERO1
BANCO
TIPO DE DATO
INTEGER
INTEGER
CHAR
LONGITUD
4
4
65
DESCRIPCION
Identificador de cheque.
Número de cheque.
Banco de emisión del cheque.
CONTRATO: Entidad que almacena la información de las cláusulas del
contrato que tiene el CEC con el instructor.
CAMPO
ID_CONTRATO
ID_INSTRUCTOR
NUMERO_CONTRATO
COSTO_HORA
FECHA_FIRMA
ESTADO1
TIPO DE DATO
INTEGER
INTEGER
CHAR
DECIMAL
DATETIME
TEXT
LONGITUD
4
4
25
5
8
16
DESCRIPCION
Identificador del contrato.
Identificador del instructor.
Número de contrato establecido.
Valor de la hora de clase.
Fecha de firma del contrato.
Estado actual del contrato.
CURSO: Entidad que almacena toda la información referente al evento de
capacitación a ser dictado.
CAMPO
ID_CURSO
ID_EMPRESA
ID_EVALUACION
ID_TIPO_CURSO
ID_PROG
MANUAL
FECHA_MANUAL
TIPO DE
DATO
INTEGER
INTEGER
INTEGER
INTEGER
INTEGER
INTEGER
DATETIME
LONGITUD
4
4
4
4
4
4
8
DESCRIPCION
Identificador de curso.
Identificador de empresa.
Identificador de evaluación.
Identificador de tipo de curso.
Identificador de programa.
Nombre del manual de referencia.
Fecha de actualización del manual.
171
ID_INSTRUCTOR
NOMBRE_CURSO
DURACION_CURSO
FECHA_INICIO_CURSO
FECHA_FIN_CURSO
COSTO_CURSO
LUGAR_CURSO
CONTENIDO_CURSO
INTEGER
CHAR
NUMERIC
DATETIME
DATETIME
FLOAT
TEXT
VARCHAR
4
256
9
8
8
8
16
200
DESCRIPCION_HORARIO
DIAS
TEXT
TEXT
16
16
ID_MANUAL_INSTRUCTOR
Duracion_Dias
costo_hora
costo_total
INTEGER
INTEGER
FLOAT
FLOAT
4
4
8
8
Identificador de instructor.
Nombre asignado del curso.
Días de duración del curso.
Fecha de inicio del curso
Fecha de fin de curso.
Costo total del curso.
Lugar en donde se dictará el curso.
Contenido del curso.
Horario en el que se dictará el
curso.
Días en los que se dictará el curso.
Identificador del manuela del
instructor.
Duración del curso en días.
Costo del curso por hora dictada.
Costo total del curso.
CURSO_POR_ESTUDIANTE: Entidad que lleva un registro del los estudiantes
matriculados por cada curso dictado e información relacionada con el
financiamiento del evento de capacitación.
CAMPO
ID_EST
ID_CURSO
NOTA
ASISTENCIA
NOTA_PROGRAMA
Diploma
TIPO DE
DATO
INTEGER
INTEGER
FLOAT
FLOAT
FLOAT
VARCHAR
LONGITUD
4
4
8
8
8
20
Parqueadero
VARCHAR
5
Como
Id_saldo
Observación
Descuento
Abono
Factura
Comprob
Factura1
Abono1
VARCHAR
INTEGER
VARCHAR
FLOAT
FLOAT
CHAR
CHAR
VARCHAR
FLOAT
50
4
50
8
8
10
10
50
8
DESCRIPCION
Identificador de estudiante.
Identificador del curso.
Nota obtenida por el estudiante.
Asistencia del estudiante al curso.
Nota con respecto al curso.
Estado del diploma a emitirse.
Señala si el estudiante hará uso del
parqueadero.
Medio de difusión por el cual se entero del
curso.
Identificador del saldo a cancelar.
Observación referente al curso.
Cantidad a ser descontada al estudiante.
Abono cancelado por el estudiante.
Número de factura.
Comprobante de pago del estudiante.
Identificador de la factura.
Abono cancelado.
DESCUENTO: Entidad que contiene el valor del descuento aplicado a un
estudiante específico.
CAMPO
TIPO DE
DATO
LONGITUD
ID_DESCUENTO
INTEGER
4
ID_FACTURA
INTEGER
4
DESCRIPCION
Identificador del detalle de la
factura sujeta a descuento.
Identificador de la factura sujeta a
descuento.
172
VALOR1
MONEY
4
DESCRIPCION_TIPO_PAGO CHAR
Valor del descuento.
Descripción del tipo de pago
realizado.
65
DETALLE_FACTURA: Entidad que guarda el detalle completo de la factura
emitida al estudiante, lo que incluye el precio a cancelar y el tipo de pago.
CAMPO
TIPO DE DATO LONGITUD
ID_DETALLE
ID_FACTURA
NUMERO1
DESCRIPCION_TIPO_PAGO
PRECIO
INTEGER
INTEGER
INTEGER
CHAR
DECIMAL
4
4
4
65
5
DESCRIPCION
Identificador de detalle de
factura.
Identificador de factura.
Detalle del tipo de pago.
Precio total de la factura.
DIPLOMA: Entidad que almacena la información requerida para realizar la
impresión de los diplomas a ser otorgados.
CAMPO
ID_DIPLOMA
ID_EST
FECHA_EMISION
FECHA_ENTREGA
ESTADO_DIPLOM
A
TIPO DE
DATO
INTEGER
INTEGER
DATETIME
DATETIME
LONGITUD
DESCRIPCION
4
Identificador de diploma.
Identificador del estudiante titular del
4
diploma.
8
Fecha de emisión del diploma.
8
Fecha de entrega del diploma
TEXT
16
Estado actual del diploma emitido.
EMPRESA: Entidad que almacena los datos correspondientes a la empresa
que solicita un evento de capacitación.
CAMPO
ID_EMPRESA
ID_TIPO
NOMBRE_EMPRE
TIPO DE
DATO
INTEGER
INTEGER
CHAR
DIRECCION_EMPRE
TELEFONO_EMPRE
RUC_EMPRE
TELEFONO1_EMPRE
TELEFONO2_EMPRE
FAX_EMPRE
CHAR
CHAR
CHAR
CHAR
CHAR
CHAR
EMAIL_EMPRE
CHAR
REPRESENTANTE_EMPR
E
CHAR
TIPO_EMPRESA
CHAR
LONGITU
D
DESCRIPCION
4
Identificador de la empresa.
4
Identificador de tipo de empresa.
65
Nombre de la empresa.
Dirección de ubicación de la
85
empresa.
15
Teléfono principal de la empresa.
15
Número de RUC de la empresa.
15
Teléfono secundario 1
15
Teléfono secundario 2
15
Número de fax
Dirección de correo electrónico de la
40
empresa.
Nombre del representante legal de la
empresa.
45
20
Descripción del tipo de empresa.
173
ESTUDIANTE: Entidad que guarda los datos personales del estudiante e
información domiciliaria.
ID_EST
ID_EMPRESA
APELLIDO_EST
NOMBRE_EST
CI_EST
TIPO DE
DATO
INTEGER
INTEGER
CHAR
CHAR
CHAR
TELEF_CASA__EST
CHAR
12
TELEF_OFICI_EST
CHAR
TELEF_CELULAR_EST CHAR
12
12
DIRECCION_EST
EMAIL_EST
Nombres_completos
65
47
60
CAMPO
CHAR
CHAR
CHAR
LONGITUD
4
4
40
65
20
DESCRIPCION
Identificador único de estudiante.
Identificador de la empresa.
Apellidos del estudiante
Nombres del estudiante.
Número de cédula del estudiante
Número convencional del domicilio
del estudiante
Número del lugar de trabajo del
estudiante
Número de celular del estudiante.
Dirección de domicilio actual del
estudiante.
Dirección de correo electrónico.
Apellidos y nombres del estudiante.
EVALUACION: Entidad encargada de almacenar los datos correspondientes a
las evaluaciones realizadas al evento de capacitación.
CAMPO
ID_EVALUACION
TIPO DE
DATO
INTEGER
EVALUACION_EST
FLOAT
EVALUACION_COOR
FLOAT
EVALUACION_SCLIENTE FLOAT
ENLACE_ARCHIVO
nVARCHAR
EVALUACION_4
EVALUACION_5
PROMEDIO
FLOAT
FLOAT
FLOAT
EVALUACION_EQ
FLOAT
MAS
FLOAT
FEM
FLOAT
RECSI
FLOAT
RECNO
EPUBLICA
EPRIVADA
FLOAT
FLOAT
FLOAT
PRENSA
REVISTAS
FLOAT
FLOAT
LONGITUD
DESCRIPCION
4
Identificador de evaluación.
Evaluación ponderada por
8
instalaciones
Evaluación ponderada por
8
organización y desarrollo
Evaluación ponderada por
material didáctico
8
Nombre del archivo de
100
evaluación.
Evaluación ponderada por
8
instructor
8
Evaluación ponderada por diseño
8
Evaluación total general
Evaluación ponderada por
8
equipos
Número de personas de género
8
masculino.
Número de personas de género
femenino.
8
Número de personas que
8
recomendarían el curso.
Número de personas que no
8
recomendarían el curso.
8
Personas por empresa pública.
8
Personas por empresa privada.
Personas que se enteraron por
8
prensa.
8
Personas que se enteraron por
174
REFERENCIA
FLOAT
8
WEB
FLOAT
8
EMAIL
FLOAT
8
OTROS
FLOAT
8
MENOSV
FLOAT
8
ENTREV
FLOAT
8
ENTRET
FLOAT
8
MAST
FLOAT
8
MASC
EJECUTIVO
FLOAT
FLOAT
8
8
MEDIOS
FLOAT
8
OPERATIVO
OTRO
FLOAT
FLOAT
8
8
revistas.
Personas que se enteraron por
referencia personal.
Personas que se enteraron por la
Web.
Personas que se enteraron por
Email.
Personas que se enteraron por
otros medios.
Personas con edad menor a
veINTEGERe años.
Personas con edad entre 20 a 25
años.
Personas con edad entre 26 a 35
años.
Personas con edad mayor a 35
años.
Personas con edad mayor a 45
años.
Personas con cargo ejecutivo.
Personas con cargos de nivel
medio.
Personas con cargos de nivel
operativo.
Personas con otros cargos.
FACTURA: Entidad que almacena la información necesaria para la emisión de
la factura al estudiante.
CAMPO
ID_FACTURA
ID_EST
TIPO DE
DATO
INTEGER
INTEGER
FECHA_EMISION_FACTURA
NOMBRE
DIRECCION
CIUDAD
TELEFONO
DATETIME
CHAR
CHAR
CHAR
CHAR
DEPENDENCIA
SUBTOTAL
TOTAL
CHAR
decimal
decimal
LONGITUD
DESCRIPCION
4
Identificador único de factura
4
Identificador único de estudiante
Fecha en la que se emitió la
factura.
8
65
Nombre del cliente
65
Dirección del cliente
65
Ciudad de emisión de factura
12
Teléfono del cliente
Razón de dependencia del
estudiante.
65
5
Valor subtotal a cancelar
5
Valor total a cancelar
FECHA_CURSO: Entidad que registra la fecha de inicio del evento de
capacitación de un curso en particular.
CAMPO
Id_curso
Id_fecha
Fecha
TIPO DE DATO
INTEGER
INTEGER
DATETIME
LONGITUD
DESCRIPCION
4
Clave primaria, identificador único de curso.
4
Clave primaria, identificador de la fecha
8
Fecha de realización del curso.
175
GENERA: Entidad que guarda las referencias del curso y la correspondiente
factura emitida por concepto de pago.
CAMPO
ID_CURSO
ID_FACTURA
TIPO DE DATO
INTEGER
INTEGER
LONGITUD
4
4
DESCRIPCION
Identificador de curso.
Identificador de factura.
IMPUESTO: Entidad que guarda los datos correspondientes al impuesto
generado por concepto del pago del curso.
CAMPO
ID_IMPUESTO
ID_FACTURA
VALOR1
TIPO DE DATO
INTEGER
INTEGER
MONEY
DESCRIPCION_TIPO_PAGO
CHAR
LONGITUD
4
4
8
65
DESCRIPCION
Identificador de impuesto.
Identificador de factura.
Valor del impuesto.
Descripción del tipo de
pago.
INSTRUCTOR: Entidad que guarda los datos personales del instructor, la
información domiciliaria y los estudios realizados por el mismo.
CAMPO
ID_INSTRUCTOR
TIPO DE DATO
INTEGER
LONGITUD DESCRIPCION
4
Identificador de instructor.
Nombres completos del
NOMBRE_INST
CHAR
65
instructor.
Número telefónico domiciliario
TELEF_CASA_INST
CHAR
12
del instructor.
TELEF_OFICI_INST
CHAR
12
Número telefónico de oficina.
TELEF_CELULAR_INST CHAR
12
Número telefónico móvil.
Dirección residencia del
DIRECCION_INST
CHAR
65
instructor.
Dirección de correo electrónico
EMAIL_INST
CHAR
50
personal.
Dirección de correo electrónico
EMAIL2_INST
CHAR
50
opcional.
Número de cédula de
CI_INST
CHAR
11
ciudadanía.
Titulo
VARCHAR
50
Título principal obtenido.
titulo2
VARCHAR
50
Título adicional obtenido.
maestria1
VARCHAR
50
Maestría principal obtenida.
maestria2
VARCHAR
50
Maestría adicional obtenida.
otro1
VARCHAR
50
Título opcional 1.
otro2
VARCHAR
50
Título opcional 2.
Años de experiencia adquirida
Experiencia
VARCHAR
10
por el instructor.
Área de especialización del
Area
VARCHAR
50
instructor.
Valor 1 sí competencia del
marketing_ventas
SMALLINTEGER 2
instructor es en el área de
marketing.
176
Proyectos
SMALLINTEGER 2
administracion
SMALLINTEGER 2
Finanzas
SMALLINTEGER 2
Hr.
SMALLINTEGER 2
Leyes
SMALLINTEGER 2
Procesos
SMALLINTEGER 2
Redes
SMALLINTEGER 2
Bases
SMALLINTEGER 2
Windows
SMALLINTEGER 2
Linux
SMALLINTEGER 2
Tcp
SMALLINTEGER 2
programacion_web
SMALLINTEGER 2
Visual
SMALLINTEGER 2
Ofimatica
SMALLINTEGER 2
diseno_web
SMALLINTEGER 2
proyectos_informaticos
SMALLINTEGER 2
Otros
VARCHAR
70
Valor 1 sí competencia del
instructor es en el área de
proyectos.
Valor 1 sí competencia del
instructor es en el área de
administración.
Valor 1 sí competencia del
instructor es en el área de
finanzas.
Valor 1 sí competencia del
instructor es en el área de
recursos humanos.
Valor 1 sí competencia del
instructor es en el área de leyes.
Valor 1 sí competencia del
instructor es en el área de
procesos.
Valor 1 sí competencia del
instructor es en el área de redes.
Valor 1 sí competencia del
instructor es en el área de bases
de datos.
Valor 1 sí competencia del
instructor es en el área de SO
Windows.
Valor 1 sí competencia del
instructor es en el área de SO
Linux.
Valor 1 sí competencia del
instructor es en el área de TCP.
Valor 1 sí competencia del
instructor es en el área de
Programación Web.
Valor 1 sí competencia del
instructor es en el área de
Visual.
Valor 1 sí competencia del
instructor es en el área de
Ofimática.
Valor 1 sí competencia del
instructor es en el área de
Diseño Web.
Valor 1 sí competencia del
instructor es en el área de
Proyectos Informáticos.
Valor 1 sí competencia del
instructor se encuentra en otras
áreas de interés.
PROGRAMA: Entidad que guarda el nombre y el detalle de la programación
del curso a ser dictado.
177
TIPO DE
DATO
INTEGER
CHAR
CAMPO
ID_PROG
NOMBRE_PROGRAMA
LONGITUD
DESCRIPCION
4
Identificación de programa.
60
Nombre asignado al programa.
Detalle aspectos importantes del
55
programa.
DESCRIPCION_PROGRAMA CHAR
ROL_DE_PAGOS: Entidad que almacena los datos del rol de pagos de cada
empleado de la organización.
TIPO DE
CAMPO
DATO
ID_ROL_PAGOS INTEGER
ID_TIPO_PAGO
INTEGER
TIPO_EMPLEADO CHAR
RESPONSABLE
LONGITUD
4
4
15
CHAR
45
DESCRIPCION
Identificador de rol de pagos.
Identificador de tipo de pago.
Descripción de tipo de empleado.
Responsable de la emisión del rol de
pagos.
SALDO: Entidad que almacena los datos del saldo adeudado por el estudiante
y lo números de comprobantes emitidos.
CAMPO
ID_SALDO
ID_EST
ABONO
SALDO1
NUMERO_FACTURA
TIPO DE DATO LONGITUD
INTEGER
4
INTEGER
4
decimal
5
decimal
5
TEXT
16
COMENTARIO
TEXT
NUM_COMPROBANTE INTEGER
16
4
DESCRIPCION
Identificador de saldo.
Identificador de estudiante.
Abono cancelado por el estudiante.
Saldo pendiente.
Número de factura
Comentario correspondiente al
pago.
Número de comprobante emitido.
TIPO: Entidad que guarda la descripción de los tipos de curso disponibles.
CAMPO
ID_TIPO_CURSO
DESCRIPCION_TIPO
TIPO DE DATO
INTEGER
CHAR
LONGITUD
4
55
DESCRIPCION
Identificador de tipo de curso.
Descripción de tipo de curso.
TIPO_EMP: Entidad que guarda la descripción de los tipos de empresa que
requieren de un evento de capacitación.
CAMPO
ID_TIPO
TIPO_EMPRESA
TIPO DE DATO
INTEGER
TEXT
LONGITUD
DESCRIPCION
4
Identificador de tipo de empresa.
16
Descripción de tipo de empresa.
178
TIPO _ PAGO: Entidad que guarda los datos correspondientes al tipo de
pago realizado por el estudiante.
CAMPO
ID_TIPO_PAGO
ID_CHEQUE
ID_FACTURA
TIPO
DESCRIPCION_TIPO_PAGO
TIPO DE DATO
INTEGER
INTEGER
INTEGER
CHAR
CHAR
LONGITUD
DESCRIPCION
4
Identificador de tipo de pago.
4
Identificador de cheque.
4
Identificador de factura.
45
Tipo de pago.
65
Descripción de tipo de pago