Título PRÁCTICA 4: ANALICE UN CONJUNTO DE DATOS USANDO EXTENSIONES SQL PARA OLAP Finalidad Actividad de aprendizaje destinada a analizar datos sobre los prestamos de libros que realiza una biblioteca, con técnicas OLAP mediante la generación de reportes estadísticos con SQL usando agrupamientos y extensiones SQL para OLAP. Autor Eduardo Encalada [email protected] Revisión Jun-2020 1. Descripción de la práctica Para el Caso de estudio "Préstamos Biblioteca" que consta al final de este documento, analice el conjunto de datos allí provistos y con base en ello genere reportes estadísticos mediante SQL usando agrupamientos y extensiones SQL para OLAP. Los reportes estadísticos para analizar y generar se detallan en cada una de las preguntas del cuestionario de validación planteado en el punto 5. Previamente es importante siga las orientaciones que se presentan en el punto 4. 2. Tema de la actividad Extensiones SQL OLAP 3. Resultados de aprendizaje a los que aporta la actividad • • Demuestra una comprensión del procesamiento analítico en línea y de los sistemas de almacenamiento de datos. Señala las herramientas de exploración y análisis de datos que se usan para la toma de decisiones. 4. Orientaciones metodológicas (estrategias de trabajo) El objetivo de está práctica es que realizar un acercamiento a la analítica de datos, mediante la generación y evaluación de reportes de tipo estadístico (conocidos también como informes gerenciales) para los datos provistos en el caso de estudio “Préstamos Biblioteca” que constan al final del presente documento. La idea es hacerlo aplicando conceptos de Procesamiento Analítico en Línea (OLAP) y usando lenguaje SQL, incluidas las estaciones que este lenguaje provee para OLAP. Siga estas orientaciones previo al desarrollo de lo que solicita el cuestionario de validación de resultados: a) Previo a iniciar la práctica asegúrese de haber revisado la unidad 6 de su ruta de aprendizaje. Sobre todo el apartado 6.3 que habla del Procesamiento analítico en línea. b) En su texto básico revise con detenimiento el apartado 13.6 donde explica el concepto de análisis multidimensional y cubos OLAP. Si desea puede revisar también el apartado 13.7 donde explica con más detalle el diseño multidimensional. c) Es importante para la práctica que usted recuerde el lenguaje SQL y sobre el manejo de agrupamientos, mediante GROUP BY y funciones de agrupamiento. Si es necesario vuelva a revisar el capítulo 7 de su texto base y concretamente el apartado 7.6. d) En su texto básico revise el apartado 13.10 en el que se explica el uso y funcionamiento de las extensiones SQL para OLAP. La explicación de dichas extensiones el texto básico las realiza para Oracle; si usted usa otra base de datos como por ejemplo MySQL, investigue en internet la sintaxis equivalente para el motor que usted usa. 1 e) Analice la descripción del caso de estudio propuesto que consta el final del este documento: Caso de estudio “Préstamos Biblioteca” f) Acceda a su motor de base de datos relacional, cree un nuevo esquema de base de datos (defina usted el nombre) y en dicho esquema ejecute el Script SQL que se adjunta en el caso de estudio, el cuál crea las tablas y carga los datos a las tablas. g) Inspeccione la base de datos creada, familiarizándose sobre todo con los datos cargados en cada una de las 3 tablas del cubo OLAP. h) Una vez cumplido lo anterior proceda a evaluar y desarrollar lo que se indica en cada pregunta del cuestionario de validación de resultados que consta en el punto 5. Para ello, mediante SQL escriba las consultas que correspondan a cada caso y ejecútelas en su base de datos, con ello podrá encontrar la respuesta correcta. i) Para la pregunta 7 del cuestionario en la que se solicita que elabore un gráfico estadístico, si no lo ha hecho antes, se le sugiere consultar en internet el tema “Gráficos estadísticos en Excel” donde encontrará información bastante precisa acerca de cómo elaborar un gráfico estadístico para representar un conjunto de datos, elija usted el gráfico y representación que le parezca más apropiados para esos datos. Si desea usar otra herramienta en lugar de Excel para generar el gráfico lo puede hacer. 5. Interrogantes de la actividad planteada Una vez haya seguido las orientaciones del punto 4, desarrolle el siguiente cuestionario. CUESTIONARIO DE VALIDACIÓN DE RESULTADOS En las preguntas 1 a 5 seleccione la respuesta correcta. Las preguntas 6, 7 y 8 son de ensayo, desarrolle lo que allí se solicita. 1) (1 punto) ¿A cuánto asciende el total de préstamos realizados en viernes durante el último trimestre de 2018 de libros sobre medicina y derecho? a. 9 b. 0 c. Más de 1000 d. 4 e. 5 f. 85 2) (1 punto) ¿A cuánto asciende el total de préstamos realizados durante el primer semestre de 2019 sobre libros en español de la editorial Lippincott Williams and Wilkins que fueron devueltos a tiempo? a. 34 b. Más de 1000 c. 777 d. 0 e. 30 f. 4 g. 13 h. 15 2 3) (1 punto) ¿Cuál de los siguientes reportes NO sería posible obtener con el esquema (cubo) planteado en el caso de estudio? a. Promedio diario de préstamos realizados en 2017. b. Número de préstamos realizados desde 2016, clasificados por editorial e idioma. c. Número de préstamos que registran devolución tardía, por cada mes en 2017, de libros sobre “Informática”. d. Número total de libros disponibles en la biblioteca en los que participa como autor “Todd Landman”. e. Realmente permite obtener todos los informes indicados en los otros ítems. 4) (1 punto) ¿Cuál extensión SQL para OLAP que permitiría generar el siguiente reporte? Año ---------2017 2017 2017 2018 2018 2018 2019 2019 2019 2020 2020 a. b. c. d. e. 5) Semestre Tot prest dev. tardía ------------ --------------------1er Semestre 161 2do Semestre 122 283 1er Semestre 103 2do Semestre 136 239 1er Semestre 181 2do Semestre 152 333 1er Semestre 106 106 1er Semestre 551 2do Semestre 410 961 GROUP BY CUBE AVG ROLLUP Ninguna, dado que no existe el semestre en los datos (1 punto) ¿Cuál de las siguientes es la salida correcta para la estadística del total de préstamos realizados por cada año y por cada idioma de libros publicados en 2013 y 2015, incluyendo además los totales por cada año y el total general? Opción 1 ANIO ---------2017 2017 2017 2018 2018 2018 2019 2019 2019 2020 IDIOMA TOTALPRESTAMOS ---------- -------------Inglés 66 Español 394 460 Inglés 29 Español 348 377 Inglés 37 Español 439 476 Inglés 21 3 2020 Español 2020 182 203 1516 Opción 2 IDIOMA ANIO TOTALPRESTAMOS ---------- ---------- -------------Inglés 2017 66 Español 2017 284 2017 350 Inglés 2018 29 Español 2018 267 2018 296 Inglés 2019 37 Español 2019 337 2019 374 Inglés 2020 21 Español 2020 119 2020 140 1160 Opción 3 ANIO ---------2017 2017 2017 2018 2018 2018 2019 2019 2019 2020 2020 2020 Opción 4 ANIO ---------2017 2017 2017 2018 2018 2018 2019 2019 2019 2020 2020 2020 IDIOMA TOTALPRESTAMOS ---------- -------------Inglés 66 Español 350 416 Inglés 29 Español 296 325 Inglés 37 Español 374 411 Inglés 21 Español 140 161 1313 IDIOMA TOTALPRESTAMOS ---------- -------------Inglés 66 Español 350 1494 Inglés 29 Español 296 1231 Inglés 37 Español 374 1788 Inglés 21 Español 140 562 5075 4 Opción 5 Resultado vacío Respuesta a. b. c. d. e. 6) Opción 1 Opción 2 Opción 3 Opción 4 Opción 5 (1.5 puntos) Realice una consulta SQL que permite obtener la siguiente estadística “total de préstamos realizados y total de prestamos con devolución tardía registrados en 2018, agrupados por cada mes, debiendo mostrar el nombre del mes, en lugar del número de mes” En su respuesta debe indicar • El motor de base de datos que usó • El comando SQL • La salida de datos generada (En su examen Canvas dispondrá de un espacio en blanco donde deberá pegar el texto de su respuesta) 7) (1.5 puntos) Con los datos de la estadística generada en la pregunta anterior, realice una visualización a través de un gráfico estadístico (barras, líneas, circular, área, etc.). Puede hacerlo con Excel o con cualquier herramienta que usted decida. El objetivo es que usted pueda contrastar la diferencia entre mostrar los datos de manera tabular (pregunta anterior) y de manera gráfica. Elija usted el gráfico y representación que le parezca más apropiados para esos datos. En su respuesta debe adjuntar la IMAGEN del gráfico generado por usted. (En su examen Canvas dispondrá de una opción para cargar el archivo de la imagen) 8) (2 puntos) Sobre el caso de estudio planteado realice un reporte estadístico propio en el que se use extensiones SQL para OLAP. Defina usted su propia estadística con base en la información disponible en el caso de estudio. La estadística para generar debe ser diferente a las enunciadas en las preguntas anteriores. En su respuesta debe indicar: • El enunciado o descripción del reporte estadístico que usted generó • El motor de base de datos que usó • El comando SQL que genera el reporte • La salida de datos generada (En su examen Canvas dispondrá de un espacio en blanco donde deberá pegar el texto de su respuesta) 5 6. Criterio de evaluación Las preguntas 1 a 5 se califican de manera automática. Las preguntas 6, 7 y 8 serán calificadas por el tutor al cerrar la tarea, considerando que cumpla con los requerimientos planteados en el enunciado de cada pregunta. 7. Envío de la práctica Registre sus respuestas al Cuestionario de Validación de Resultados, en el Cuestionario en línea Canvas correspondiente a esta actividad. No se requiere el envío de ningún otro documento adicional por otra vía, únicamente debe responder al cuestionario. ¡IMPORTANTE! No realice el examen en Canvas mientras no tenga listas las respuestas y la imagen que debe adjuntar. 6 Caso de estudio “Préstamos Biblioteca” A partir de la base de datos de BIBLIOTECA se ha diseñado un esquema multidimensional (Cubo OLAP) a efectos de generar informes estadísticos para la gerencia en torno a las cifras diarias de préstamos realizados a los usuarios de la biblioteca y de esos adicionalmente las cifras de préstamos que fueron devueltos tardíamente. El objetivo es que se puedan generar estadísticas basadas en dichas métricas desde múltiples dimensiones, a saber: • • • • • • • • • • • • Fecha de préstamo Año de préstamo Trimestre del año al que corresponde el préstamo Mes del año al que corresponde el préstamo Día del mes en el que se hizo el préstamo Día de la semana en la que se efectuó el préstamo (de 1 a 7, siendo 1 = lunes) Título del libro prestado Idioma del libro Año de publicación del libro Editorial Área de conocimiento, y Autor Principal o 1er autor del libro Esquema multidimensional o Cubo OLAP P = Primary Key, F = Foreign Key, U=Unique Key, * = Campo obligatorio Nota: En este caso prestamosDiarios es la tabla central, que también se conoce como tabla de hechos, que es donde se guardan los valores de las dos métricas a evaluar contabilizadas por cada día y por cada libro. Se entiende que por cada libro en un mismo día se pueden realizar varios prestamos, dado que la biblioteca dispone de varios ejemplares o copias de cada libro. 7 Script para creación y carga de datos del Cubo En el siguiente enlace encontrará el script SQL para la creación de las tablas y carga de datos para el caso de estudio Script SQL Préstamos Biblioteca .- 8