Subido por Jorge Sanchez

Practica4 Enunciado

Anuncio
Título
PRÁCTICA 4: ANALICE UN CONJUNTO DE DATOS USANDO EXTENSIONES SQL PARA OLAP
Finalidad
Actividad de aprendizaje destinada a analizar datos sobre los prestamos de libros
que realiza una biblioteca, con técnicas OLAP mediante la generación de reportes
estadísticos con SQL usando agrupamientos y extensiones SQL para OLAP.
Autor
Eduardo Encalada
aeencalada@utpl.edu.ec
Revisión
Jun-2020
1. Descripción de la práctica
Para el Caso de estudio "Préstamos Biblioteca" que consta al final de este documento, analice el conjunto
de datos allí provistos y con base en ello genere reportes estadísticos mediante SQL usando
agrupamientos y extensiones SQL para OLAP. Los reportes estadísticos para analizar y generar se detallan
en cada una de las preguntas del cuestionario de validación planteado en el punto 5. Previamente es
importante siga las orientaciones que se presentan en el punto 4.
2. Tema de la actividad
Extensiones SQL OLAP
3. Resultados de aprendizaje a los que aporta la actividad
•
•
Demuestra una comprensión del procesamiento analítico en línea y de los sistemas de
almacenamiento de datos.
Señala las herramientas de exploración y análisis de datos que se usan para la toma de decisiones.
4. Orientaciones metodológicas (estrategias de trabajo)
El objetivo de está práctica es que realizar un acercamiento a la analítica de datos, mediante la generación
y evaluación de reportes de tipo estadístico (conocidos también como informes gerenciales) para los
datos provistos en el caso de estudio “Préstamos Biblioteca” que constan al final del presente documento.
La idea es hacerlo aplicando conceptos de Procesamiento Analítico en Línea (OLAP) y usando lenguaje
SQL, incluidas las estaciones que este lenguaje provee para OLAP.
Siga estas orientaciones previo al desarrollo de lo que solicita el cuestionario de validación de resultados:
a) Previo a iniciar la práctica asegúrese de haber revisado la unidad 6 de su ruta de aprendizaje.
Sobre todo el apartado 6.3 que habla del Procesamiento analítico en línea.
b) En su texto básico revise con detenimiento el apartado 13.6 donde explica el concepto de análisis
multidimensional y cubos OLAP. Si desea puede revisar también el apartado 13.7 donde explica
con más detalle el diseño multidimensional.
c) Es importante para la práctica que usted recuerde el lenguaje SQL y sobre el manejo de
agrupamientos, mediante GROUP BY y funciones de agrupamiento. Si es necesario vuelva a
revisar el capítulo 7 de su texto base y concretamente el apartado 7.6.
d) En su texto básico revise el apartado 13.10 en el que se explica el uso y funcionamiento de las
extensiones SQL para OLAP. La explicación de dichas extensiones el texto básico las realiza para
Oracle; si usted usa otra base de datos como por ejemplo MySQL, investigue en internet la sintaxis
equivalente para el motor que usted usa.
1
e) Analice la descripción del caso de estudio propuesto que consta el final del este documento: Caso
de estudio “Préstamos Biblioteca”
f)
Acceda a su motor de base de datos relacional, cree un nuevo esquema de base de datos (defina
usted el nombre) y en dicho esquema ejecute el Script SQL que se adjunta en el caso de estudio,
el cuál crea las tablas y carga los datos a las tablas.
g) Inspeccione la base de datos creada, familiarizándose sobre todo con los datos cargados en cada
una de las 3 tablas del cubo OLAP.
h) Una vez cumplido lo anterior proceda a evaluar y desarrollar lo que se indica en cada pregunta
del cuestionario de validación de resultados que consta en el punto 5. Para ello, mediante SQL
escriba las consultas que correspondan a cada caso y ejecútelas en su base de datos, con ello
podrá encontrar la respuesta correcta.
i)
Para la pregunta 7 del cuestionario en la que se solicita que elabore un gráfico estadístico, si no
lo ha hecho antes, se le sugiere consultar en internet el tema “Gráficos estadísticos en Excel”
donde encontrará información bastante precisa acerca de cómo elaborar un gráfico estadístico
para representar un conjunto de datos, elija usted el gráfico y representación que le parezca más
apropiados para esos datos. Si desea usar otra herramienta en lugar de Excel para generar el
gráfico lo puede hacer.
5. Interrogantes de la actividad planteada
Una vez haya seguido las orientaciones del punto 4, desarrolle el siguiente cuestionario.
CUESTIONARIO DE VALIDACIÓN DE RESULTADOS
En las preguntas 1 a 5 seleccione la respuesta correcta.
Las preguntas 6, 7 y 8 son de ensayo, desarrolle lo que allí se solicita.
1)
(1 punto) ¿A cuánto asciende el total de préstamos realizados en viernes durante el último
trimestre de 2018 de libros sobre medicina y derecho?
a. 9
b. 0
c. Más de 1000
d. 4
e. 5
f. 85
2)
(1 punto) ¿A cuánto asciende el total de préstamos realizados durante el primer semestre de
2019 sobre libros en español de la editorial Lippincott Williams and Wilkins que fueron
devueltos a tiempo?
a. 34
b. Más de 1000
c. 777
d. 0
e. 30
f. 4
g. 13
h. 15
2
3)
(1 punto) ¿Cuál de los siguientes reportes NO sería posible obtener con el esquema (cubo)
planteado en el caso de estudio?
a. Promedio diario de préstamos realizados en 2017.
b. Número de préstamos realizados desde 2016, clasificados por editorial e idioma.
c. Número de préstamos que registran devolución tardía, por cada mes en 2017, de
libros sobre “Informática”.
d. Número total de libros disponibles en la biblioteca en los que participa como autor
“Todd Landman”.
e. Realmente permite obtener todos los informes indicados en los otros ítems.
4)
(1 punto) ¿Cuál extensión SQL para OLAP que permitiría generar el siguiente reporte?
Año
---------2017
2017
2017
2018
2018
2018
2019
2019
2019
2020
2020
a.
b.
c.
d.
e.
5)
Semestre
Tot prest dev. tardía
------------ --------------------1er Semestre
161
2do Semestre
122
283
1er Semestre
103
2do Semestre
136
239
1er Semestre
181
2do Semestre
152
333
1er Semestre
106
106
1er Semestre
551
2do Semestre
410
961
GROUP BY
CUBE
AVG
ROLLUP
Ninguna, dado que no existe el semestre en los datos
(1 punto) ¿Cuál de las siguientes es la salida correcta para la estadística del total de
préstamos realizados por cada año y por cada idioma de libros publicados en 2013 y 2015,
incluyendo además los totales por cada año y el total general?
Opción 1
ANIO
---------2017
2017
2017
2018
2018
2018
2019
2019
2019
2020
IDIOMA
TOTALPRESTAMOS
---------- -------------Inglés
66
Español
394
460
Inglés
29
Español
348
377
Inglés
37
Español
439
476
Inglés
21
3
2020 Español
2020
182
203
1516
Opción 2
IDIOMA
ANIO TOTALPRESTAMOS
---------- ---------- -------------Inglés
2017
66
Español
2017
284
2017
350
Inglés
2018
29
Español
2018
267
2018
296
Inglés
2019
37
Español
2019
337
2019
374
Inglés
2020
21
Español
2020
119
2020
140
1160
Opción 3
ANIO
---------2017
2017
2017
2018
2018
2018
2019
2019
2019
2020
2020
2020
Opción 4
ANIO
---------2017
2017
2017
2018
2018
2018
2019
2019
2019
2020
2020
2020
IDIOMA
TOTALPRESTAMOS
---------- -------------Inglés
66
Español
350
416
Inglés
29
Español
296
325
Inglés
37
Español
374
411
Inglés
21
Español
140
161
1313
IDIOMA
TOTALPRESTAMOS
---------- -------------Inglés
66
Español
350
1494
Inglés
29
Español
296
1231
Inglés
37
Español
374
1788
Inglés
21
Español
140
562
5075
4
Opción 5
Resultado vacío
Respuesta
a.
b.
c.
d.
e.
6)
Opción 1
Opción 2
Opción 3
Opción 4
Opción 5
(1.5 puntos) Realice una consulta SQL que permite obtener la siguiente estadística “total de
préstamos realizados y total de prestamos con devolución tardía registrados en 2018,
agrupados por cada mes, debiendo mostrar el nombre del mes, en lugar del número de mes”
En su respuesta debe indicar
• El motor de base de datos que usó
• El comando SQL
• La salida de datos generada
(En su examen Canvas dispondrá de un espacio en blanco donde deberá pegar el texto de su
respuesta)
7)
(1.5 puntos) Con los datos de la estadística generada en la pregunta anterior, realice una
visualización a través de un gráfico estadístico (barras, líneas, circular, área, etc.). Puede
hacerlo con Excel o con cualquier herramienta que usted decida.
El objetivo es que usted pueda contrastar la diferencia entre mostrar los datos de manera
tabular (pregunta anterior) y de manera gráfica. Elija usted el gráfico y representación que le
parezca más apropiados para esos datos.
En su respuesta debe adjuntar la IMAGEN del gráfico generado por usted.
(En su examen Canvas dispondrá de una opción para cargar el archivo de la imagen)
8)
(2 puntos) Sobre el caso de estudio planteado realice un reporte estadístico propio en el que
se use extensiones SQL para OLAP. Defina usted su propia estadística con base en la
información disponible en el caso de estudio. La estadística para generar debe ser diferente a
las enunciadas en las preguntas anteriores.
En su respuesta debe indicar:
• El enunciado o descripción del reporte estadístico que usted generó
• El motor de base de datos que usó
• El comando SQL que genera el reporte
• La salida de datos generada
(En su examen Canvas dispondrá de un espacio en blanco donde deberá pegar el texto de su
respuesta)
5
6. Criterio de evaluación
Las preguntas 1 a 5 se califican de manera automática. Las preguntas 6, 7 y 8 serán calificadas por el
tutor al cerrar la tarea, considerando que cumpla con los requerimientos planteados en el enunciado de
cada pregunta.
7. Envío de la práctica
Registre sus respuestas al Cuestionario de Validación de Resultados, en el Cuestionario en línea Canvas
correspondiente a esta actividad.
No se requiere el envío de ningún otro documento adicional por otra vía, únicamente debe responder al
cuestionario.
¡IMPORTANTE! No realice el examen en Canvas mientras no tenga listas las respuestas y la imagen que
debe adjuntar.
6
Caso de estudio “Préstamos Biblioteca”
A partir de la base de datos de BIBLIOTECA se ha diseñado un esquema multidimensional (Cubo OLAP) a
efectos de generar informes estadísticos para la gerencia en torno a las cifras diarias de préstamos
realizados a los usuarios de la biblioteca y de esos adicionalmente las cifras de préstamos que fueron
devueltos tardíamente.
El objetivo es que se puedan generar estadísticas basadas en dichas métricas desde múltiples
dimensiones, a saber:
•
•
•
•
•
•
•
•
•
•
•
•
Fecha de préstamo
Año de préstamo
Trimestre del año al que corresponde el préstamo
Mes del año al que corresponde el préstamo
Día del mes en el que se hizo el préstamo
Día de la semana en la que se efectuó el préstamo (de 1 a 7, siendo 1 = lunes)
Título del libro prestado
Idioma del libro
Año de publicación del libro
Editorial
Área de conocimiento, y
Autor Principal o 1er autor del libro
Esquema multidimensional o Cubo OLAP
P = Primary Key, F = Foreign Key, U=Unique Key, * = Campo obligatorio
Nota:
En este caso prestamosDiarios es la tabla central, que también se conoce como tabla de hechos, que es
donde se guardan los valores de las dos métricas a evaluar contabilizadas por cada día y por cada libro.
Se entiende que por cada libro en un mismo día se pueden realizar varios prestamos, dado que la
biblioteca dispone de varios ejemplares o copias de cada libro.
7
Script para creación y carga de datos del Cubo
En el siguiente enlace encontrará el script SQL para la creación de las tablas y carga de datos para el
caso de estudio
Script SQL Préstamos Biblioteca
.-
8
Descargar