MOLAP REALIZADO POR: JOSE E. TABOADA RENNA BASE DE DATOS § Conjunto de datos estructurados, fiables y homogéneos organizados independientemente en máquina, accesibles en tiempo real, compatible por usuarios concurrentes que tienen necesidades de información diferentes y no predecibles en el tiempo Tipos de base de datos: § Jeráquica. § Red § Relacional § Multidemensionales ESTRUCTURAS MULTIDIMENDIONALES § Esta estructura es una variación de la estructura relacional que utiliza estructuras multidimensionales para organizar datos y expresar las relaciones entre ellos. Visualización de una Estructura Multidimensional DATA WAREHOUSE § Definición: conjunto de datos orientados a temas integrados, no volátiles de tiempo variante que se usa para el soporte del proceso de toma de decisiones gerenciales. Características Generales: § No son transitorios § No son volátiles § No se llevan a cabo modificaciones o eliminaciones, solo inserciones § Guarda datos sumarizados § Orientados a una materia Metadatos: Representan toda la información de administración y seguimiento necesarios para: § Acceso a datos § Compresión y utilización Datamarts: § Subconjuntos departamentales que focalizan objetos seleccionados § Se caracteriza por una definición de requerimientos más rápida y fácil § Pueden integrarse en un futuro en un DataWarehouse Data mining : “Extracción de información oculta y predecible de grandes bases de datos” § Predicción automatizada de tendencias y comportamientos § Descubrimiento automatizado de modelos previamente desconocidos DATAWAREHOUSE DATAWAREHOUSE (PROCESO) Procesos básicos del Data WareHouse § Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse. § Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión. § Carga: al final del proceso de transformación, los datos están en forma para ser cargados. Tipos de Bases de Datos § Transaccionales § Almacenan operaciones en general, cada entrada en la base de datos es una operación § Relacionales § La base de datos incluye la información entre las relaciones de las diversas tablas, establecidas en el modelo de datos § Las operaciones sobre la tabla de datos consideran, de manera automática, esas relaciones. § Multidimensionales § Base de datos de estructura basada en dimensiones orientada a consultas complejas y alto rendimiento OLAP Los sistemas de soporte a la decisión usando tecnología de DW, se llaman sistemas OLAP. Estos OLAP deben: § § § Soportar requerimientos complejos de análisis. Analizar datos de diferentes perspectivas. Soportar análisis complejos contra un volumen ingente de datos. § La funcionalidad de los sistemas OLAP se caracteriza por ser un análisis multidimensional de datos corporativos, que soportan los análisis de usuario y unas posibilidades de navegación, seleccionando la información a obtener (drill Down, Roll up, etc) Existen dos tipos de arquitecturas: § MOLAP : OLAP multidimensional § ROLAP : OLAP relacional MOLAP : § La arquitectura MOLAP usa bases de datos multidimensionales para proporcionar el análisis. § Un sistema MOLAP usa una base de datos multidimensión, en la que la información se almacena multidimensionalmente, para ser visualizada multidimensionalmente ROLAP § La arquitectura ROLAP cree que Las capacidades OLAP están perfectamente implantadas sobre BD relacionales. § Los usuarios finales ejecutan su análisis multidimensional a través Del motor ROLAP que transforma sus consultas a consultas de SQL. Estas consultas se ejecutan en BD relacionales y sus resultados se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios. MOLAP § (Multidimensional Online Analytical Processing – procesamiento analítico multidimensional en línea) es un proceso analítico en línea (OLAP) que indexa directamente en una base de datos multidimencional. Por lo general una aplicación OLAP considera los datos en forma multidimencional, el usuario es capaz de ver diferentes aspectos o facetas de agregados de datos, como las ventas por tiempo, geografía y modelo del producto. Si la información se almacena en una base de datos relacional, se puede ver en forma multidimencional, pero solo mediante el acceso secuencial y el procesamiento de una tabla para cada dimensión o aspecto que se quiera ver. Cubo n-dimensional (VISTA DE UNA BASE DE DATOS MULTIDIMENSIONAL) Plant E Plant D Plant C Plant B Plant A Defects Shift 1 Shift 2 Engine A Crank Case Conn. Rod Cyl. Head Head Gasket Engine B Crank Case Conn. Rod Cyl. Head Head Gasket Injuries Shift 1 Shift 2 CARACTERISTICAS DEL CUBO § Cada dimensión tiene múltiples miembros, organizados jerarquicamente. § Se definen cálculos simples entre los miembros de las jerarquías. § Permite análisis de datos potente, incluyendo esecenarios “qué pasa si...” MOLAP Estructuras multidimensionales Herramienta OLAP El servidor MOLAP construye y almacena datos en estructuras multidimensionales. La herramienta de OLAP presenta estas estructuras multidimensionales. Servidor MOLAP Warehouse MOLAP: Estructuras multidimensionales Herramienta OLAP - Datos Arrays Extraídos del almacén de datos - almacenamiento y procesos eficientes - la complejidad de la BD se oculta a los usuarios - el análisis se hace sobre datos agregados y métricas o indicadores precalculados. Servidor MOLAP Warehouse Comparación entre MOLAP Y ROLAP ROLAP MOLAP Herramienta OLAP Herramienta OLAP Servidor Relacional Warehouse Servidor Servidor Multidimensional Cliente Desktop ROLAP/MOLAP: Ventajas e Inconvenientes: § ROLAP § pueden aprovechar la tecnología relacional. § pueden utilizarse sistemas relacionales genéricos (más baratos o incluso gratuitos). § el diseño lógico corresponde al físico si se utiliza el diseño de Kimball. ROLAP/MOLAP: Ventajas e Inconvenientes: § MOLAP: § generalmente más eficientes que los ROLAP. § el coste de los cambios en la visión de los datos. § la construcción de las estructuras multidimensionales Modelado Multidimensional: § En un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). § La información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). § La información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión). § El modelado multidimensional se puede aplicar utilizando distintos modelos de datos (conceptuales o lógicos). § La representación gráfica del esquema multidimensional dependerá del modelo de datos utilizado (relacional, ER, UML, OO, ...) Beneficios de los reportes OLAP Los reportes OLAP ofrecen varios beneficios y ventajas sobre otro tipo de herramientas OLAP. Estos beneficios son: § Flexibilidad sin precedentes: darle el poder a los usuarios finales, con una flexibilidad sin Precedentes. § Ágil toma de decisiones: facilitan la toma de decisiones ya que la generación y modificación de reportes se hace de manera rápida. § Herramienta Costo eficiente con un alto retorno en la inversión: Los ahorros se deben principalmente al rápido proceso de implementación y los costos más bajos por silla. Automatización de los reportes OLAP Para obtener lo máximo de su iniciativa OLAP, usted debe estar evaluando de manera constante su situación y hacer reportes que sean accesibles a personas con diferentes niveles de habilidad. Tan pronto usted determine cuáles son sus necesidades específicas, usted puede personalizar el sistema para que se ajuste a sus necesidades, o puede ahorrar tiempo automatizando las tareas repetitivas. Al automatizar los reportes OLAP, usted puede monitorear de manera eficiente los cambios en su organización y asegurarse de la rápida distribución de la información clave.