BI In-Memory bajo la lupa: Analizando a fondo la Arquitectura Actual Rodrigo Batista Carvalho Objetivo Comprender bajo la lupa las diferentes arquitecturas In-Memory actuales. Explorar la esencia técnica de lo que hace cada una diferente y entender cual es la mejor tecnología para impulsar las decisiones empresariales. Demostrar por qué algunas herramientas ofrecen mas beneficios comparativamente. En otras palabras, explicar el “ingrediente secreto” de una herramienta “In-Memory 2.0” Trasfondo Desde siempre, analistas y fabricantes han luchado por tratar de explicar convenientemente el origen del enorme atractivo de las nuevas herramientas de BI, principalmente las “In-Memory”. Cada herramienta describe sus diferenciales tecnológicos de una manera. ¿Es “In-Memory” hacer un marketing exagerado? ¿Existe alguna tecnología verdaderamente diferenciadora mientras tantas soluciones? ¡¡¡Debe ser la característica En-memoria!!!! “En-memoria” es sólo un medio para lograr un fin. Sólo es una tecnología capacitadora. En sí misma y por sí misma no significa nada, a menos que demuestre su valor empresarial. Existen ahora diversas soluciones “En-memoria” en el mercado. Si la característica “En-memoria” es tan especial ¿por qué no son todas las herramientas que tienen éxito de mercado y/o por qué no erosionan la cuota de mercado na de la otra? En-memoria – El Mercado Varias tecnologias: QlikView – asociativo “In Memory” COGNOS TM1 – OLAP “In Memory” SAP HANA – RDBMS/OLAP “In Memory” Tableau – Columnar “In-Memory” Varias otras herramientas implementan tecnicas de “caching In Memory” En varias herramienas, el approach ha sido de adaptacion y no un verdadero cambio de arquitetura La sopa de letras de OLAP • MOLAP – Multidimensional Online Analytical Processing • También conocido como ”Cube Based OLAP” • ROLAP – Relational Online Analytical Processing • También conocido como ”Real Time Queries” • HOLAP – Hybril OLAP • Una combinación de los dos anteriores Entonces debe de ser por su velocidad y flexibilidad, ¿no? Balance técnico – Carencias en la Arquitectura de consultas: Rápido Flexible ROLAP HOLAP Depende Depende MOLAP Asociativo es Rápido y Flexible Rápido Flexible MOLAP ROLAP HOLAP Depende Depende Asociativo ¿Es lo suficientemente rápido y flexible? Hay otras soluciones, además de las associativas, que ofrecen un análisis rápido y flexible al mismo tiempo. Ej. Ejecutar una herramienta de consultas en tiempo real sobre una base de datos de soporte rápido a la toma de decisiones, como Neteeza. ¿Por qué este tipo de solución no se percibe como algo revolucionario, como el approach asociativo? Arquitecturas basadas en consultas Historia del Análisis • El análisis mediante consultas ha sido el status quo, la tendencia dominante, en los últimos 50 años • Devuelve agregados como resultados de una consulta • Cada consulta es independiente y aislada • Cada consulta es aislada fundamentalmente de cualquier otra consulta • Si desea cambiar los datos tiene que descartar los resultados de la consulta anterior y efectuar una nueva consulta • Los conjuntos de resultados no se ”Asocian” a otras consultas Asociativo no se basa en consultas • Toda herramienta del mercado actual que utiliza SQL Queries como base de su análisis es ”Basada en consultas” • Esto incluye a todas las herramientas MOLAP, ROLAP y HOLAP. ¿Qué quiere decir Asociativo? Dicho de una manera muy simple, la arquitectura asociativa es una arquitectura en la que, a nivel interno, del motor de datos, todos los puntos de datos, incluidos los agregados, conservan siempre sus asociaciones a todos los demás puntos de datos, incluidos otros agregados. Arquitectura Basada en Consultas - Ejemplo Motor de Datos Base de Datos Consulta 1 Consulta 2 Consulta 3 Capa de Aplicaciones Arquitectura Asociativa - Ejemplo Conjunto de Datos En Memoria Motor Asociativo Capa de Aplicaciones Ventajas empresariales de la Arquitectura Asociativa La arquitectura asociativa no necesita reconfigurarse para responder a nuevas preguntas de negocio y eso hace con que sea rápido de desplegar. Como la arquitectura asociativa retiene todas las asociaciones entre todos los campos que se están analizando, los usuarios finales encuentran que todo es mucho más fácil de usar e intuitivo. Pero, lo que es más importante, como asociativo permite al encargado de la toma de decisiones interactuar con sus datos de una manera holística, como un todo unificado, y no en trozos aislados, fragmentados, se logran mejores decisiones empresariales. Un Ejemplo Imagine que necesita comprender el funcionamiento interno de un motor de combustión (aunque todos sabemos que sus datos de negocio son mil veces más complejos). Con las arquitecturas basadas en consultas se le permite ver una pieza cada vez, aisladas y completamente aparte de su contexto. Como esto… Valor de negocio – Herramientas basadas en consultas Valor de negocio – Herramientas basadas en consultas ¿Cuánto le costaría entender cómo funciona el motor? Esto es lo que está sucediendo cuando tratamos de usar una herramienta basada en consultas (cualquier herramienta basada en consultas) para comprender los datos de nuestro negocio. Pero ¿qué pasa con la arquitectura asociativa?... Valor de negocio – Arquitectura Asociativa Usando la Tecnología Asociativa tenemos acceso a un motor completo, en funcionamiento, con cada pieza en su correspondiente lugar de relación (o asociación) respecto a todas las demás piezas. Podemos tocar un poco el acelerador (ejecutar una selección) y ver cómo afecta esto a la entrada de combustible, al carburador y al tubo de escape. Podemos observar la bomba de pistones y girar el amortiguador. Podemos descomponer el motor a nuestro antojo y ver cada pieza de forma aislada o en su contexto, con las piezas que lleva al lado. Asociaciones Basadas en Consultas Application Layer Consulta 1 Consulta 2 Como las asociaciones ofrecen un valor enorme para las empresas, los proveedores de herramientas basadas en consultas han tratado siempre de proporcionarlas. Esto es perfectamente posible, pero sólo funciona cuando el desarrollador de la capa de aplicación conoce cuáles serán las consultas con antelación. Esto limita severamente la flexibilidad de la solución, y por tanto el valor empresarial que proporciona. Consulta 3 Normalmente sólo se ve en soluciones de nicho (muy específicas), donde las preguntas y consultas exactas de negocio se saben con antelación. Resumen • La tecnología en-memoria es una pista falsa. Se trata de una tecnología meramente instrumental /capacitadora. • Incluso aunque el asociativo es al mismo tiempo rápido y flexible, mientras que la mayoría de herramientas son lo uno o lo otro, eso todavía no explica suficientemente el verdadero diferenciador clave de las herramientas asociativas. • Todas las herramientas basadas en consultas (básicamente todas las demás herramientas del mercado excepto las asociativas) muestran unos resultados de consulta que están desconectados y divorciados de las asociaciones a otros puntos de datos en el conjunto de datos analítico. • La arquitectura asociativa hoy dia es el ”ingrediente secreto” que permite a todos los datos analizados estar siempre permanentemente conectados con todos los demás datos. Preguntas