WHITE P APER Más rápido, más poderoso y más fuerte: la disruptiva del cómputo en memoria y qué significa S AP HANA para su empresa Global Headquarters: 5 Speen Street Framingham, MA 01701 USA P.508.872.8200 F.508.935.4015 www.idc.com Patrocinado por: SAP AG Dan Vesset Carl W. Olofson Henry D. Morris Brian McDonough Noviembre de 2011 INTRODUCCIÓN “Citius, Altius, Fortius” (más rápido, más poderoso, más fuerte) ha sido el lema de los Juegos Olímpicos modernos desde sus inicios en 1896. Barón Pierre de Coubertin, fundador de los Juegos Olímpicos modernos, afirmaba que “los atletas necesitan libertad”. Es por eso que pusimos ese lema…. Un lema para que la gente se atreva a intentar batir récords.” De este lema podemos aprender varias lecciones, las cuales se pueden aplicar a todos los ámbitos del esfuerzo humano. En la actualidad la economía global, el éxito con alto desempeño se define cada vez con más frecuencia por esa “libertad” para innovar, para brindar a los clientes mejores productos y servicios (más poderosos) y para tener la capacidad de actuar más rápido y con mayor conocimiento en plazos aún más cortos, frente a la incertidumbre de un sistema económico en rápida evolución. En el presente, la convergencia de dispositivos inteligentes, redes sociales, redes de banda ancha generalizadas y aplicaciones analíticas desemboca en un nuevo sistema económico que está redefiniendo las relaciones entre productores, distribuidores y consumidores. En la empresa, un cambio cada vez más veloz significa que los gerentes no pueden basarse únicamente en su experiencia o intuición para tomar decisiones. Los plazos más cortos para tomar decisiones requieren una respuesta rápida y a conciencia, basada en eventos internos y externos. Este nuevo entorno nos está haciendo pasar de la economía de la información a la “economía inteligente”. Lo que varía en la economía inteligente es la magnitud y el tiempo. La “magnitud” se refiere a la cantidad de datos y al tipo de fuentes de datos que surgen de una amplia red de personas y dispositivos. El “tiempo” se refiere a la necesidad de analizar los datos y actuar en tiempo real. Llevar a cabo la economía inteligente con éxito, con componentes como redes inteligentes, comercio minorista inteligente, cadenas de suministros inteligentes, gestión financiera inteligente e incluso defensa y cumplimiento legal inteligentes, dependerá de muchos factores contractuales, sociales, de estandarización y tecnológicos, tales como la capacidad de capturar, gestionar y analizar grandes cantidades de datos creados en el seno de interacciones y procesos. Necesitamos acceso a la información pero además, la capacidad de analizarla y actuar en consecuencia, todo en tiempo real, para crear una ventaja competitiva en las transacciones comerciales, permitir la gestión sustentable de las comunidades y promover una distribución apropiada de los servicios sociales, de salud y educativos. La creciente red de entidades y las relaciones entre ellas dentro de la economía inteligente van a desafiar a muchos de los sistemas existentes a que optimicen procesos que den soporte a un conjunto integrado de procesos de toma de decisiones estratégicas, operativas y tácticas. Como resultado, está surgiendo un nuevo conjunto de tecnologías para enfrentar los desafíos de la toma de decisión empresarial, de las aplicaciones analíticas y de la optimización de procesos. Estas tecnologías, basadas en procesamiento “en memoria” (o In-Memory), están creando “libertad” para que las organizaciones de los distintos sectores compitan al nivel máximo de su desempeño. Los proveedores y los usuarios de tecnología ya han comenzado a migrar hacia una tecnología en Memoria para capitalizar mejor las oportunidades que presenta la economía inteligente. Las plataformas tecnológicas en Memoria y las aplicaciones específicas integradas en esa plataforma han comenzado a cambiar de manera considerable el panorama de la computación, y creemos que seguirán haciéndolo en el futuro previsible. Durante varios meses de 2011, IDC realizó una investigación para identificar las oportunidades y desafíos en la adopción de una nueva tecnología que modifica la manera en que se implementan y se utilizan las soluciones de negocios tradicionales. En este documento se presentan los resultados de esa investigación. METODOLOGÍA El objetivo de la investigación presentada en este documento es descubrir cómo se puede mejorar la analítica, los almacenes de datos y las aplicaciones de negocio por medio de la tecnología en Memoria. Para empezar, IDC dirigió cuatro grupos de enfoque en los Estados Unidos y Alemania que reunieron información tanto de gerentes de TI como de gerentes y ejecutivos de unidades de negocios en grandes empresas públicas y privadas de diversos sectores, para medir su nivel de interés y la percepción del concepto de tecnología en Memoria aplicada a los procesos analíticos y operativos en curso. Los descubrimientos realizados en el grupo de enfoque, junto con la experiencia de los analistas, se utilizaron para elaborar una encuesta basada en Web que se tradujo a cuatro idiomas y arrojó como resultado un extenso conjunto de datos producidos por 1,002 encuestados en todo el mundo. El 70% de los encuestados eran ejecutivos y gerentes de unidades de negocios interesados en cuestiones relevantes para la analítica, la innovación de procesos y la gestión. El otro 30% eran gerentes de TI, directores y ejecutivos a cargo (o con conocimientos) de la gestión de procesos de negocios, análisis de negocios, arquitectura de sistemas o desarrollo de aplicaciones. La encuesta se completó en agosto de 2011. 2 #230964 ©2011 IDC Análisis de la información y mejores prácticas: Comparación entre los líderes del sector El acceso a información, análisis y retos de la administración económica pueden superar a las organizaciones que no están preparadas para los cambios que están surgiendo. IDC define a estas empresas como “las que andan a tientas”, en comparación con “las que buscan hechos”. Como se describe en el estudio de IDC titulado Analytical Orientation and Competitiveness: The Difference Between Fact Finders and Fumblers (IDC #223408, mayo de 2010), "las que buscan hechos" son empresas que tienen los más altos niveles de las siguientes características: Uso de aplicaciones analíticas, que se define como el grado en que los empleados del nivel de gestión de la empresa utilizan aplicaciones analíticas (en contraste a la experiencia o intuición) para la toma de decisiones. Influencia sobre las acciones, que significa hasta qué punto influye el resultado de las soluciones analíticas de la empresa en las acciones de los empleados Criticidad para la competitividad, que es el nivel percibido de criticidad de las soluciones analíticas de negocio para la competitividad de la empresa Eficacia del análisis en la toma de decisiones, realizado en distintos niveles, que se define como la importancia de la tecnología y de los procesos analíticos de negocios de la empresa para ayudar a mejorar la toma de decisiones individual, o para facilitar la toma de decisiones dentro de un grupo o entre distintos grupos Nuestra investigación demuestra que, como grupo, las que buscan hechos son mucho más competitivas que las que andan a tientas (figura 1). Entre las empresas líderes, el 80% son buscadoras de hechos: un 20% más que entre las rezagadas. Su diferenciación competitiva, basada en la aplicación analítica para los procesos de análisis ad hoc, descubrimiento o planificación, e incorporada en otras aplicaciones de negocios, seguirá aumentando en la economía inteligente. ©2011 IDC #230964 3 FIGURA 1 Porcentaje de encuestados Comparación entre competitividad de las empresas buscadoras de hechos y las que andan a tientas 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% A tientas A tientas Buscan hechos Rezagadas Buscan hechos Líderes Grupos de competitividad n = 1.000 Fuente: Analytical Orientation and Competitiveness: The Difference Between Fact Finders and Fumblers (IDC #223408, mayo 2010) Una de las características comunes de estas empresas líderes en su sector es la manera en que usan la información. Las investigaciones de IDC han demostrado que las organizaciones líderes tienden a: Basar las decisiones en el análisis más que en la intuición Basar las decisiones en los últimos datos granulares con distintas estructuras Evaluar rápidamente escenarios alternativos Reevaluar con frecuencia previsiones y planes Utilizar análisis para dar soporte a un amplio espectro de decisiones estratégicas, operativas y tácticas 4 #230964 ©2011 IDC Estas empresas líderes no están limitadas por la falta de datos más actualizados porque sus sistemas no puedan extraer o combinar datos para generar formas útiles con la rapidez necesaria. Algunas de estas líderes son: Empresas de servicios financieros cuyos sistemas comerciales habilitan decisiones de comprar y vender que se realizan automáticamente según patrones de cambios de precios, en donde hasta los microsegundos cuentan Grandes cadenas minoristas que ofrecen los precios más competitivos para sus productos y gestionan de cerca el inventario, rastreando cuidadosamente patrones de consumo y cambiando los artículos de los proveedores a las tiendas de manera óptima (esos sistemas requieren los datos más actualizados, y cuanto más puntuales sean los datos, más fácil será ofrecer productos al costo más bajo y evitar tanto el exceso como la falta de stock). Bancos que solían confiar en períodos de demora repentinos para conciliar los datos de sus cuentas de usuarios en línea, y que les daban a esos usuarios estimaciones en lugar de saldos reales de cuentas, lo cual ya no es aceptable (para gestionar saldos actuales de cuentas y rastrear numerosas transacciones de banca en línea, pago de facturas, procesamiento de cheques y cajeros automáticos se requiere la capacidad de procesar datos con la mayor velocidad posible). Estos ejemplos en conjunto demuestran que las empresas no necesitan ceder a la hora de obtener información a tiempo. Antes, las limitaciones tecnológicas determinaban la forma en que las organizaciones utilizaban sus datos. Nuestra investigación muestra que es posible estar en lo más alto de su campo de acción, ser el “más rápido, más grande y más fuerte”, si su empresa cuenta con los datos correctos, en el momento correcto y entregar a través de la tecnología correcta. Identificación de requisitos en materia de datos, análisis y puntualidad Imagine a un corredor olímpico que, al comienzo de la carrera recibe una ventaja de una décima de segundo sobre sus competidores. Eso podría hacer la diferencia entre ganar o perder la carrera. Sin embargo, la misma décima de segundo no tendría ningún sentido para un maratonista. Nuestra investigación muestra que es posible estar en lo más alto de su campo de acción, ser el “más rápido, más grande y más fuerte”, si su empresa cuenta con los datos correctos, en el momento correcto y entregados a través de la tecnología correcta. Las decisiones de negocio son iguales. Por ejemplo, una aerolínea que toma decisiones rápidas y constantes sobre los precios tiene requisitos muy diferentes al fabricante de aviones que debe decidir qué nuevo modelo de avión producir. La figura 2 ilustra las dimensiones clave para evaluar los requisitos de TI que dan soporte a una decisión de negocio específica. ©2011 IDC #230964 5 FIGURA 2 Rango de datos, análisis y puntualidad en las decisiones Variedad de datos Complejidad de los análisis Alto Bajo Volumen de datos Restricción de tiempo Fuente: IDC, 2011 Los datos pueden tener múltiples estructuras y provenir de múltiples fuentes. Pueden ser estructurados, semiestructurados o desestructurados; pueden provenir de aplicaciones empresariales, sistemas de punto de venta, flujos de clics (clickstream) de la actividad comercial en línea y las redes sociales, registros de datos de llamadas (CDR, por sus siglas en inglés), dispositivos móviles o sensores. Algunos de los datos, como los registros de llamadas, la actividad de dispositivos móviles o los datos sobre el tráfico vehicular, se pueden considerar parte de la tendencia de los grandes datos (o Big Data), en la cual se destacan los datos de gran volumen o gran velocidad, de distintos tipos. A medida que aumenta el volumen, la variedad y la velocidad de los datos que requieren ser analizados, también aumenta el requisito de contar con un sistema que pueda satisfacer los correspondientes requisitos en materia de desempeño y complejidad analítica. En uno de los grupos de enfoque, un gerente de una compañía de abogados explicó cómo los datos estructurados y no estructurados de múltiples fuentes afectaban el desempeño cuando dijo: “Necesitamos tener herramientas que nos permitan rastrear todos los datos de facturación de los clientes, provenientes de todos los canales relevantes de interacción con el cliente incluidos los dispositivos móviles. La incapacidad de hacerlo está afectando directamente nuestra rentabilidad”. A medida que aumenta el volumen, la variedad y la velocidad de los datos que requieren ser analizados, también aumenta el requisito de contar con un sistema que pueda satisfacer los correspondientes requisitos en materia de desempeño y complejidad analítica. Los análisis pueden consistir en agregaciones de datos relativamente simples o complejos modelos predictivos, con interfaces visuales e interactivas cuando el consumidor al que están destinados está a cargo de tomar decisiones, y en forma de reglas o puntuaciones cuando el objetivo es otro sistema que toma esa decisión automáticamente. A medida que aumenta la complejidad de los análisis, también aumenta la necesidad de contar con un sistema que permita a los usuarios realizar el análisis rápidamente, a veces en forma reiterada antes de poder tomar una decisión. Un mayorista de productos promocionales declaró: 6 #230964 ©2011 IDC “No basta con analizar las ventas pasadas. Necesitamos averiguar qué tipo de ventas esperar para los próximos períodos y cuán exitoso será el diseño en particular. Necesitamos ser capaces de planificar mejor para lo que necesitamos vender, o para enviar a las tiendas, o concertar fechas. Y necesitamos esos datos clasificados por país, por producto, por materia prima para poder “viajar” interactivamente a través de los datos sin tener que viajar de verdad hasta nuestros proveedores en China, Indonesia o Pakistán”. Los requisitos de puntualidad también varían, desde en tiempo real o periódicos (por hora, por día, por mes o por trimestre), hasta ocasionales o muy infrecuentes (por ejemplo, la decisión de abandonar una línea de negocios). Cuando la necesidad de análisis se aproxima al tiempo real, los métodos tradicionales tal vez no sean suficientes para resolver el problema. Un gerente de una compañía de servicios financieros indicó: “Lo que realmente necesitamos son análisis instantáneos: la capacidad de reevaluar con rapidez el valor y el riesgo de una cartera, agregando o quitando activos. Esta capacidad instantánea para responder preguntas hipotéticas es clave. Eso es lo que realmente necesitamos: obtener una respuesta enseguida". Análisis incorporados para aplicaciones más inteligentes La mayoría de la gente piensa que el procesamiento analítico sólo sirve para ayudar a tomar mejores decisiones. Si bien se trata de una función importante, tanto a nivel estratégico como táctico, el procesamiento analítico también puede estar incorporado en los procesos de negocios para hacer que las aplicaciones sean más inteligentes. De hecho, pueden automatizar muchas decisiones tácticas al aplicar los datos de inteligencia empresarial relevantes. Si el procesamiento analítico puede hacer que las aplicaciones sean más inteligentes, ¿por qué el análisis no está incorporado en todas las aplicaciones? La respuesta es simple: por lo general los datos de inteligencia de negocios suelen ser grandes y complejos, y se requiere tanto tiempo para navegar por consultas complejas que las funciones de análisis lentificarían tanto las aplicaciones que ya no serían prácticas, excepto en algunas situaciones específicas. Con la tecnología en Memoria y el procesamiento de análisis se puede acelerar hasta que ya no represente un lastre para los procesos de negocio. Al mejorar las funciones analíticas con tecnología en Memoria, es posible insertar el análisis donde sea más adecuado para hacer más inteligente una aplicación. Algunos ejemplos: Una aplicación minorista con software de gestión de inventarios que toma decisiones de forma automática en cuanto al stock y los precios, basándose en patrones y tendencias de consumo en tiempo real. Con la tecnología en Memoria, el procesamiento analítico se puede acelerar hasta que ya no represente un lastre para los procesos de negocio. Una aplicación logística que actualiza automáticamente los trayectos de los camiones, con base en el análisis del tráfico y las entregas agregadas o eliminadas de manera inesperada. Una aplicación de servicios financieros que ajusta de manera automática las posiciones de la cartera, al aplicar las reglas de cada cartera con respecto a precios y tendencias del mercado en tiempo real, y que toma y ejecuta decisiones de compra y venta basándose en ese análisis. ©2011 IDC #230964 7 La clave consiste en alinear datos, análisis y tiempo con los requisitos de cada decisión en cuanto a la respuesta para el negocio. Sin embargo, lograr esta alineación no siempre es posible para muchas empresas por la falta de tecnología o por los procesos de negocio que requerirían de un importante cambio en toda la organización para lograr la reestructuración. Los factores que impiden una respuesta rápida e inteligente Los desafíos para el negocio que generan las limitaciones tecnológicas Los desafíos para la mayoría de las empresas son muy variados, y abarcan desde problemas de comportamiento a nivel de la organización hasta fallas tecnológicas, que incluyen: La agregación y pérdida de granularidad. Los métodos tradicionales de almacenamiento de datos requieren agregar y preparar los datos antes de usarlos para los análisis. Esa pérdida de granularidad limita el análisis que pueden hacer los usuarios, porque antes de la preparación hay que realizar suposiciones acerca de cómo se van a usar los datos. Esta pérdida de granularidad puede generar decisiones menos efectivas que cuando se realizan análisis de datos más granulares. Por ejemplo, en las funciones de marketing donde la tendencia gira cada vez más en torno a la segmentación y personalización detallada de los prospectos, se está demostrando que ejecutar campañas basadas en la segmentación demográfica es cada vez menos eficaz. El acceso a datos más granulares y los análisis de una mayor cantidad de variables que influyen en el comportamiento comprador mejoran la eficacia de una campaña de marketing. La incapacidad de completar análisis dentro del plazo estipulado (para la decisión y la acción). Muchos procesos de toma de decisiones operativas y tácticas requieren tener acceso a información y funcionalidades analíticas en tiempo real (subsegundo). Cuando un almacén o mercado de datos tarda horas o incluso días en cargarse, la calidad de los datos y de los análisis puede resultar irrelevante para los encargados de tomar decisiones que actúan en tiempo real. Si la información no está disponible en el momento necesario para tomar decisiones de negocio, es lo mismo que si no existiera. La incapacidad de la TI de brindar una respuesta oportuna a los requisitos de los usuarios finales. Para la mayoría de las empresas, la relación entre negocios y TI está plagada de puntos de tensión constantes. A menudo, la falta de comunicación lleva a acusaciones mutuas y a culpar a la otra parte. Sin embargo, incluso los grupos de TI con las mejores intenciones no pueden brindar el nivel de servicio necesario para proporcionar las herramientas apropiadas que esperan recibir los usuarios finales. Menos de la tercera parte de las organizaciones coinciden totalmente en que la velocidad de respuesta de su departamento de TI a las solicitudes de acceso a la información y análisis satisface las expectativas de los usuarios finales. Lo preocupante es que ese porcentaje disminuye al 17% entre los encuestados de funciones de negocios vinculadas a CRM, tales como ventas, marketing y servicio al cliente. Además, existe una diferencia de un 10% entre los resultados de las organizaciones más competitivas (líderes), en comparación con las demás organizaciones. Una compañía de servicios financieros afirmó: “No podemos depender de TI para dar 8 #230964 ©2011 IDC soporte a cada nueva solicitud de una aplicación especializada con base en una propuesta y en el potencial de crear un gran valor. El departamento de TI ya está de por sí sobrecargado. Si no podemos entrar en la lista de los 20 principales especialistas de TI, sería mejor olvidarnos del proyecto." La incorrecta asignación de recursos en la línea de negocios, en la infraestructura de gestión informática y en el departamento de TI pueden ocasionar una serie de soluciones temporales para generar un análisis de información oportuno. Esto incluye los esfuerzos manuales realizados por expertos de negocios para reunir, limpiar y agregar datos. También incluye solicitudes futuras de líneas de negocios ocasionadas por solicitudes no completadas con anterioridad y la frustración que ello genera. A menudo se desperdician recursos de TI en la creación de un conjunto de reportes en constante crecimiento, tableros de control y otras interfaces de inteligencia de negocios, en lugar de dedicarlos a la administración de sistemas, al desarrollo de nuevas aplicaciones, a la gestión de la seguridad y a la integración de datos. Estos factores inhibidores pueden provocar que se tomen decisiones estratégicas, operativas y tácticas que no sean las mejores, y que a su vez afectan en forma considerable a las acciones subsiguientes que realizan los empleados al ejecutar la estrategia de la empresa. Más de la mitad de los encuestados en nuestra investigación respondieron que sus procesos de planificación se pueden mejorar si se tiene un mejor acceso a la información; esto demuestra que la tecnología en Memoria tiene el potencial de desplazar a la planificación tradicional basada en OLAP. Pero existe la posibilidad de mejorar el soporte a todas las decisiones importantes y actividades de automatización de decisiones, como se muestra en la figura 3. ©2011 IDC #230964 Más de la mitad de los encuestados en nuestra investigación respondieron que sus procesos de planificación se pueden mejorar al tener un mejor acceso a la información. 9 FIGURA 3 Procesos de soporte a las decisiones con las mejoras más esperadas P. ¿Cuál de los siguientes procesos de análisis, planificación o soporte a las decisiones podría mejorar más si mejorara el desempeño de su tecnología y el acceso a la información correcta en el momento adecuado? Planificación Informes Más de la mitad de los encuestados indicaron que pueden mejorar más aún su proceso de planificación al haber mejorado el acceso a la información, lo que muestra que la tecnología in-memory tiene el potencial de desplazar la planificación tradicional basada en OLAP Previsiones Modelado predictivo Análisis ad-hoc 0 10 20 30 40 50 60 n = 1.002 Fuente: IDC's SAP HANA Market Assessment, agosto de 2011 La falta de alineación entre los requisitos de negocio para los análisis oportunos y la capacidad de los sistemas de TI no es un problema únicamente organizacional. Existe una dimensión tecnológica en esta falta de alineación, y un factor significativo consiste en las limitaciones de la tecnología de las bases de datos basadas en discos. El impacto de negocios de la tecnología basada en discos, en comparación con la tecnología en Memoria A menudo se realizan análisis de negocios y se toman decisiones usando estructuras de datos gestionados, tales como mercados de datos o cubos analíticos, los cuales, a su vez, se alimentan de datos provenientes de un almacén de datos empresarial o fuentes de datos operacionales de diversos tipos. Para construir o actualizar esas estructuras se requiere tiempo y recursos de personal, y por lo general se deben programar con anticipación. El problema es que los desafíos de negocio pueden surgir repentinamente y los requisitos pueden cambiar rápido, y un sistema demasiado lento para reaccionar ante los cambios de negocio puede impedir que se logren los objetivos de la empresa. … un sistema demasiado lento para reaccionar puede impedir que se logren los objetivos de la empresa. Muchos gerentes y analistas recurren a obtener subconjuntos de datos de una u otra manera, y a menudo suelen construir sus propias hojas de cálculo en lugar de confiar en que la TI elabore las estructuras que necesitan. Como consecuencia, a veces 10 #230964 ©2011 IDC basan las decisiones clave en datos incompletos, mal formados y a menudo incoherentes. El acceso a datos más granulares que brinda la tecnología en Memoria hace posible tomar decisiones enfocadas y tomar acciones rápidamente. En los grupos de enfoque, pedimos a los participantes que imaginaran escenarios en sus empresas en los cuales fuera posible tener acceso en tiempo real o análisis rápidos. Hubo reacciones muy personales con respecto al impacto que la capacidad generaría en sus carreras profesionales. Desde un fabricante que piensa cómo un cambio en el pedido de un cliente importante que se produzca en el sistema de transacciones se reflejaría de inmediato en los planes de producción de toda la empresa, hasta un gerente de fondos de inversión que necesite analizar derivados que contienen estrategias de inversión dentro de estrategias de inversión para comprender realmente el riesgo que acarrean en un determinado momento, el entusiasmo ante tantas posibilidades estuvo presente en los gerentes de todos los sectores. La TI estuvo un poco más escéptica, cosa que es comprensible, porque adoptar bases de datos en Memoria (IMDBs) significa pasar de las técnicas tradicionales de gestión de bases de datos a algo perturbador y revolucionario. Software SAP HANA: una plataforma para análisis y aplicaciones en tiempo real SAP HANA es una nueva plataforma de software diseñada de manera específica para dar soporte a aplicaciones operativas y analíticas. Permite el análisis instantáneo de grandes cantidades de datos de diversas estructuras y la incorporación de análisis a las aplicaciones operativas. La plataforma SAP HANA permite que las empresas analicen sus operaciones de negocios usando grandes volúmenes de datos operacionales detallados en tiempo real, mientras se llevan a cabo las actividades comerciales. Los datos operacionales se capturan en la memoria y están disponibles para el análisis instantáneo, lo que elimina el típico tiempo muerto entre el momento en que los datos se capturan en las aplicaciones de negocios y el análisis de esos datos mediante de los sistemas de informes. Esta solución brinda conocimientos sobre las operaciones de negocios directamente desde la base de datos de producción. Este dispositivo en Memoria combina el software SAP con hardware de los socios estratégicos de la empresa. SAP HANA es una nueva plataforma de software específicamente diseñada para dar soporte a aplicaciones operativas y analíticas. En la actualidad, el software SAP HANA se implementa como plataforma para SAP NetWeaver Business Warehouse (SAP NetWeaver BW), como aplicaciones preempaquetadas desarrolladas por SAP y como una plataforma para que los clientes y socios de SAP desarrollen sus propias aplicaciones. SAP HANA y SAP NetWeaver Business Warehouse SAP NetWeaver BW permite a los usuarios modelar, construir, poblar y consultar un almacén de datos, o mercado de datos. En general, esto implica crear una base de datos relacional para gestionar el almacén. Las consultas e informes implican ejecutar algunas instrucciones SELECT bastante complejas de SQL. Estas instrucciones pueden requerir bastante tiempo para ejecutarse, debido a la naturaleza de la forma en que se almacenan los datos y se recuperan del disco, mediante el uso de filas e índices de tablas. SAP HANA representa una manera totalmente diferente de gestionar los datos de un almacén de datos. En lugar de que los datos se asignen a tablas relacionales ©2011 IDC #230964 11 almacenadas en discos, se conservan en estructuras de memoria tipo columnas. En lugar de buscar datos en entradas de índices y de usar referencias indirectas para localizar las páginas del disco donde residen los datos, SAP HANA recorre toda la estructura de la memoria, y explora velozmente a través de las columnas y sigue los apuntadores de memoria, para reunir con rapidez los datos deseados. Como resultado, las consultas se ejecutan mucho más rápido en comparación con sus bases de datos relacionales equivalentes basadas en discos, y sin embargo el proceso de modelar y reportar datos sigue siendo igual de directo para el usuario. SAP NetWeaver BW no es un producto nuevo, pero la implementación de SAP NetWeaver BW en SAP HANA sí es una novedad, e incluye características tales como una mayor rapidez en el desempeño de las consultas y los procesos de carga de datos, y características tales como ejecutar funciones de planificación y tener la funcionalidad de retroescritura (write-back) en la memoria. Como ejemplo, esta tecnología permite planificaciones más rápidas e integradas para casos de uso tales como la planificación de promociones comerciales o la planificación de surtidos. Aplicaciones SAP basadas en SAP HANA SAP ofrece distintas aplicaciones que se benefician con esta tecnología en Memoria SAP HANA. Las aplicaciones resuelven problemas en procesos dispares, ya sea permitiendo el análisis en tiempo real de datos basados en sensores u ofreciendo una manera de realizar análisis de múltiples escenarios con rapidez, para mejorar la planificación. SAP BusinessObjects Strategic Workforce Planning fue la primera aplicación introducida que aprovecha la plataforma SAP HANA. La aplicación permite un análisis rápido de las posibles tendencias en la oferta de recursos humanos (RR.HH.) y las compara con la demanda anticipada en las empresas. Por medio de este análisis, una empresa puede mejorar su capacidad de capitalizar las oportunidades y reducir costos de RR.HH. Una mejor comprensión del impacto financiero de los futuros costos de RR.HH. también beneficia el proceso de planificación financiera, ya que los costos de RR.HH., que incluyen indemnizaciones, capacitación y contratación, suelen implicar un gasto significativo. Asimismo, las organizaciones a menudo tienen partes de la fuerza laboral que necesitan una mayor transparencia. Estos empleados son estratégicos para las operaciones por sus aptitudes especializadas o niveles de experiencia, y donde hay que anticipar y evitar los cambios negativos de la rotación antes de que la empresa sufra una degradación en su desempeño operativo, o picos repentinos en los costos de contratación. SAP Smart Meter Analytics es una aplicación diseñada para las empresas de suministros que sufren un aumento exponencial del volumen de datos a causa de la implementación de medidores inteligentes. Esta nueva aplicación permite que las empresas de suministros conviertan volúmenes masivos de datos provenientes de medidores inteligentes en conocimientos útiles, y transformen la manera en que suman clientes y operan sus actividades comerciales. SAP Smart Meter Analytics ofrece las siguientes funcionalidades para las empresas de suministros: 12 Agrega en forma instantánea bloques de tiempo de uso y perfiles de consumo total para analizar el uso energético de los clientes según el vecindario en que se encuentren, el tamaño de sus hogares o empresas, el #230964 ©2011 IDC tipo de edificación y cualquier otra dimensión, en cualquier nivel de granularidad. Segmenta a los clientes con precisión, basándose en los patrones de consumo de energía que se generan automáticamente al identificar a los clientes que tienen un comportamiento similar en cuando al uso de la energía. Provee reportes comparativos sobre eficiencia energética, basándose en análisis estadísticos para que las empresas de suministros puedan ayudar a sus clientes a comprender dónde se encuentran con respecto a sus pares y cómo pueden mejorar su eficiencia energética Les brinda a los clientes acceso directo a los datos sobre el uso de energía a través de portales de Internet y dispositivos móviles conectados a SAP Smart Meter Analytics por medio de servicios Web Estas funcionalidades que ofrece SAP Smart Meter Analytics permiten que las empresas de suministros aumenten la cantidad de opciones de servicio tales como los programas de respuesta a la demanda, que lancen programas de eficiencia energética para destinatarios específicos, mejoren la detección del fraude y desarrollen nuevas tarifas y previsiones de carga más precisas. SAP Dynamic Cash Management ofrece a la oficina de finanzas un mayor nivel de conocimientos sobre las variables que afectan el flujo de efectivo, en lugar de depender únicamente de modelos de alto nivel basados en historiales para mejorar las operaciones de gestión del efectivo. Los pagos en efectivo basados en múltiples dimensiones como producto, cliente, socio o geografía se pueden incorporar al proceso de análisis y planificación. El mayor nivel de granularidad en los datos que se utilizan para comunicar un plan puede mejorar la precisión y, en última instancia, la liquidez de la empresa. Estos son sólo algunos ejemplos de aplicaciones desarrolladas por SAP basadas en la plataforma SAP HANA. Tanto SAP como sus clientes y socios están desarrollando muchas otras aplicaciones basadas en SAP HANA. Algunas de estas aplicaciones son versiones mejoradas de aplicaciones existentes. Otras son aplicaciones nuevas que antes no eran viables. Algunos ejemplos de esto último son: la gestión dinámica de efectivo, la gestión del tráfico vehicular y los análisis de ensayos clínicos. La figura 4 muestra aplicaciones que, según los participantes de nuestras investigaciones, podrán beneficiarse más con la tecnología In-Memory. ©2011 IDC #230964 13 FIGURA 4 Aplicaciones con el mejor potencial para beneficiarse con la tecnología en Memoria P. ¿Qué tipos de aplicaciones beneficiarían más a su empresa o unidad de negocios gracias a la tecnología en Memoria? Análisis de servicio al cliente An. financieros (planific., consolidación y cierre) Análisis de marketing An. Cad. Sum. y operac. (inventario, logística, fraude) Los beneficios de la tecnología InMemory se pueden aplicar a las aplicaciones de toma de decisiones estratégicas, operativas y tácticas Análisis de precios y optimización Análisis de ventas Análisis de rentabilidad de cliente o producto An. Tesoro (gestión de efectivo y del riesgo) Análisis click-stream del sitio Web 0 10 20 30 40 50 n = 1.002 Fuente: IDC's SAP HANA Market Assessment, agosto de 2011 Soluciones SAP Rapid Deployment para SAP HANA Las soluciones SAP Rapid Deployment (RDS, por sus siglas en inglés) son soluciones que reúnen software, plantillas y guías que capturan mejores prácticas junto con servicios empaquetados previamente establecidos para una implementación con costos y plazos fijos. Las dos primeras soluciones de SAP RDS para SAP HANA destinadas a casos de uso populares son: Elaboración de informes operacionales de ERP con SAP HANA. Los informes operacionales de ERP suelen llevar mucho tiempo para procesar y entregar. Sumando a SAP Rapid Deployment con SAP HANA, las empresas pueden acelerar la elaboración y entrega de informes operativos comunes, como pedidos de venta por cliente, tasa de ejecución, artículo abierto flexible del cliente, análisis de artículo abierto del cliente, recibo de productos y descripción de facturas. Análisis de rentabilidad con SAP HANA. Con el acelerador SAP CO-PA, las empresas pueden ganar rapidez y eficiencia en sus ciclos de rentabilidad y procesos de cierre a fin de mes. Gracias a estos conocimientos más profundos y en tiempo real, las empresas pueden develar nuevas oportunidades de 14 #230964 ©2011 IDC maximizar la rentabilidad, optimizar las decisiones vinculadas a la mezcla de productos, la fijación de precios y la estrategia de ventas. La solución SAP Rapid Deployment ERP para los análisis de rentabilidad con SAP HANA combina el acelerador SAP CO-PA con servicios de precio y de plazos fijos para una rápida implementación. DESCRIPCIÓN DEL MERCADO La tecnología en-Memoria como plataforma para una nueva generación de análisis de la información y aplicaciones de negocios El objetivo de los Juegos Olímpicos modernos siempre ha sido ofrecer un foro internacional donde los atletas de la elite mundial se junten y compitan, que es a lo que Pierre de Coubertin se refería con “la libertad”. Del mismo modo, para ser líderes y competir en el más alto nivel de la economía inteligente actual, las empresas necesitan contar con una plataforma que les permita lograr su máximo desempeño. Uno de los componentes clave de esa plataforma es la tecnología en Memoria. La tecnología en Memoria se puede aplicar a cualquier tipo de decisión, en cualquier línea de negocios y en cualquier industria. Como se muestra en la figura 5, los beneficios de negocios que se esperan por usar tecnología en Memoria pueden generar retornos mensurables, así como un análisis más preciso y rápido de los datos de negocios. Entre estos beneficios de negocios, el que se menciona con más frecuencia es el de mejorar la precisión de las planificaciones, un factor fundamental para mejorar la toma de decisiones para los ejecutivos, gerentes de líneas de negocios y analistas operacionales. Estos beneficios representan una mezcla de mejoras a los procesos de negocios y productividad, o una mayor eficiencia. Por ejemplo, el segundo beneficio que se menciona con más frecuencia es una reducción del tiempo que el personal de negocios dedica a la integración y agregación de datos. Esto es un notorio sumidero de tiempo que obliga al personal de negocios a desperdiciar mucho tiempo en tareas que serían realizadas de una mejor forma por la tecnología en sí y por el personal de TI que da soporte a esa tecnología. Nuestra investigación dejó al descubierto un problema importante, enfocado en la necesidad de realizar un modelado más frecuente de simulaciones con datos granulares. La capacidad de realizar análisis de simulación según se necesite con datos altamente granulares, de ejecutar múltiples escenarios y en última instancia tratar un problema de negocios o comprender el potencial que puede tener una nueva oportunidad, fue un requisito clave en todas las industrias, regiones geográficas y tamaños de empresas. Esta sensación se ha repetido tanto en los grupos de enfoque como en los datos de la encuesta. Por otro lado, los encuestados que respondieron que no tenían acceso a la información correcta en el momento correcto dijeron que la información relevante no se agregaba de la manera en que lo requerían. Estos encuestados desean eliminar las limitaciones que imponen los datos agregados a su capacidad para evaluar planes de acción alternativos, realizar descubrimientos, tomar decisiones informadas y mitigar los riesgos. ©2011 IDC #230964 15 FIGURA 5 Beneficios que se esperan de la tecnología en-Memoria aaaaaaaaaaaaaaaaaa Más datos granulares disponibles para análisis y el sistema realiza agregaciones cuando se le solicita aaaaaaaaaaaaaaaaaa La velocidad del análisis aumenta el conocimiento y permite incluir analítica a procesos clave de neg. La tecnología In-memory elimina la barrera para aaaaaaaaaaaaaaaaaa investigar y encontrar el sentido a los datos de desempeño de la organización Mejora en la precisión de la planificación 37,3 Menor tiempo del personal de negocios para preparar, limpiar y agregar datos 35,6 Aceleración de los resultados de los análisis 33,5 Capacidad de analizar datos más granulares en lugar de información previamente agregada Las aplicaciones combinan los beneficios de la tecnología in-memory conaaaaaaaaaaaaaaaaaa el contexto de negocios por medio de una interfaz interactiva Interfaz de usuario más flexible y más interactiva La velocidad del análisis permite realizar más aaaaaaaaaaaaaaaaaa escenarios en un determinado día que con las soluciones tradicionales de planificación Capacidad de ejecutar más planificación o escenarios Los usuarios pueden realizar consultas ad-hoc que no aaaaaaaaaaaaaaaaaa estén limitadas por conjuntos de datos predefinidos Respuestas a preguntas que antes no podíamos formular La velocidad del análisis permite que los usuarios de negocios cuestionen presunciones, reevalúen los aaaaaaaaaaaaaaaaaa resultados potenciales y repitan con rapidez Mayor frecuencia de reevaluación de modelos analíticos, planes, previsiones 32,7 29,4 29,0 27,6 26,6 % de encuestados n = 1.002 Fuente: IDC's SAP HANA Market Assessment, agosto de 2011 Del mismo modo, los beneficios de TI de la tecnología en Memoria, como se muestra en la figura 6, pueden generar importantes ahorros en costos y una mejor asignación del personal de TI. Los dos beneficios principales de TI son: menos tiempo para crear agregaciones de datos y menos tiempo para la administración de las bases de datos. Estos dos problemas, que se tratan con más detalle en otra parte de este documento, apuntan a fallas clave de los métodos existentes de gestión y análisis de la información que requieren estrategias para resolver las limitaciones de rendimiento de los sistemas basados en disco. Tanto los beneficios de negocios como los beneficios de TI son importantes. Si bien los beneficios de TI son más inmediatamente tangibles que los beneficios de negocios, los beneficios de TI tienen un límite. Por ejemplo, hay tanto que se puede ahorrar moviendo a los administradores de bases de datos (DBA) a proyectos de consolidación o reducción tecnológica y soporte al usuario, en lugar de optimizar el almacenamiento. Al final, los beneficios de negocio derivados de mejores interacciones con los clientes, operaciones optimizadas o una mejor gestión financiera adaptada al riesgo, aumentarán el valor de la organización. 16 #230964 ©2011 IDC Beneficios de TI Opinión de IDC sobre la computación In-Memory aaaaaaaaaaaaaaaaaa Más instancias de planificación, se pueden emplear escenarios y variables para planificar, y realizar ajustes a medida que se actualiza el desempeño FIGURA 6 P. ¿Cuáles esperaría que fueran los mayores beneficios de negocio y de TI de la tecnología in-memory para su empresa o unidad de negocio? No se necesitan predefinir agregaciones de datos en cubos estructurados. Sin embargo, los cubos estruct. se aaaaaaaaaaaaaaaaaa pueden aplicar y acelerar cuando se necesite, por Ej., para una aplicación de consolidación y cierre. Menos tiempo en creación de datos y agregaciones Menos tiempo dedicado por los DBA a refinar constantemente las bases de datos para mejorar su desempeño. Guardar datos en memoria evita toda la actividad de E/S y el trabajo que los DBMS deben hacer para asignar datos desde y hacia el disco Menos tiempo en tareas de administración de bases de datos Reasignación del personal dedicado de administración de TI a tareas de mayor valoraaaaaaaaaaaaaaaaaa agregado. Se requieren menos DBA para mantener una IMDB en comparación con los sistemas basados en disco. Reducción en costos operativos de TI para gestionar información Acceso instantáneo y autoservicio a datos granulares por parte del personal de la unidad de negocios, lo que aaaaaaaaaaaaaaaaaa permite que la TI se dedique a la integración de datos, calidad de datos, seguridad y administración de sist. Mejor utilización del personal de TI al quitarles la carga de las tareas de acceso a la información y análisis a la línea de negocios Procesamiento de más información con menos recursos de computación que requieren menos gasto de capital en aaaaaaaaaaaaaaaaaa comparación con los enfoques tradicionales basados en discos Reducción en costos de gastos de capital de TI en gestionar información aaaaaaaaaaaaaaaaaa 38.2 35.6 32.7 Beneficios de TI Opinión de IDC sobre la computación In-Memory Beneficios de TI que se esperan de la tecnología en-Memoria 27.6 26.6 % de encuestados n = 1.002 Fuente: IDC's SAP HANA Market Assessment, agosto de 2011 El poder del cómputo en Memoria es que puede habilitar nuevos procesos donde los análisis y la toma de decisiones ocurren antes de tomar una acción, en lugar de realizar un análisis después de haber llegado al resultado de esa acción. Algunos ejemplos de procesos que podrían mejorar al convertir la analítica en un proceso operacional son: Detección de fraudes. Por ejemplo, pensemos en una compañía de seguros que toma una decisión estratégica para ofrecer pagos de reclamaciones en un plazo de 24 horas después de recibir la reclamación. Antes de implementar una solución basada en la tecnología en Memoria, haría el pago como lo prometió y luego analizaría la reclamación para ver si hay fraude. Después de implementar una solución basada en la tecnología en Memoria, la compañía puede analizar la reclamación al momento de recibirla, asignar puntuaciones a las reclamaciones según la probabilidad de que sean fraudulentas, y evitar los pagos a los solicitantes de mayor riesgo en primera instancia. Además, la organización puede comenzar a incorporar más fuentes de datos para ayudar a mejorar la detección de fraudes, manteniendo en todo momento su alto nivel de servicio para los clientes legítimos. Gestión del desempeño de los ingresos de los clientes. Por ejemplo, pensemos en un minorista que realiza una campaña de marketing por e-mail y que quizás no está alcanzando los objetivos de ventas de un producto en ©2011 IDC #230964 17 particular. Sin un análisis rápido, le puede llevar varios días o incluso semanas comparar el desempeño real con el planificado. Pero las transacciones pueden ocurrir cualquier día. Una solución basada en la tecnología en Memoria proporcionaría al minorista datos de desempeño diario casi en tiempo real, y permitiría que ocurrieran distintas acciones juntas o separadas, según los objetivos del minorista. Por ejemplo, el minorista podría decidir expandir la promoción de su producto a clientes que compraron productos relacionados recientemente, o que tienen la probabilidad de realizar otra compra basándose en el desempeño pasado. El minorista puede ajustar el precio aún más para maximizar los ingresos y cumplir con los objetivos de venta. La capacidad de realizar análisis en múltiples escenarios de los resultados en los que cualquiera de estas decisiones pudiera influir requiere análisis rápidos y acceso a los datos en tiempo real, algo que una solución en Memoria puede ofrecer. Descripción del mercado de la tecnología en Memoria Durante mucho tiempo, la industria del software DBMS (sistema de administración de bases de datos) ha quedado rezagada a causa del paradigma relacional, que ha demostrado ser tanto una bendición como una maldición. La bendición del modelo de DBMS relacional es que su simplicidad y amplia posibilidad de aplicación ha permitido que la tecnología DBMS se transforme en la manera estándar de almacenar y gestionar una aplicación de negocios, lo que trae orden y facilidad de gestión tanto a los datos como a las aplicaciones que los utilizan. La maldición es que las bases de datos relacionales no pueden albergar metadatos semánticos (que describen los datos con significado) ni representar directamente conceptos de organización de datos, tales como la multidimensionalidad, la contención, la derivación, la recursividad o la recolección. Esta limitación ha obligado a los DBA a almacenar datos que reflejen esos conceptos en combinaciones misteriosas de tablas de referencias cruzadas que requieren uniones múltiples y complejas para navegar y para encapsular la gestión de las combinaciones relacionales de esa tabla en código de programa o procedimientos almacenados, ambas cosas que, al no contar con documentación detallada, tienden a ocultar la naturaleza real de la manera en que los datos se organizan en forma lógica. El DBMS en Memoria es una importante dimensión del entorno DBMS y se hará más importante en los años venideros. El cambio en la economía computacional que produce una abundancia de procesadores y memoria va fomentar que cada proveedor de DBMS se mueva en esa dirección en el futuro. Es probable que, cuando la memoria en estado sólido (SSM) disminuya su precio, la memoria principal sea considerada como el "hogar" principal de una base de datos, que la memoria en estado sólido se considere el área superflua y que los discos queden relegados únicamente a las funciones de recuperación. El IMDB se está comenzando a considerar como la etapa inevitable en la evolución de la gestión de bases de datos. DES AFÍOS Y OPORTUNIDADES Las oportunidades de emplear tecnología en Memoria traen consigo muchos desafíos. Existen algunos problemas potenciales, ya sean percibidos o reales, que deben ser superados por las organizaciones que procuran implementar tecnología en Memoria, como SAP HANA. Por ejemplo, existen desventajas con respecto a los 18 #230964 ©2011 IDC mecanismos y a la frecuencia recomendada para actualizar SAP HANA (a partir de múltiples fuentes), en comparación con la acción de determinar un nivel aceptable de latencia (desde una perspectiva de negocios) entre las actualizaciones. Además, los métodos tradicionales para construir y mantener una infraestructura de cómputo que apoyen el análisis y las aplicaciones no serán adecuados al momento de cambiar a la tecnología en Memoria. Las prácticas establecidas de TI han conducido a los potenciales adoptantes de la tecnología en Memoria a tener falsas creencias acerca de la tecnología que ellos mencionan como desafíos para el despliegue. IDC descubrió las siguientes creencias erróneas, tanto en los grupos de enfoque como en los encuestados durante la realización de este estudio (véase la figura 7): El costo de la tecnología. La mayoría de los encuestados (35%) cree que el costo de la tecnología en Memoria que se les describe será un desafío para su organización o unidad de negocios a la hora de decidir comprar e implementar esta tecnología. Si bien es cierto que cualquier recurso nuevo de computación implica un costo, habría que tener en cuenta los beneficios para el negocio al momento de decidir si hay un retorno adecuado de la inversión. No olvidemos que la aplicación de la tecnología a un problema de negocios específico va a generar decisiones financieras apropiadas. El departamento de TI puede explicar con más detalle de qué manera la tecnología en Memoria pueden alinear mejor los recursos de los DBA y manejar más datos con menos recursos de computación. Integración de datos de múltiples fuentes y múltiples tipos de estructura. Los otros dos desafíos que más se mencionan son la integración de datos desde distintas fuentes y la integración de datos de distintos tipos. La integración de diversas fuentes de datos siempre ha sido un problema para las técnicas tradicionales de almacenamiento de datos. Y, si bien el IMDB no hace desaparecer este problema, puede facilitar la tarea de relacionar más datos con menos agregaciones que requieran una planificación anticipada de las consultas que puedan realizar los usuarios. Escalabilidad para manejar grandes conjuntos de datos y casos de uso de Big Data. Fue interesante descubrir, durante esta investigación, que los potenciales usuarios de en Memoria pensaban que la escalabilidad podría ser un problema, cuando el objetivo mismo de la tecnología IMDB es hacer más datos accesibles incluso aunque aumente la frecuencia de los análisis en los que se usan. Los debates de los grupos de enfoque revelaron que muchos de los que trabajan en TI sienten que no se eliminan los cuellos de botella de las bases de datos tradicionales basadas en discos. Quizás la única forma de superar esta creencia sea ver la tecnología en acción. Acceso de usuarios y gestión de la seguridad. La mayoría de los gerentes de TI esperan que un sistema listo para la empresa gestione el acceso de los usuarios y la seguridad con integraciones de facto estándares de la industria, y las tecnologías IMDB dan soporte a esta funcionalidad. Sin embargo, los grupos de enfoque revelaron que el acceso a los datos en tiempo real podría acarrear un uso inadecuado, especialmente en los servicios financieros, en donde un comerciante puede tomar una acción en tiempo real antes de que un sistema de cumplimiento pueda reaccionar y evitar una acción riesgosa. O alguien que ©2011 IDC #230964 19 ejecute un análisis de datos de producción interna podría tomar una decisión o elaborar un informe en cualquier momento, y esos datos podrían variar con respecto a alguien que ejecute el mismo informe unos minutos más tarde y que llegue a una conclusión diferente. La TI tendrá que delinear la diferencia entre el análisis de simulación de escenarios en tiempo real, en comparación con los informes de producción u operacionales que cumplan con los requisitos y tengan etiqueta de fecha y hora. Cuando la libertad de la información se hace disponible a un nivel amplio, existe una cierta pérdida de control, pero se trata de un problema de políticas y de educación del usuario, y no una falla tecnológica. FIGURA 7 ROI y TCO atractivos, incluyendo menos costos administrativos,aaaaaaaaaaaaaaaaaa gastos generales y memoria. Factor de forma soft. aplicativo. El costo de esa tecnología Es más fácil relacionar datos con IMDB que en un almacén de datos tradicional, y se dedica aaaaaaaaaaaaaaaaaa menos tiempo a la agregación. Integrar múltiples fuentes de datos Se puede acceder a, gestionar y analizar múltiples estructuras de datos, incluidos datos aaaaaaaaaaaaaaaaaa operativos y de sensores. Integrar diversos tipos de datos (datos operativos estructurados con datos de texto no estruct.) Los clientes pueden usar casos incluidos en CPG, empresas de suministros, recursos y organismos gubernamentales, con grandes volúmenes de datos La escalabilidad de esa tecnología (para volúmenes de datos muy grandes) SAP brinda herramientas y puntos de integración paraaaaaaaaaaaaaaaaaaa gestionar acceso a usuarios. Gestionar derechos de acceso del usuario y seguridad Las aplicaciones se pueden rescribir para aprovechar todos los beneficios de la IMDB y se han creado nuevas aplicaciones que las IMDB hacen posibles. La posible necesidad de reescribir la aplicación existente SAP HANA viene listo para la empresa y da aaaaaaaaaaaaaaaaaa soporte al respaldo y recuperación necesarios. Posibles problemas de respaldo 23.6 y recuperación de datos Reemplazar cuando se requiere, agregar soluciones en implementaciones existentes y aaaaaaaaaaaaaaaaaa aprovechar las aplicaciones en tiempo real. Decidir qué hacer con las inversiones existentes en interacciones de datos, mercados y almacenes de datos aaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaa 35.2 33.0 28.0 25.9 25.5 24.7 Factor inhibidor percibido Opinión de IDC sobre SAP HANA Falsas creencias sobre la adopción de la tecnología en Memoria 23.4 % de encuestados n = 1.002 Fuente: IDC's SAP HANA Market Assessment, agosto de 2011 La necesidad de sobrescribir aplicaciones existentes. Ya existen y seguirán existiendo dos grupos de aplicaciones incorporados en la tecnología en Memoria. El primero incluirá aplicaciones actualmente disponibles que requieren algún nivel de modificación para habilitar todos los beneficios de la plataforma en Memoria sobre la que están construidas. El segundo grupo va a incluir nuevas aplicaciones que antes no eran viables sin la tecnología en Memoria. Entonces, se sobrescribe cuando es necesario, pero las nuevas aplicaciones pueden tener la clave para acceder a las mejores oportunidades para la empresa. 20 #230964 ©2011 IDC Respaldo, recuperación y disponibilidad. Una falsa creencia con respecto a IMDB es que no tiene las propiedades de atomicidad, coherencia, aislamiento y durabilidad (ACID, por sus siglas en inglés) de una base de datos transaccional. Esto no es cierto. La mayoría de las implementaciones de IMDB que se usan para el procesamiento de transacciones aún tienen registros de transacciones para la recuperación de errores y pueden llevar esos registros a un almacenamiento físicamente persistente, tal como SSM o disco. Muy pocos ofrecen una posibilidad de recuperación total por medios en los que no se realicen registros. También suelen replicar sus contenidos de memoria a otros servidores para proporcionar una funcionalidad de alta disponibilidad a través del soporte a las fallas. Además de que IMDB replica datos para fines de alta disponibilidad, algunos productos de IMDB también operan como clusters nada compartidos, lo que significa que incluso los modelos de grandes memoria de sistemas de 64 bits no son una limitación: pueden manejar bases de datos que son muchas veces más grandes que su propia memoria principal. Las inversiones existentes. El departamento de TI ha construido almacenes de datos y mercados de datos en toda la empresa, algo que cuesta tiempo y dinero. Al construir en torno (o como apoyo) a esas inversiones existentes para aprovechar el acceso en tiempo real o el análisis veloz en donde un proceso de negocios pudiera beneficiarse de ellas, esas inversiones serán valiosas fuentes de datos, conservarán su finalidad actual y se mejorarán mediante IMDB cuando se necesite. Los clientes de SAP pueden esperar una respuesta técnica más tangible durante este año, que demuestre de qué manera es posible migrar las estructuras existentes fácilmente a SAP HANA. RECOMENDACIONES Recomendaciones para gerentes de negocios SAP HANA es una tecnología que se puede aplicar para resolver muchos problemas de negocios. Cuando trate de decidir si la tecnología es apropiada para mejorar procesos de negocios específicos, hay que tener en cuenta lo siguiente: Examine el proceso para identificar dónde se toman las decisiones y cuestiónese si es el momento más adecuado para tomar una decisión dentro de un proceso, y si esa decisión está respaldada por información relevante y oportuna. A menudo, un proceso con un acuerdo de nivel de servicios inherente tendrá un escenario donde el nivel de servicio podría mantenerse con menor riesgo o costo, o mejorarse para la diferenciación competitiva si se efectúa un análisis vinculado al impacto de esas decisiones en el nivel de servicio con mayor velocidad o con una mayor precisión. Es más probable que la acción de agregar una tecnología IMDB en este punto decisivo conduzca a mejoras de negocios. Examine en qué partes de un proceso el acceso a los datos en tiempo real es una necesidad. Quizás no parezca posible obtener acceso a datos en tiempo real para los procesos que podrían aprovecharlos, pero si la barrera es tecnológica, entonces se puede aplicar una tecnología IMDB. Si otros procesos, o incluso fuentes externas de datos, son cuellos de botella para sus procesos, ©2011 IDC #230964 21 tenga en cuenta de qué manera la aplicación de tecnología IMDB para esas variables podría acarrear mejoras en el resto del proceso para su propia empresa. Examine un proceso en el cual el personal realice análisis con menor frecuencia que los cambios reales dentro de un proceso y la tecnología IMDB pueda resolver este problema. Por ejemplo, la gestión de inventario se suele realizar con base en la agregación latente de datos de oferta y demanda. Pero cuando se pueden tomar decisiones basadas en flujos de inventario reales durante un día, entonces podría haber una reducción de eventos de falta de stock o advertencias tempranas de una degradación en el desempeño del proveedor. Los procesos que pueden hacer que su organización funcione más rápido, a un nivel más alto y más fuerte, son aquéllos que están más cerca del cliente, la oficina de finanzas o las operaciones centrales. Enfocarse primero en un proceso a mejorar es algo que puede generar resultados demostrables, además de una experiencia invaluable, lo cual hará que su empresa se convierta en una organización ganadora. Recomendaciones para gerentes de TI El surgimiento de DBMS en Memoria como forma dominante no va a ocurrir de la noche a la mañana. Los gerentes de TI deberían tener en cuenta cómo podrían hacer evolucionar sus sistemas de TI de tal forma que puedan explotar la tecnología IMDB tanto ahora como en el futuro. El enfoque actual centrado en las columnas de SAP HANA es adecuado para la carga de trabajo analítica, pero a medida que SAP HANA evoluciona, hay distintos modelos para organizar los datos que podrían manejar cargas de trabajo operativas y no esquemáticas (o NoSQL) con la misma eficacia. Las empresas deberían desafiar a sus proveedores existentes de DBMS para que les proporcionen un calendario para IMDB y explicarles cómo planean llegar allí. No todos los datos están creados iguales. A algunos se accede muy poco y se les puede guardar en disco porque no son volátiles, y los discos son económicos. A otros se accede con más frecuencia y pueden guardarse en la memoria en estado sólido (también conocida como memoria Flash). Pero los datos dinámicos en línea necesitarán guardarse cada vez más en la memoria todo el tiempo. Los gerentes de TI deberían tener en cuenta cuántos datos tienen de cada tipo (y cuántos podrían tener en el futuro), para realizar sus planificaciones. Están apareciendo tecnologías de alta velocidad para el movimiento y el acceso a los datos por muchos frentes. Las llamadas tecnologías “Big Data” apuntan a algunos desafíos que nunca se pensó que podrían surgir. Los datos cada vez aumentan más en volumen y complejidad, y la competitividad del negocio requiere la capacidad de acceder a los datos a un nivel granular y en forma muy oportuna. La tecnología en Memoria es esencial para cumplir con ese requisito, y SAP HANA es un claro ejemplo de cómo funciona esa tecnología en la actualidad. El problema es que las dificultades de negocios pueden surgir en forma repentina, los requisitos pueden cambiar rápidamente, y un sistema que requiere una descarga 22 #230964 ©2011 IDC en lote de una base de datos basada en disco, seguida por la construcción de un cubo basado en disco o la carga de un mercado de datos basado en disco, requiere tanto tiempo que la ventana de oportunidad puede pasar antes de que los datos estén disponibles para tomar acción. Los sistemas basados en disco requieren trabajos en lote de larga duración para el movimiento de los datos, además de tiempo y esfuerzo para cargar los datos en volúmenes de disco. Pero supongamos que no hubiera volúmenes de disco. Supongamos que los datos pudieran moverse a la velocidad de los procesadores y de la red interna, y colocarse de manera dinámica en la memoria para un análisis veloz. Esa es la idea detrás de los sistemas de bases de datos en Memoria. Este enfoque acelera enormemente tanto la preparación de los datos analíticos como el acceso a esos datos. Como los datos se pueden cargar y ajustar en mayores volúmenes, y se puede acceder a ellos más rápido con la tecnología en Memoria que con la tecnología basada en disco, es posible gestionar más datos a un nivel más granular. Esto genera una mayor precisión, además de la capacidad de tomar decisiones orientadas y acciones de negocio con rapidez. La tecnología de base de datos en Memoria surgió como una manera fundamental de aumentar el desempeño y la escalabilidad, y de contener los costos de almacenamiento. Esta tecnología ha pasado de usarse únicamente para caché, o para sistemas de datos de extremadamente alta velocidad, a ser usada en aplicaciones de TI mucho más cercanas al proceso central de negocios. El uso de IMDB ahora se aplica de maneras que ofrecen un mejor desempeño y responde con flexibilidad a la creciente demanda de los usuarios a un bajo costo incremental. En la actualidad, los procesadores son órdenes de magnitud más rápidos de lo que eran hace tan sólo una década. La mayoría de los sistemas tienen múltiples procesadores y múltiples núcleos por procesador. Los servidores empresariales suelen usar direccionamiento de memoria de 64 bits y contienen varios gigabytes de memoria principal. Esto significa que la economía de la computación se ha volcado a favor de las bases de datos en Memoria para muchas cargas de trabajo. Los beneficios para la TI al usar IMDB Reduce los costos operativos. Un requisito clave de los centros de datos actuales es que gestionen, o incluso reduzcan, el espacio físico que ocupan y los costos operativos de las bases de datos, además de manejar su constante crecimiento de tamaño y la exigencia de los usuarios para ofrecer un mejor desempeño. La nueva economía de la computación, que deriva de los grandes modelos de memoria, capacidad de direccionar 64 bits, procesadores rápidos y memoria económica, hacen posible diseñar tecnología de bases de datos que sea mucho más rápida y escalable de lo que era posible, cuando la única opción era basar la gestión de datos en discos. Reduce la sobrecarga para mejorar drásticamente la velocidad de acceso a los datos. Una IMDB gestiona sus datos en la memoria principal. Los índices contienen punteros de memoria en lugar de referencias a páginas y líneas en el disco. Los datos se cambian de lugar para optimizar la memoria en lugar de usar estrategias para optimizar el disco. Una IMDB en general es mucho más rápida que una base de datos basada en disco, dependiendo de la carga de trabajo. ©2011 IDC #230964 23 Esto tiene que ver con su arquitectura interna de almacenamiento. Una base de datos en disco está diseñada desde cero para optimizar su gestión de datos con base en una estrategia de disposición óptima en el disco y de minimización de operaciones de E/S. Reduce registros pendientes de DBA. Una barrera fundamental para la escalabilidad de una base de datos en disco es el cuello de botella que representa el sistema de almacenamiento. Los DBA pasan una gran parte de su tiempo reconstruyendo índices, descargando y volviendo a cargar datos, y reasignando datos en volúmenes de almacenamiento para minimizar el tiempo de E/S. Esto ocasiona una cola de registros pendientes con las tareas de mayor valor que podrían estar efectuando si no fuera por esas actividades esenciales de “mantener la luz prendida”. La mayor parte del proceso de optimizar las bases de datos para la escalabilidad implica estrategias vinculadas a la distribución de los datos en los volúmenes de disco, en la colocación de datos relacionados para reducir la posibilidad de consultas cruzadas entre distintos volúmenes, en la diseminación de datos a los que se accede con frecuencia pero al azar para reducir la contención de datos, etc. Incluso con todo esto, el acceso a los datos a través de los canales de E/S agrega una sobrecarga inevitable. Mantener los datos en la memoria y evitar no sólo toda la actividad de E/S, sino también todo el trabajo que el núcleo de DBMS debe realizar para asignar datos desde y hacia el disco, o para encontrar el volumen correcto para cada elemento de una consulta o actualización, da como resultado un sistema que no sólo es más eficiente sino que también se adapta al aumento de la demanda y a los incrementos en los volúmenes de datos, sin necesitar esfuerzos especiales del DBA para mejorar el almacenamiento. Una IMDB suele usar el disco únicamente para la recuperación. Escribe el registro (si lo hay) en el disco, y vuelca el contenido de su memoria al disco de vez en cuando. Como el disco no forma parte de las transacciones de la base de datos, los datos volcados en el disco se pueden empaquetar juntos. Como resultado, no es ningún problema llenar un volumen hasta el tope. Además, como el disco no afecta el desempeño, se puede utilizar el almacenamiento económico de nivel inferior. En situaciones de ampliación, donde las bases de datos en clusters utilizan datos almacenados en forma redundante y en particiones, este efecto de ahorro es muy apreciado. Las características de SAP HANA Además de utilizar tecnología de computación en Memoria, SAP HANA ofrece las siguientes características y funcionalidad: Alto nivel de compresión de datos y almacenamiento en columnas, lo que permite mantener todos los datos relevantes en la memoria principal. Almacenar filas de tablas en forma de bloques con columnas indexadas seleccionadas es un enfoque extremadamente ineficiente para las bases de datos que se suele usar para las cargas de trabajo analíticas. Esto sucede porque muchas operaciones de bases de datos analíticas escanean tablas y realizan operaciones de agregación sobre los datos, por lo general en columnas seleccionadas, y porque, cuando seleccionan filas al azar, es sólo para algunas columnas de la fila y no para toda la fila. Almacenar datos en columnas implica 24 #230964 ©2011 IDC almacenar tablas como bloques por columna y no por fila. Una ventaja es que se pueden realizar operaciones en una columna de datos con muy pocas operaciones de E/S. Otra es que, como la columna contiene todos los datos del mismo tipo, se puede comprimir con mucha facilitad a una pequeña fracción de su tamaño usando la indexación para eliminar valores duplicados y luego comprimir los valores. Una vez hecho esto, cualquier selección al azar de la tabla va a tener un resultado muy rápido, porque cada columna, de hecho, está indexada. Las estructuras de índices que definen esas columnas pueden indexarse en forma cruzada para optimizar mejor el acceso. Capacidad de partición de datos para permitir un rápido procesamiento y cálculo paralelos al instante, usando procesadores multinúcleo. Muchas bases de datos en disco logran la escalabilidad gracias a la acción de particionar los datos entre los distintos volúmenes. SAP HANA utiliza esta técnica para extender sus datos entre servidores dentro de un cluster. Esto no sólo permite una mejor ejecución en paralelo de las operaciones de datos, sino que también permite que SAP HANA se adapte a tamaños de datos mucho más grandes que puedan ser direccionados por cualquier servidor. Este enfoque también garantiza la recuperación, porque los datos administrados por un servidor son replicados a uno o más de los otros servidores, que pueden funcionar como servidores de refuerzo en caso de que falle el servidor principal. Latencia casi-cero entre transacciones y analítica con replicación de los datos en tiempo real a partir de los sistemas de negocios. Como no hay operaciones de E/S involucradas, los sistemas de negocios pueden acceder a los datos al instante en SAP HANA. La capacidad de replicación no sólo garantiza la capacidad ante fallas (como se describió antes), sino que también permite un alto grado de compartición de datos entre diferentes aplicaciones y bases de datos que utilizan los mismos datos subyacentes. La tecnología en Memoria es un factor fundamental que posibilita el acceso y los análisis de datos en tiempo real, además de una respuesta rápida a las cambiantes condiciones del negocio. La mayoría de los datos empresariales actualmente se gestionan en sistemas de almacenamiento en disco. Este ha sido el paradigma para la gestión de datos desde la década de 1960, y nos ha sido de gran utilidad. Pero a medida que aumenta el ritmo de los negocios, mantener datos en discos presenta algunos obstáculos para su uso eficiente: Las bases de datos en discos están optimizadas para mover datos entre la memoria y el disco, usando un montón de instrucciones de cómputo para hacerlo. Como resultado, aumenta de manera considerable la sobrecarga de procesamiento dentro de un servidor de base de datos, únicamente para realizar el seguimiento de los datos en el disco. Se calcula que más del 90% de las instrucciones ejecutadas por un DBMS basado en disco implica algún aspecto de la gestión de los datos en el disco. Cuando se cambian las definiciones de los datos en el disco, hay que descargar y volver a cargar los datos para convertirlos al nuevo formato, y a veces es necesario reconstruir índices. Todo esto requiere mucho tiempo del personal y del sistema, y se genera un período durante el cual los datos no están disponibles. ©2011 IDC #230964 25 Los datos deben asignarse a volúmenes, y si cambia la distribución o el tamaño del conjunto de datos, deben reasignarse para que su uso sea eficiente. Esa reasignación requiere tiempo del personal y del sistema, y puede interrumpir las operaciones de TI. En cambio, las bases de datos en Memoria no requieren una sobrecarga en la gestión del disco, los cambios de formato se pueden realizar en la memoria y no necesitan reestructuración, y los datos no necesitan reasignarse a medida que crecen o cuando cambian las distribuciones de valor. Asimismo, por supuesto, las bases de datos en Memoria no requieren tiempo de espera de E/S, lo que aumenta y mejora en forma substancial la capacidad de procesamiento de datos. Con el tiempo, una empresa aumenta el volumen de datos que debe gestionar. Es allí cuando aumenta la exigencia de acceso rápido y análisis oportunos para esos datos, cuando la tecnología en Memoria se convierte en una alternativa cada vez más atractiva en comparación con los sistemas basados en discos. CONCLUSIÓN Durante 2012 experimentaremos un uso extraordinario de la visualización de datos, del descubrimiento interactivo, de la analítica geoespacial, de la analítica móvil y de la analítica predictiva para evaluar el desempeño en tiempo real... y esto es sólo por seguir la cobertura de los Juegos Olímpicos de Londres. Esto debería ayudar a reforzar la necesidad de que las empresas reevalúen sus sistemas de TI existentes para optimizar las operaciones y la analítica empresarial. Es inevitable que la tecnología en Memoria para empresas en los sectores público y privado permitirá que los gerentes muevan la organización a los niveles más altos de competitividad por medio de la "libertad". Y esto será posible gracias a las plataformas para mejorar el desempeño que promuevan la innovación, que reduzcan los perjuicios para la TI y que permitan el acceso a la información por parte de las personas correctas en el momento oportuno. Aviso de copyright Publicación externa de información o datos relacionados con IDC: toda información de IDC que se use en publicidad, comunicados de prensa o material promocional requiere la aprobación previa por escrito del correspondiente vicepresidente o gerente de país de IDC. Toda solicitud debe venir acompañada de un borrador del documento propuesto. IDC se reserva el derecho de negar la aprobación para uso externo por cualquier motivo. Copyright 2011 IDC. Está prohibida su reproducción sin permiso por escrito. 26 #230964 ©2011 IDC