I N F O R M E E J E C U T I V O D E De qué forma Big Data transforma la protección y el almacenamiento de datos Agosto 2012 Escrito por Carla Arend Patrocinado por CommVault Introducción: De qué forma Big Data transforma el almacenamiento Omøgade 8 P.O.Box 2609 2100 Copenhagen, Denmark P.45.39.16.2222 Big data es una de las fuerzas transformadoras que están impactando en el sector de TI actualmente. Las actitudes en relación a big data van desde el sarcasmo hasta el entusiasmo, pero IDC está seguro de que big data transformará la forma en que diseñamos y utilizamos los sistemas de TI y, lo que es incluso más importante, big data cambiará la forma en la que se toman las decisiones empresariales basándose en la precisión y la actualidad de los datos disponibles para la toma de decisiones. En este artículo se aborda la forma en la cual la aparición de casos de utilización de big data afecta y transforma las necesidades de infraestructura de almacenamiento. ¿Qué es big data? Big data es una dimensión de análisis y una dimensión de almacenamiento, y gran parte de la discusión acerca de big data se centra en la forma en la que las empresas pueden obtener una ventaja competitiva del análisis de fuentes de datos existentes y emergentes en tiempo real. Estas nuevas necesidades en el aspecto analítico también tienen un impacto en el modo en el que se establece la arquitectura de almacenamiento. IDC define big data de la siguiente manera: “Las tecnologías big data describen una nueva generación de tecnologías y arquitecturas, diseñadas para extraer el valor económico de grandes volúmenes de una amplia variedad de datos, al permitir la alta velocidad de captura, descubrimiento y/o análisis”. IDCEB11U I D C Figure 1 Los cuatro elementos de big data Fuente: IDC, 2012 Big data se puede describir en base a los siguientes cuatro elementos: 2 Volumen. El desafío de manejar volúmenes de datos cada vez más grandes no es algo nuevo para los administradores de almacenamiento. Sin embargo, big data puede llevar a las empresas a los límites de su arquitectura actual más rápidamente. Variedad. Big data permite a las organizaciones analizar datos que han sido generados fuera de la organización, como los datos de medios sociales y los datos climáticos, así como los datos que se han generado de sensores, sistemas de puntos de venta, etiquetas RFID, cámaras de video vigilancia, etc. Estos nuevos tipos de datos plantean nuevos interrogantes acerca del gobierno de la información y aumentan el volumen de los datos almacenados. Velocidad. Los datos llegan a la organización a una velocidad creciente y el análisis de big data apunta a generar beneficios en tiempo real. Por consiguiente, el rendimiento es un elemento clave de la infraestructura de TI subyacente. ©2012 IDC Valor. El análisis de big data tiene como objetivo crear una ventaja competitiva única para las organizaciones, a través de un mejor entendimiento de las preferencias del cliente, para segmentar de forma más granular los clientes y para dirigir promociones concretas a segmentos específicos. Las organizaciones del sector público también están utilizando big data para impedir el fraude y ahorrar dinero de los contribuyentes, así como para proporcionar mejores servicios a los ciudadanos, por ejemplo, en la atención sanitaria. Los casos de utilización de big data están surgiendo en todas las industrias; el entusiasmo y la creatividad son el denominador común. En general, los enfoques de big data pueden dividirse en dos: los que optimizan los datos actuales y los procesos analíticos con nuevas tecnologías, y los que usan la tecnología para abrir nuevas oportunidades de negocio para sus organizaciones y piensan de forma diferente. Los desafíos de almacenamiento derivados de big data Mientras los casos de utilización de big data están surgiendo en todos los sectores, impulsados por usuarios empresariales que crean nuevas oportunidades de negocio, los administradores de TI se enfrentan al desafío de revisar sus enfoques de almacenamiento y protección de datos actuales, porque las tecnologías de big data tienen la capacidad de romper con los procesos de almacenamiento actuales y hacer necesarios otros nuevos. ¿Cómo modifican estos cuatro parámetros la necesidad de protección de datos? ¿A qué desafíos se enfrentan los administradores de TI? Volumen. El incremento de los volúmenes de datos es el desafío más comúnmente conocido por los administradores de almacenamiento. Se esfuerzan por reducir las ventanas de copia de seguridad, a pesar de que los ciclos de copias de seguridad son más largos debido a los volúmenes más grandes de datos. También pasan apuros con la necesidad de acortar los procesos de restauración. Big data acelera estos desafíos y plantea la cuestión de la modificación de la arquitectura de los procesos de copias de seguridad, así como cuestiones acerca del valor de los datos y si todos los datos deberían tratarse de igual manera. Variedad. Los diferentes tipos de datos, no todos ellos generados en la organización, suscitan la cuestión de la gobernanza de la información. ¿Cómo proteger los datos que han sido generados en la web social? ¿Cómo se puede aplicar una política a los datos que están almacenados en ambientes cloud, se analizan en el ambiente cloud, pero que constituyen la base para decisiones empresariales importantes? Velocidad. El rendimiento es el atributo clave de big data y el menor tiempo de decisión es uno de sus beneficios. Esto incrementa la necesidad de rendimiento en la infraestructura de almacenamiento. Valor. El objetivo del análisis de big data es crear valor adicional para la organización. Esto suscita la cuestión acerca del valor de ©2012 IDC 3 los datos que se almacenan. La diferenciación entre los datos sigue siendo un desafío y muchas empresas tratan todos los datos de la misma manera, debido a la falta de una alternativa eficaz. Otra dimensión de valor es encontrar los datos relevantes y ponerlos a disposición para el proceso de toma de decisiones, especialmente la información no estructurada. Los beneficios de big data ¿Cómo puede el almacenamiento ayudarnos a obtener valor y una ventaja competitiva de los datos? Aunque gran parte de la ventaja competitiva surge de los avances en el aspecto analítico, el almacenamiento también desempeña un papel importante para posibilitar el uso de big data: 4 Proporcionando una gestión de datos basada en una política. Cuando las organizaciones empiezan a implementar big data deben revisar la arquitectura de la información y la gobernanza de la información. Permitiendo la búsqueda de datos mediante la indexación inteligente. Encontrar datos y ponerlos a disposición para la gestión y la toma de decisiones es otra manera de añadir valor. Asegurando el rendimiento del almacenamiento. El rendimiento es el parámetro clave para big data, ya que el valor surge del análisis de datos en tiempo real. Una gestión de datos eficaz asegura un rendimiento de almacenamiento óptimo. Almacenando los datos muy eficazmente para contener la huella de almacenamiento (duplicación, unificación, compresión, por niveles, instantáneas). La eficacia de almacenamiento es un medio clave para proporcionar valor a la organización. Si los datos se almacenan del modo más eficaz, la huella de almacenamiento se puede contener al mínimo, y la organización puede liberar recursos y dinero para invertir en innovación. Proporcionando acceso a los datos desde dispositivos móviles. Cada vez son más los trabajadores móviles que acceden a los datos desde dispositivos móviles inteligentes. Esto es especialmente cierto para los datos importantes para la toma de decisiones. Los administradores de TI necesitan prepararse para esto. Utilizando el almacenamiento en cloud cuando es pertinente. Parte de big data crea, analiza y almacena en entornos cloud. El movimiento de grandes cantidades de datos en las redes sigue siendo un desafío para el rendimiento, así que el almacenamiento en cloud debe ser parte de la combinación de almacenamiento en los casos que sea pertinente. ©2012 IDC Las mejores prácticas de almacenamiento para el soporte de big data De los casos de utilización actualmente conocidos, podemos destacar algunas de las mejores prácticas emergentes en la gestión de datos en big data: Revisar la arquitectura de su almacenamiento. Algunos conjuntos de datos en big data requieren múltiples copias activas que estén protegidas mediante la replicación en lugar de la tradicional copia de seguridad. Muchas empresas utilizan una combinación de instantáneas, replicación y copias de seguridad para proteger los conjuntos de datos en big data. Tome un punto de partida en su infraestructura de almacenamiento actual y entienda cómo puede evolucionar beneficiándose de una nueva arquitectura o de las nuevas tecnologías. Entender sus datos. Especialmente en lo que respecta a big data, no todos los datos son igual de importantes ni necesitan la misma protección. Cuando observamos el proceso de big data, los datos entrantes seguramente necesitarán almacenarse, pero en algunos casos se tratan de datos temporales y simplemente pasan por la organización sin ser almacenados. Los algoritmos son generalmente la parte más valiosa porque consisten en un diferenciador único para cualquier organización. Los resultados del análisis no necesariamente tienen que ser almacenados porque algunos conjuntos de datos se vuelven a crear más rápido de lo que se restauran. El gobierno de los datos se vuelve más complejo. Cuando se utilizan tipos adicionales de datos en la combinación del análisis, las organizaciones deben entender las normas de privacidad asociadas a estos datos. Esto es así para los datos generados fuera de la organización, pero también para los datos que están almacenados en ambientes cloud. Conclusión: Big data transformará el almacenamiento. ¿Cómo se puede usted beneficiar? A medida que big data evoluciona en Europa, las organizaciones también necesitan mejorar sus infraestructuras de almacenamiento. Sin embargo, muchos de los desafíos de almacenamiento creados por big data son bien conocidos y comprendidos solo en menor escala. Se recomienda a las organizaciones que mejoren su infraestructura de almacenamiento, no que destruyan y cambien la que utilizan actualmente. Los proveedores de almacenamiento están innovando constantemente para abordar los nuevos desafíos y big data ya está en los planes de algunos de ellos. Consulte con su proveedor de almacenamiento o socio de canal de distribución y pídale su punto de vista acerca del mercado de big data. IDC también recomienda el uso de servicios de arquitectura para entender el impacto que la utilización de big data puede tener en su organización. Los casos de utilización de big data difieren mucho dependiendo del sector y del tamaño de la empresa, difiriendo así el valor de los datos utilizados para el análisis. Entender la creación de valor a través del proceso ayuda a desarrollar una infraestructura de almacenamiento eficaz. ©2012 IDC 5 A V I S O D E C O P Y R I G H T La opinión del analista, el análisis y los resultados del estudio presentados en este informe ejecutivo de IDC se han extraído directamente de los estudios más detallados publicados en los continuos servicios de inteligencia de IDC. Si desea utilizar cualquier información de IDC con fines publicitarios, para notas de prensa o material promocional necesitará el consentimiento previo por escrito de IDC. Para solicitar permiso para citar o hacer referencia a IDC o para obtener más información acerca de los informes ejecutivos de IDC, póngase en contacto con los servicios de lanzamiento al mercado de IDC al gms@idc.com o con la línea de información de GMS en el 508-988-7610. Para obtener más información acerca de la suscripción y los servicios de consultoría de IDC visite www.idc.com y para obtener más información acerca de los servicios de lanzamiento al mercado de IDC visite www.idc.com/gms. Copyright 2012 IDC. Se prohíbe la reproducción sin autorización. 6 ©2012 IDC