Guía de mejores prácticas La gestión de datos a escala de petabytes con almacenamiento de objetos Mejores prácticas para el centro de datos moderno Guía de mejores prácticas Página 2 Las TI deben ser capaces de almacenar y acceder con eficacia a los datos adecuados al instante. Sin embargo las arquitecturas tradicionales de almacenamiento de archivos y bloques se enfrentan a los retos del crecimiento explosivo actual de los datos. Nuevas fuentes de datos como las redes sociales, el Internet de las cosas, las aplicaciones móviles, etc. poseen redes de almacenamiento existentes a punto de reventar. A medida que crecen los volúmenes de datos, también lo hacen la complejidad y el coste de almacenar y gestionar los datos. Se estima que, en los próximos cinco años, más de un billón de aplicaciones intercambiará 58 zettabytes de datos entre más de 100.000 millones de dispositivos.1 En la Economía de las ideas actual, la capacidad de una empresa para crecer está directamente relacionada con su capacidad para almacenar, gestionar y utilizar datos. Comprender cómo gestionar esta explosión de los datos ya no es una preocupación específica a los administradores de almacenamiento o directores de TI, sino que debería ser una preocupación principal de todo el personal ejecutivo. Los subsistemas de almacenamiento de clase empresarial están diseñados para abordar los requisitos de almacenamiento para velocidades de datos transaccionales esenciales para el negocio a escala de terabytes (hasta los niveles bajos de petabytes). No obstante, no resulta infrecuente que estas fuentes de datos no estructurados escalen con rapidez a decenas o cientos de petabytes o incluso más. El enfoque tradicional del almacenamiento basado en SAN puede que no sea capaz de hacer frente a estas necesidades de maneras eficaces y rentable. El almacenamiento SAN tradicional simplemente resulta demasiado costoso y complejo de implementar para gestionar datos a escala de petabytes. Los nuevos tipos y fuentes de datos precisan un enfoque moderno con la última tecnología de almacenamiento. Almacenamiento de objetos La capacidad para las soluciones de objetos y archivos con escalabilidad horizontal presentará un crecimiento anual compuesto de más del 40 % hasta el 2019. 1 Investigación interna de HP (ahora Hewlett Packard Enterprise), 2014; hpematter.com/issue-no-1june-2014/why-open-open-cloud-matters Estamos acostumbrados a pensar sobre los datos en términos de archivos y bloques. Los sistemas de almacenamiento basados en SAN se organizan de esa manera. En el almacenamiento de objetos, los datos se tratan más como un objeto que como un bloque o archivo, con metadatos y un ID de objeto para identificar de manera única cada objeto de datos. Las limitaciones en cuanto a tamaños de bloque y archivos existentes en los sistemas de almacenamiento tradicionales se eliminan, al igual que aquellas relativas al número de bloques o archivos que se pueden almacenar. A diferencia de las SAN (y en especial las cabinas flash SAN), las soluciones de almacenamiento de objetos no están diseñadas para rendimientos de IOPS y latencia de misión crítica. En su lugar, el almacenamiento de objetos se ha diseñado para ofrecer fiabilidad coherente para datos a escala de petabytes, soportando un ancho de banda elevado con cargas de trabajo en paralelo con latencia tolerable e IOPS adecuadas. ¿Cuál es la fiabilidad del almacenamiento de objetos? Los distribuidores afirman que un rendimiento de hasta quince 9 usando técnicas como codificación para control de errores a fin de reconstruir con rapidez aquellos datos que se pudieran corromper o perder. Las soluciones de almacenamiento de objetos aprovechan el almacenamiento local basado en servidores, lo que permite que las TI escalen con facilidad a cientos de petabytes hoy, al mismo tiempo que ofrecen una ruta despejada y rentable para ampliar a escalas de exabytes o incluso zettabytes en el futuro. Guía de mejores prácticas Página 3 Gestionar el almacenamiento de contenidos a granel para "océanos" de datos en rápido crecimiento compuestos por datos estructurados o semi-estructurados requiere el movimiento al almacenamiento de objetos y archivos de escalabilidad horizontal. Las soluciones de almacenamiento de objetos ofrecen nuevas capacidades revolucionarias a través de almacenamiento definido por software que son sencillas, rentables, escalables y que se pueden implementar con rapidez. Mejores prácticas para el almacenamiento de objetos El almacenamiento de objetos ofrece a las empresas nuevas alternativas para almacenar datos estructurados y no estructurados a escala de petabytes. Al igual que ocurre con la tecnología, hay buenas prácticas para aplicar al uso y la implementación de tecnología para hacer frente a un conjunto específico de objetivos empresariales. Comprender los casos de uso para el almacenamiento de objetos Al igual que ocurre con la mayor parte de las tecnologías, existen varias condiciones y casos de uso en los que el almacenamiento de objetos es la mejor opción y otros en los que el almacenamiento conectado en red tradicional (NAS) es la mejor opción. El almacenamiento de objetos resulta óptimo para: •Descargas de archivos y contenido web •El acceso de datos a nivel de archivo/objeto, como vídeos, imágenes médicas, etc. •El acceso a datos de uso infrecuente, como datos de archivo y almacenamiento en frío •Entornos masivos de almacenamiento de datos con escalabilidad horizontal (decenas o cientos de PB) •Contenido estático (es decir, datos que no se modifican activamente) como datos de sensor, imágenes y archivos de vídeo con latencias más bajas. Un número creciente de aplicaciones ofrecen soporte nativo para el almacenamiento de objetos. Guía de mejores prácticas Página 4 Algunos de los casos de uso clave para el almacenamiento de objetos incluyen: •Alternativas empresariales de archivo y copia de seguridad al uso de cintas, con latencias más bajas para el acceso de datos y sin el mantenimiento a largo plazo de los sistemas de unidades de cintas. •Archivos activos de conformidad, análisis, vigilancia y otros datos de archivo y objetos donde los contenidos escalan a petabytes. •Envío de contenidos de comunicaciones, medios y entretenimiento, que incluyen aplicaciones como el vídeo a demanda. •Los proveedores de servicios que ofrecen el almacenamiento como un servicio para ofertas de consumidor y empresa, como copias de seguridad alojadas, archivo, recuperación ante desastres y sincronización/intercambio. •Nuevos servicios web y nativos de nube para la implementación de nubes públicas y privadas locales, donde se precisan arquitecturas de almacenamiento distribuido. •Aplicaciones emergentes que aprovechan el Internet de las cosas, donde los datos no estructurados y derivados de sensores precisan un repositorio que pueda escalar a miles de millones o incluso billones de objetos. Una solución de almacenamiento de objetos no es adecuada para: •Datos de aplicaciones transaccionales que se modifican con frecuencia (es decir, bases de datos y discos raíz). El almacenamiento de bloques que puede ofrecer baja latencia y replicación de datos sincrónica es más adecuado para estas cargas de trabajo. •Entornos de archivos compartidos que requieren una vista única y actualizada de un archivo a todo el personal con acceso, utilizando bloqueo de nivel de archivo y facilidades de intercambio de archivos (por ejemplo, desarrollo de contenidos, CAD/CAM, documentos actualizados de manera activa, etc.) El almacenamiento conectado a la red (NAS) o algunas soluciones de sistemas de archivo en clúster con escalabilidad horizontal son la mejor opción para estas cargas de trabajo. Guía de mejores prácticas Página 5 Implementar una solución de almacenamiento definida por software y agnóstica respecto a la tecnología RTL II se conoce por multiplicar por diez las velocidades de transmisión de vídeo. El canal de TV alemán RTL II necesitaba dar soporte a un archivo de vídeo en rápido crecimiento, que se ampliaba en 200 terabytes cada año. Usando servidores HPE, el canal pudo garantizar la emisión de la última información de las retransmisiones, aumentar la cantidad de contenido vídeo en streaming online, simplificar el soporte con un diseño de hardware estándar y reducir el tiempo de transferencia para un vídeo de 40 MB de 60–70 minutos a 6,5 minutos. Las soluciones de almacenamiento definidas por software ofrecen fiabilidad y disponibilidad de grado empresarial, facilidad de uso y la capacidad para escalar de una manera rentable. Existen muchas arquitecturas de almacenamiento de objetos viables y soluciones de gestión de almacenamiento definido por software, como Scality RING, Cleversafe dsNet, Ceph y OpenStack® Swift. Una solución de almacenamiento definida por software abstrae el almacenamiento lógico de los recursos físicos, lo que permite que las TI seleccionen el hardware auxiliar sobre la base de la rentabilidad, en lugar de la compatibilidad con arquitecturas exclusivas. Para cubrir mejor las necesidades del almacenamiento de objetos, una solución de almacenamiento definido por software debería: •Ejecutarse en un entorno de servidor x86 estándar del sector y agnóstico en cuanto a tecnología •Habilitar la consolidación de almacenamiento que soporta cargas de trabajo y aplicaciones mixtas •Proporcionar acceso a través de una gama de interfaces de archivo, objeto y OpenStack, todas operando al mismo tiempo •Habilitar la disponibilidad y la durabilidad de los datos a través de una variedad de mecanismos de protección de los datos y la capacidad para construir infraestructuras de almacenamiento geo-distribuidas •Proporcionar TCO más bajo y ROI más elevado que las ofertas de nube pública, como Amazon S3 Una solución que cumple todos estos criterios es Scality RING. RING puede escalar con facilidad a una capacidad de cientos de petabytes y billones de objetos y soporta millones de usuarios, mientras que habilita la protección global de los datos y la durabilidad a escala masiva. Aunque puede utilizar una combinación de interfaces nativas de archivos, objetos y OpenStack, el RING sirve, gestiona y protege todos los datos como objetos, lo que permite que las políticas globales en torno a la replicación, la codificación para control de errores y la geo-replicación para lograr un almacenamiento increíblemente eficaz y duradero. Guía de mejores prácticas BIGLOBE, un proveedor de servicios de nube e Internet líder en Japón, adoptó los servidores de HPE para alcanzar un entorno de almacenamiento de alta capacidad y bajo coste de 2 PB. Implementaron 88 TB de capacidad en disco y 192 GB de memoria por nodo de servidor, además de reducir sustancialmente los costes de mantenimiento y operativos. Página 6 Las implementaciones Scality RING soportan una amplia variedad de casos de uso, como almacenamiento web y en la nube, distribución de contenidos, computación distribuida, nube privada empresarial y archivado activo. En la actualidad, Hewlett Packard Enterprise y Scality comparten una relación de colaboración optimizada creada para mejorar la experiencia y el valor para el usuario y para acelerar la adopción de las soluciones Object Storage para datos no estructurados y semi-estructurados a escala de petabytes con la solución Scality RING en servidores HPE. Aproveche servidores optimizados para arquitecturas con escalabilidad horizontal El cambio en los paradigmas del almacenamiento al almacenamiento de objetos requiere un nuevo estilo de infraestructura donde las soluciones en bastidor tradicionales brinden nodos de alta densidad capaces de almacenar más datos en menos espacio físico a un coste por GB inferior a las plataformas de uso general. Las empresas deberían implementar servidores de alta densidad específicamente diseñados para ofrecer soluciones de almacenamiento de objetos más escalables, eficaces y rentables. En circunstancias idóneas, los nodos de almacenamiento optimizados deberían proporcionar: •Capacidad de almacenamiento de mayor densidad •Mayor capacidad de memoria y ancho de banda de E/S •Reducción de las necesidades de energía y refrigeración. •Infraestructura modular •Opciones de configuración flexibles •Capacidad de E/S ilimitada •Compatibilidad con una amplia variedad de plataformas de almacenamiento de objetos, como Scality RING, Cleversafe dsNet, Ceph y OpenStack Swift Los sistemas HPE Apollo ofrecen hardware optimizado construido para cumplir los requisitos específicos de las soluciones de almacenamiento de objetos y trabajar a la perfección con aplicaciones de colaboradores como Scality, Cleversafe y otros distribuidores de código abierto. Los servidores HPE Apollo 4200 y los sistemas HPE Apollo 4510 están construidos para entregar rendimiento, fiabilidad y escalabilidad masiva, al tiempo que da una respuesta a los retos del centro de datos en cuanto a espacio, energía y tiempo. Guía de mejores prácticas Página 7 Traer la nube a casa Muchas empresas han respondido a la explosión de los datos con un traslado de los datos a la nube. En función del sector y del tipo de datos almacenados, la nube pública podrá ser o no la opción adecuada. Para sectores como los servicios financieros, los servicios sanitarios y muchas aplicaciones gubernamentales, la nube pública puede plantear problemas debido a cuestiones relacionadas con la privacidad de los datos y la conformidad. Otros sectores pueden mostrarse más abiertos a la implementación de soluciones de nube pública, pero estas traen consigo un nivel de riesgo: •Los riesgos de seguridad y conformidad asociados con la gestión de datos de forma remota. •La pérdida de control de datos empresariales sensibles •La viabilidad empresarial a largo plazo del operador de nube pública •Los costes pueden escalar con rapidez a medida que suban los volúmenes de datos Gartner predice que más de la mitad de las empresas del Global 1000 almacenarán datos confidenciales de clientes en la nube pública a finales del 2016.2 •Los gastos no planificados que deriven de la necesidad de recuperar grandes cantidades de datos archivados "fríos". Muchos grupos de TI deben enfrentarse a las demandas de su empresa de ofrecer almacenamiento como servicio, del mismo modo que ven cómo servicios de nube como Amazon ofrecen dicho almacenamiento. Algunos grupos de TI han incluso llegado a ver cómo los usuarios empresariales crean sus propias "soluciones", al margen de las TI, para llevar los datos a la nube. Las soluciones de almacenamiento de objetos permiten que las TI traigan la nube a casa, brindando a los usuarios empresariales una experiencia de "nube pública" desde el seno de su propio centro de datos. Un depósito de contenidos de nube privada local ofrece a los usuarios empresariales la misma facilidad de uso y agilidad que obtienen de los proveedores de nube pública. El almacenamiento de objetos proporciona una solución eficiente y rentable, que reduce los costes a través del uso del hardware comercial. Las herramientas de software que proporcionan implementación avanzada y fácil de utilizar de prestaciones de fiabilidad como la codificación para control de errores pueden ofrecer a los usuarios empresariales el nivel de disponibilidad y durabilidad de los datos que buscan en un entorno seguro y local. 2 artner, “El almacenamiento en nube híbrida puede ser un G antídoto para el rápido crecimiento de los datos”, julio de 2013 Guía de mejores prácticas Conclusión Las arquitecturas tradicionales de almacenamiento de archivos y bloques se enfrentan a los retos del crecimiento explosivo de los datos estáticos no estructurados. Las arquitecturas de almacenamiento emergentes, basadas en el almacenamiento de objetos, ayudan a las empresas a superar este reto, ofreciendo soluciones de almacenamiento rentables que mantienen el ritmo de las demanda de capacidad de almacenamiento en expansión. Hewlett Packard Enterprise para el almacenamiento de objetos Una solución popular incluye Scality RING, en ejecución sobre un Almacenamiento de objetos y un sistema Apollo de diseño específico, para ofrecer escala de petabytes con alta fiabilidad a un punto de coste que proporcione un TCO más bajo y un ROI más elevado que las opciones tradicionales de nube pública o almacenamiento local. La arquitectura de referencia del Depósito de contenidos HPE Helion proporciona el marco para una solución de nube privada local, compuesta por una infraestructura de red y servidor de diseño específico, junto con servicios de soporte e instalación, a fin de ofrecer un coste total de propiedad más bajo y un retorno de la inversión más elevado. Más información sobre las Soluciones de almacenamiento de objetos de HPE y sobre cómo dar los primeros pasos con el almacenamiento de objetos y definido por software a través de HPE Consulting. Obtenga más información en hpe.com/info/Apollo Regístrese y reciba las actualizaciones © Copyright 2016 Hewlett Packard Enterprise Development L.P. La información contenida en este documento está sujeta a cambios sin previo aviso. Las únicas garantías de los productos y servicios de Hewlett Packard Enterprise figuran en las declaraciones expresas de garantía incluidas en los mismos. Ninguna información contenida en este documento debe interpretarse como una garantía adicional. Hewlett Packard Enterprise no se hará responsable de los errores u omisiones que pudiera contener este documento. La marca denominativa OpenStack es una marca comercial registrada/marca de servicio o una marca registrada/marca de servicio de OpenStack Foundation en Estados Unidos y otros países, y se utiliza con permiso de OpenStack Foundation. No somos afiliados ni recibimos el patrocinio ni el respaldo de OpenStack Foundation o la comunidad OpenStack. Pivotal y Cloud Foundry son marcas comerciales y/o marcas comerciales registradas de Pivotal Software, Inc. en Estados Unidos y/o en otros países 4AA6-3933ESE, febrero de 2016