La gestión de datos a escala de petabytes con almacenamiento de

Anuncio
Guía de mejores prácticas
La gestión de datos a escala de petabytes
con almacenamiento de objetos
Mejores prácticas para el centro de datos moderno
Guía de mejores prácticas
Página 2
Las TI deben ser capaces de almacenar y acceder con eficacia a los datos adecuados al instante. Sin
embargo las arquitecturas tradicionales de almacenamiento de archivos y bloques se enfrentan a los
retos del crecimiento explosivo actual de los datos. Nuevas fuentes de datos como las redes sociales,
el Internet de las cosas, las aplicaciones móviles, etc. poseen redes de almacenamiento existentes a
punto de reventar. A medida que crecen los volúmenes de datos, también lo hacen la complejidad y
el coste de almacenar y gestionar los datos.
Se estima que, en los próximos cinco
años, más de un billón de aplicaciones
intercambiará 58 zettabytes de datos
entre más de 100.000 millones de
dispositivos.1
En la Economía de las ideas actual, la capacidad de una empresa para crecer está directamente
relacionada con su capacidad para almacenar, gestionar y utilizar datos. Comprender cómo
gestionar esta explosión de los datos ya no es una preocupación específica a los administradores
de almacenamiento o directores de TI, sino que debería ser una preocupación principal de todo el
personal ejecutivo.
Los subsistemas de almacenamiento de clase empresarial están diseñados para abordar los
requisitos de almacenamiento para velocidades de datos transaccionales esenciales para el negocio
a escala de terabytes (hasta los niveles bajos de petabytes). No obstante, no resulta infrecuente que
estas fuentes de datos no estructurados escalen con rapidez a decenas o cientos de petabytes o
incluso más. El enfoque tradicional del almacenamiento basado en SAN puede que no sea capaz de
hacer frente a estas necesidades de maneras eficaces y rentable. El almacenamiento SAN tradicional
simplemente resulta demasiado costoso y complejo de implementar para gestionar datos a escala
de petabytes. Los nuevos tipos y fuentes de datos precisan un enfoque moderno con la última
tecnología de almacenamiento.
Almacenamiento de objetos
La capacidad para las soluciones de
objetos y archivos con escalabilidad
horizontal presentará un crecimiento
anual compuesto de más del 40 % hasta
el 2019.
1
Investigación interna de HP (ahora Hewlett Packard
Enterprise), 2014; hpematter.com/issue-no-1june-2014/why-open-open-cloud-matters
Estamos acostumbrados a pensar sobre los datos en términos de archivos y bloques. Los sistemas
de almacenamiento basados en SAN se organizan de esa manera. En el almacenamiento de objetos,
los datos se tratan más como un objeto que como un bloque o archivo, con metadatos y un ID de
objeto para identificar de manera única cada objeto de datos. Las limitaciones en cuanto a tamaños
de bloque y archivos existentes en los sistemas de almacenamiento tradicionales se eliminan, al igual
que aquellas relativas al número de bloques o archivos que se pueden almacenar.
A diferencia de las SAN (y en especial las cabinas flash SAN), las soluciones de almacenamiento de
objetos no están diseñadas para rendimientos de IOPS y latencia de misión crítica. En su lugar, el
almacenamiento de objetos se ha diseñado para ofrecer fiabilidad coherente para datos a escala de
petabytes, soportando un ancho de banda elevado con cargas de trabajo en paralelo con latencia
tolerable e IOPS adecuadas. ¿Cuál es la fiabilidad del almacenamiento de objetos? Los distribuidores
afirman que un rendimiento de hasta quince 9 usando técnicas como codificación para control de
errores a fin de reconstruir con rapidez aquellos datos que se pudieran corromper o perder.
Las soluciones de almacenamiento de objetos aprovechan el almacenamiento local basado en
servidores, lo que permite que las TI escalen con facilidad a cientos de petabytes hoy, al mismo tiempo
que ofrecen una ruta despejada y rentable para ampliar a escalas de exabytes o incluso zettabytes en
el futuro.
Guía de mejores prácticas
Página 3
Gestionar el almacenamiento de contenidos a granel para "océanos" de datos en rápido
crecimiento compuestos por datos estructurados o semi-estructurados requiere el movimiento
al almacenamiento de objetos y archivos de escalabilidad horizontal. Las soluciones de
almacenamiento de objetos ofrecen nuevas capacidades revolucionarias a través de
almacenamiento definido por software que son sencillas, rentables, escalables y que se pueden
implementar con rapidez.
Mejores prácticas para el almacenamiento de objetos
El almacenamiento de objetos ofrece a las empresas nuevas alternativas para almacenar datos
estructurados y no estructurados a escala de petabytes. Al igual que ocurre con la tecnología,
hay buenas prácticas para aplicar al uso y la implementación de tecnología para hacer frente a un
conjunto específico de objetivos empresariales.
Comprender los casos de uso para el almacenamiento de objetos
Al igual que ocurre con la mayor parte de las tecnologías, existen varias condiciones y casos de uso
en los que el almacenamiento de objetos es la mejor opción y otros en los que el almacenamiento
conectado en red tradicional (NAS) es la mejor opción.
El almacenamiento de objetos resulta óptimo para:
•Descargas de archivos y contenido web
•El acceso de datos a nivel de archivo/objeto, como vídeos, imágenes médicas, etc.
•El acceso a datos de uso infrecuente, como datos de archivo y almacenamiento en frío
•Entornos masivos de almacenamiento de datos con escalabilidad horizontal (decenas o cientos
de PB)
•Contenido estático (es decir, datos que no se modifican activamente) como datos de sensor,
imágenes y archivos de vídeo con latencias más bajas.
Un número creciente de aplicaciones ofrecen soporte nativo para el almacenamiento de objetos.
Guía de mejores prácticas
Página 4
Algunos de los casos de uso clave para el almacenamiento de objetos incluyen:
•Alternativas empresariales de archivo y copia de seguridad al uso de cintas, con latencias más
bajas para el acceso de datos y sin el mantenimiento a largo plazo de los sistemas de unidades de
cintas.
•Archivos activos de conformidad, análisis, vigilancia y otros datos de archivo y objetos donde los
contenidos escalan a petabytes.
•Envío de contenidos de comunicaciones, medios y entretenimiento, que incluyen aplicaciones
como el vídeo a demanda.
•Los proveedores de servicios que ofrecen el almacenamiento como un servicio para ofertas de
consumidor y empresa, como copias de seguridad alojadas, archivo, recuperación ante desastres
y sincronización/intercambio.
•Nuevos servicios web y nativos de nube para la implementación de nubes públicas y privadas
locales, donde se precisan arquitecturas de almacenamiento distribuido.
•Aplicaciones emergentes que aprovechan el Internet de las cosas, donde los datos no
estructurados y derivados de sensores precisan un repositorio que pueda escalar a miles de
millones o incluso billones de objetos.
Una solución de almacenamiento de objetos no es adecuada para:
•Datos de aplicaciones transaccionales que se modifican con frecuencia (es decir, bases de datos y
discos raíz). El almacenamiento de bloques que puede ofrecer baja latencia y replicación de datos
sincrónica es más adecuado para estas cargas de trabajo.
•Entornos de archivos compartidos que requieren una vista única y actualizada de un archivo a
todo el personal con acceso, utilizando bloqueo de nivel de archivo y facilidades de intercambio
de archivos (por ejemplo, desarrollo de contenidos, CAD/CAM, documentos actualizados de
manera activa, etc.) El almacenamiento conectado a la red (NAS) o algunas soluciones de
sistemas de archivo en clúster con escalabilidad horizontal son la mejor opción para estas cargas
de trabajo.
Guía de mejores prácticas
Página 5
Implementar una solución de almacenamiento definida por
software y agnóstica respecto a la tecnología
RTL II se conoce por multiplicar por diez
las velocidades de transmisión de vídeo.
El canal de TV alemán RTL II necesitaba
dar soporte a un archivo de vídeo en
rápido crecimiento, que se ampliaba
en 200 terabytes cada año. Usando
servidores HPE, el canal pudo garantizar
la emisión de la última información de las
retransmisiones, aumentar la cantidad
de contenido vídeo en streaming online,
simplificar el soporte con un diseño de
hardware estándar y reducir el tiempo de
transferencia para un vídeo de 40 MB de
60–70 minutos a 6,5 minutos.
Las soluciones de almacenamiento definidas por software ofrecen fiabilidad y disponibilidad
de grado empresarial, facilidad de uso y la capacidad para escalar de una manera rentable.
Existen muchas arquitecturas de almacenamiento de objetos viables y soluciones de gestión de
almacenamiento definido por software, como Scality RING, Cleversafe dsNet, Ceph y OpenStack®
Swift. Una solución de almacenamiento definida por software abstrae el almacenamiento lógico
de los recursos físicos, lo que permite que las TI seleccionen el hardware auxiliar sobre la base
de la rentabilidad, en lugar de la compatibilidad con arquitecturas exclusivas. Para cubrir mejor
las necesidades del almacenamiento de objetos, una solución de almacenamiento definido por
software debería:
•Ejecutarse en un entorno de servidor x86 estándar del sector y agnóstico en cuanto a tecnología
•Habilitar la consolidación de almacenamiento que soporta cargas de trabajo y aplicaciones mixtas
•Proporcionar acceso a través de una gama de interfaces de archivo, objeto y OpenStack, todas
operando al mismo tiempo
•Habilitar la disponibilidad y la durabilidad de los datos a través de una variedad de mecanismos
de protección de los datos y la capacidad para construir infraestructuras de almacenamiento
geo-distribuidas
•Proporcionar TCO más bajo y ROI más elevado que las ofertas de nube pública, como Amazon S3
Una solución que cumple todos estos criterios es Scality RING. RING puede escalar con facilidad
a una capacidad de cientos de petabytes y billones de objetos y soporta millones de usuarios,
mientras que habilita la protección global de los datos y la durabilidad a escala masiva. Aunque
puede utilizar una combinación de interfaces nativas de archivos, objetos y OpenStack, el RING
sirve, gestiona y protege todos los datos como objetos, lo que permite que las políticas globales
en torno a la replicación, la codificación para control de errores y la geo-replicación para lograr un
almacenamiento increíblemente eficaz y duradero.
Guía de mejores prácticas
BIGLOBE, un proveedor de servicios de
nube e Internet líder en Japón, adoptó
los servidores de HPE para alcanzar
un entorno de almacenamiento de
alta capacidad y bajo coste de 2 PB.
Implementaron 88 TB de capacidad
en disco y 192 GB de memoria por
nodo de servidor, además de reducir
sustancialmente los costes de
mantenimiento y operativos.
Página 6
Las implementaciones Scality RING soportan una amplia variedad de casos de uso, como
almacenamiento web y en la nube, distribución de contenidos, computación distribuida, nube
privada empresarial y archivado activo. En la actualidad, Hewlett Packard Enterprise y Scality
comparten una relación de colaboración optimizada creada para mejorar la experiencia y el
valor para el usuario y para acelerar la adopción de las soluciones Object Storage para datos
no estructurados y semi-estructurados a escala de petabytes con la solución Scality RING en
servidores HPE.
Aproveche servidores optimizados para
arquitecturas con escalabilidad horizontal
El cambio en los paradigmas del almacenamiento al almacenamiento de objetos requiere un nuevo
estilo de infraestructura donde las soluciones en bastidor tradicionales brinden nodos de alta
densidad capaces de almacenar más datos en menos espacio físico a un coste por GB inferior a
las plataformas de uso general. Las empresas deberían implementar servidores de alta densidad
específicamente diseñados para ofrecer soluciones de almacenamiento de objetos más escalables,
eficaces y rentables. En circunstancias idóneas, los nodos de almacenamiento optimizados deberían
proporcionar:
•Capacidad de almacenamiento de mayor densidad
•Mayor capacidad de memoria y ancho de banda de E/S
•Reducción de las necesidades de energía y refrigeración.
•Infraestructura modular
•Opciones de configuración flexibles
•Capacidad de E/S ilimitada
•Compatibilidad con una amplia variedad de plataformas de almacenamiento de objetos, como
Scality RING, Cleversafe dsNet, Ceph y OpenStack Swift
Los sistemas HPE Apollo ofrecen hardware optimizado construido para cumplir los requisitos
específicos de las soluciones de almacenamiento de objetos y trabajar a la perfección con
aplicaciones de colaboradores como Scality, Cleversafe y otros distribuidores de código abierto.
Los servidores HPE Apollo 4200 y los sistemas HPE Apollo 4510 están construidos para entregar
rendimiento, fiabilidad y escalabilidad masiva, al tiempo que da una respuesta a los retos del centro
de datos en cuanto a espacio, energía y tiempo.
Guía de mejores prácticas
Página 7
Traer la nube a casa
Muchas empresas han respondido a la explosión de los datos con un traslado de los datos a la
nube.
En función del sector y del tipo de datos almacenados, la nube pública podrá ser o no la
opción adecuada. Para sectores como los servicios financieros, los servicios sanitarios y muchas
aplicaciones gubernamentales, la nube pública puede plantear problemas debido a cuestiones
relacionadas con la privacidad de los datos y la conformidad. Otros sectores pueden mostrarse más
abiertos a la implementación de soluciones de nube pública, pero estas traen consigo un nivel de
riesgo:
•Los riesgos de seguridad y conformidad asociados con la gestión de datos de forma remota.
•La pérdida de control de datos empresariales sensibles
•La viabilidad empresarial a largo plazo del operador de nube pública
•Los costes pueden escalar con rapidez a medida que suban los volúmenes de datos
Gartner predice que más de la mitad
de las empresas del Global 1000
almacenarán datos confidenciales de
clientes en la nube pública a finales del
2016.2
•Los gastos no planificados que deriven de la necesidad de recuperar grandes cantidades de
datos archivados "fríos".
Muchos grupos de TI deben enfrentarse a las demandas de su empresa de ofrecer
almacenamiento como servicio, del mismo modo que ven cómo servicios de nube como Amazon
ofrecen dicho almacenamiento. Algunos grupos de TI han incluso llegado a ver cómo los usuarios
empresariales crean sus propias "soluciones", al margen de las TI, para llevar los datos a la nube.
Las soluciones de almacenamiento de objetos permiten que las TI traigan la nube a casa,
brindando a los usuarios empresariales una experiencia de "nube pública" desde el seno de su
propio centro de datos. Un depósito de contenidos de nube privada local ofrece a los usuarios
empresariales la misma facilidad de uso y agilidad que obtienen de los proveedores de nube
pública. El almacenamiento de objetos proporciona una solución eficiente y rentable, que reduce
los costes a través del uso del hardware comercial. Las herramientas de software que proporcionan
implementación avanzada y fácil de utilizar de prestaciones de fiabilidad como la codificación
para control de errores pueden ofrecer a los usuarios empresariales el nivel de disponibilidad y
durabilidad de los datos que buscan en un entorno seguro y local.
2
artner, “El almacenamiento en nube híbrida puede ser un
G
antídoto para el rápido crecimiento de los datos”, julio de 2013
Guía de mejores prácticas
Conclusión
Las arquitecturas tradicionales de almacenamiento de archivos y bloques se enfrentan a los
retos del crecimiento explosivo de los datos estáticos no estructurados. Las arquitecturas de
almacenamiento emergentes, basadas en el almacenamiento de objetos, ayudan a las empresas a
superar este reto, ofreciendo soluciones de almacenamiento rentables que mantienen el ritmo de
las demanda de capacidad de almacenamiento en expansión.
Hewlett Packard Enterprise para el almacenamiento de objetos
Una solución popular incluye Scality RING, en ejecución sobre un Almacenamiento de objetos
y un sistema Apollo de diseño específico, para ofrecer escala de petabytes con alta fiabilidad
a un punto de coste que proporcione un TCO más bajo y un ROI más elevado que las opciones
tradicionales de nube pública o almacenamiento local.
La arquitectura de referencia del Depósito de contenidos HPE Helion proporciona el marco para
una solución de nube privada local, compuesta por una infraestructura de red y servidor de diseño
específico, junto con servicios de soporte e instalación, a fin de ofrecer un coste total de propiedad
más bajo y un retorno de la inversión más elevado.
Más información sobre las Soluciones de almacenamiento de objetos de HPE y sobre cómo dar
los primeros pasos con el almacenamiento de objetos y definido por software a través de
HPE Consulting.
Obtenga más información en
hpe.com/info/Apollo
Regístrese y reciba
las actualizaciones
© Copyright 2016 Hewlett Packard Enterprise Development L.P. La información contenida en este documento está sujeta a cambios
sin previo aviso. Las únicas garantías de los productos y servicios de Hewlett Packard Enterprise figuran en las declaraciones
expresas de garantía incluidas en los mismos. Ninguna información contenida en este documento debe interpretarse como una
garantía adicional. Hewlett Packard Enterprise no se hará responsable de los errores u omisiones que pudiera contener este
documento.
La marca denominativa OpenStack es una marca comercial registrada/marca de servicio o una marca registrada/marca de servicio
de OpenStack Foundation en Estados Unidos y otros países, y se utiliza con permiso de OpenStack Foundation. No somos afiliados
ni recibimos el patrocinio ni el respaldo de OpenStack Foundation o la comunidad OpenStack. Pivotal y Cloud Foundry son marcas
comerciales y/o marcas comerciales registradas de Pivotal Software, Inc. en Estados Unidos y/o en otros países
4AA6-3933ESE, febrero de 2016
Descargar