EMC Data Domain y Avamar

Anuncio
Validación de
laboratorio
Informe
EMC Data Domain y Avamar
Eficiencia y rendimiento para la protección de datos de VMware
Por Kerry Dolan, analista de laboratorio
Octubre de 2015
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
2
Contenido
Introducción .................................................................................................................................................. 3
Antecedentes............................................................................................................................................................ 3
Validación de ESG Lab................................................................................................................................... 6
Facilidad de integración............................................................................................................................................ 6
Rendimiento y eficiencia .......................................................................................................................................... 9
Puntos destacados de la validación de ESG Lab ......................................................................................... 17
Temas que deben tenerse en cuenta ......................................................................................................... 17
La gran verdad ............................................................................................................................................ 18
Apéndice ..................................................................................................................................................... 20
Informes de ESG Lab
El objetivo de los informes de ESG Lab es educar a los profesionales de TI acerca de productos de
tecnología del centro de datos para empresas de todos los tipos y tamaños. Los informes de ESG Lab
no pretenden reemplazar el proceso de evaluación que se debe llevar a cabo antes de tomar
decisiones de compra, sino proporcionar información valiosa de estas tecnologías emergentes.
Nuestro objetivo es analizar algunas de las características/funciones más valiosas de los productos,
mostrar cómo se pueden utilizar para resolver los problemas reales de los clientes e identificar las
áreas que necesitan mejoras. La perspectiva de terceros expertos de ESG Lab se basa en nuestras
propias pruebas prácticas, así como en entrevistas con clientes que utilizan los productos en
ambientes de producción. Este informe de ESG Lab fue patrocinado por EMC.
Todos los nombres de marcas comerciales son propiedad de sus respectivas empresas. La información incluida en esta publicación se obtuvo por medio de
fuentes que The Enterprise Strategy Group (ESG) considera confiables, pero no está garantizada por ESG. Esta publicación puede contener opiniones de
ESG que están sujetas a cambios periódicos. Los derechos de esta publicación pertenecen a The Enterprise Strategy Group, Inc. Cualquier reproducción o
redistribución de esta publicación, en su totalidad o en parte, ya sea en formato impreso, electrónico o de otro tipo, a personas no autorizadas para
recibirla sin el consentimiento expreso de The Enterprise Strategy Group, Inc., constituye una violación de las leyes de derechos de autor de los Estados
Unidos y estará sujeta a una acción por daños civiles y, en caso de ser pertinente, a un juicio penal. Si tiene consultas, comuníquese con ESG Client
Relations llamando al 508-482-0188.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
3
Introducción
El presente informe documenta las pruebas prácticas y la validación de una solución de protección de datos de EMC
para los ambientes virtuales que usan Avamar Virtual Edition con un sistema Data Domain, y se enfoca en la
facilidad de integración, en la eficiencia, en la escalabilidad y en el rendimiento de respaldo/restauración.
Antecedentes
De acuerdo con la investigación de ESG, durante los últimos cinco años, los profesionales de TI han identificado
constantemente la mejora de los procesos de respaldo y recuperación de datos, la administración del crecimiento
de datos y el aumento del uso de virtualización de servidores entre sus principales prioridades de TI. En la encuesta
2015 IT Spending Intentions Survey de ESG, solo se mencionaron con más frecuencia las iniciativas de seguridad de
la información (consulte la figura 1).1 Uno de los retos para las organizaciones es que el crecimiento de datos tiene
un gran impacto en el respaldo y en la recuperación de datos: Los volúmenes de datos en constante expansión
prolongan las ventanas de respaldo y los tiempos de recuperación, generalmente hasta el punto de interferir con
las actividades de producción, mientras demandan cantidades crecientes de almacenamiento de back-end.
Figura 1. Las 10 prioridades de TI más mencionadas de 2015
Top 10 most
IT priorities
the next durante
12 months.
(Percent of
Las 10important
prioridades
de TI másover
importantes
los próximos
12respondents,
meses.
N=601,
ten
responses
accepted)
(Porcentaje de encuestados, N = 601, se aceptan diez respuestas)
Iniciativas Information
de seguridad security
de la información
initiatives
34
%
34%
Mejora dedata
los procesos
de respaldo
y
Improving
backup and
recovery
26 %
26%
data
Administración delManaging
crecimiento
degrowth
datos
26%
26 %
recuperación de datos
Increasing
use of serverde
virtualization
Mayor
uso de virtualización
servidores
25%
25 %
Desktop virtualization
25%
25
%
Using cloud
infrastructurede
services
Uso de servicios
de infraestructura
nube
25%
25
%
Virtualización de escritorio
Iniciativas
de cumplimiento
normas
Regulatory
compliancedeinitiatives
24
%
24%
Programas de continuidad del negocio o
Business continuity/disaster
recovery
recuperación
de programs
desastres
23%
23
%
Building
a “private cloud”
infrastructure
Creación de
una infraestructura
de “nube
privada”
22
%
22%
collaboration
capabilities
Mejora deImproving
las funcionalidades
de colaboración
22%
22
%
00%
%
10%
10 %
20%
20
%
30%
30
%
40%%
40
Fuente: Enterprise Strategy Group, 2015.
Además, muchas organizaciones tienen dificultades para encontrar la mejor opción para proteger sus máquinas
virtuales (VM) de VMware en constante crecimiento. Cada máquina virtual requiere un trabajo de respaldo
individual, que puede ser difícil a escala. Las soluciones de respaldo tradicionales luchan con los recursos
compartidos de las máquinas virtuales y, como consecuencia, ponen en riesgo los SLA. Los respaldos de las
máquinas virtuales, generalmente, incluyen SO, aplicaciones y datos en archivos redundantes. Las enormes
cantidades de datos suelen generar respaldos que no se pueden completar durante las ventanas de respaldo sin
1
Fuente: Informe de investigación de ESG, 2015 IT Spending Intentions Survey, febrero de 2015.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
4
dejar algunas máquinas virtuales sin protección, y administrar todos esos respaldos puede ser algo muy complicado
en términos de operación. Otro reto es que la ejecución de respaldos virtuales y físicos separados da lugar a más
servidores, almacenamiento y software para comprar y administrar, lo cual aumenta los costos y la complejidad.
EMC Data Domain y Avamar
Esta solución de protección de datos de EMC combina el software de respaldo/recuperación simple y eficiente de
Avamar con el rendimiento, la escala y la eficiencia del sistema Data Domain.
Data Domain
Los sistemas Data Domain son dispositivos de almacenamiento con protección especialmente diseñados y
altamente escalables que proporcionan deduplicación de alta velocidad para respaldo y archiving, y replicación para
la recuperación de desastres. La familia de modelos puede escalar hasta 86.4 PB de capacidad lógica. La
deduplicación de longitud variable maximiza las tasas de deduplicación, ya que reduce los requisitos de
almacenamiento para archivo y de respaldo en un promedio de 10 a 30 veces, lo que hace que Data Domain sea
una alternativa rentable respecto de otras cintas o dispositivos de respaldo. Estos sistemas proporcionan un
objetivo para una amplia variedad de cargas de trabajo de archiving y respaldo empresarial, lo que incluye
máquinas virtuales, bases de datos, mainframe, sistemas IBM i, NAS, correo electrónico, big data, aplicaciones de
administración de contenido y oficinas remotas. Los sistemas Data Domain son compatibles con datos de archivo y
de respaldo simultáneamente, lo que elimina la necesidad de comprar y administrar una plataforma de
almacenamiento diferente para el archiving, y también permite la deduplicación global en los datos de respaldo y
de archivo. Se incorpora el multiusuario seguro en Data Domain Operating System (DD OS), lo que permite la
protección de datos como servicio en función de la nube híbrida para empresas o proveedores de servicios. La
instalación simple y la administración sencilla garantizan gastos operacionales más bajos.
Los sistemas Data Domain cuentan con la arquitectura de invulnerabilidad de datos de EMC Data Domain para
lograr la máxima confiabilidad e integridad de datos, mediante la verificación en línea de escritura y lectura, y la
recuperación automática de errores de I/O durante la recopilación y la recuperación. Esto garantiza que el respaldo
y la recuperación se completen de manera satisfactoria. Data Domain proporciona una amplia variedad de opciones
de respaldo gracias a su compatibilidad con NFS, CIFS, VTL, NDMP y Data Domain Boost; este último se integra con
aplicaciones empresariales y de respaldo para acelerar considerablemente los respaldos y reducir la utilización de la
red.
Avamar
El software de respaldo de Avamar ofrece respaldos completos diarios con deduplicación de longitud variable para
los ambientes VMware, así como para aplicaciones críticas de negocios, NAS, escritorios/laptops y oficinas remotas.
Avamar puede implementarse con un dispositivo físico para los metadatos o mediante el dispositivo Avamar Virtual
Edition, como se utilizó en esta prueba. Cuando se combina Avamar con Data Domain, el código DD Boost incluido
en el cliente Avamar se utiliza con el fin de distribuir partes del procesamiento de deduplicación para el lado del
cliente, lo que reduce los datos de respaldo y requiere menos ancho de banda. La administración web de Avamar
proporciona control central a través de una implementación global; también se puede administrar mediante
vSphere.
Para los ambientes VMware, tanto los respaldos a nivel de huésped como a nivel de imagen son compatibles.
Avamar se integra con las API de VMware vStorage para protección de datos (VADP), lo que permite respaldos a
nivel de huésped sin agentes. Para los respaldos a nivel de imagen, Avamar descarga el proceso de respaldo de las
máquinas virtuales de aplicaciones a varias máquinas virtuales de proxy según sea necesario, y balancea la carga de
manera inteligente entre estas. Avamar también aprovecha VMware Change Block Tracking (CBT) para acelerar las
operaciones de respaldo y de restauración. Después del respaldo completo inicial, Avamar transfiere únicamente
los datos modificados, pero crea un punto de recuperación completa para la restauración. Este método completo
sin límites ofrece un rendimiento rápido para las operaciones de restauración y de respaldo. En comparación, los
métodos tradicionales requieren la reversión al respaldo completo más reciente y, luego, el almacenamiento
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
5
provisional de los respaldos incrementales subsiguientes, lo que tarda más tiempo y, a veces, afecta la confiabilidad
de la recuperación.
Avamar proporciona una recuperación rápida en un solo paso de todas las máquinas virtuales o de todos los
archivos individuales. Además, se puede acceder instantáneamente a las imágenes de las máquinas virtuales de
Avamar almacenadas en el sistema Data Domain objetivo, una técnica frecuentemente utilizada para las pruebas/el
desarrollo y la validación de la recuperación. Las máquinas virtuales se pueden ejecutar directamente en Data
Domain para su uso inmediato, mientras que la máquina virtual en ejecución se transfiere de vuelta a la ubicación
original en segundo plano a través de vMotion.
Solución probada: EMC Data Domain y Avamar
ESG Lab probó una solución de protección de datos de EMC que incluía Data Domain y Avamar con el ambiente
virtual alojado en un arreglo de almacenamiento todo flash EMC XtremIO. La figura 2 proporciona una descripción
general conceptual de la solución. A la izquierda, un hipervisor VMware ESX aloja varias máquinas virtuales de
aplicaciones, la máquina virtual de Avamar Virtual Edition y máquinas virtuales de proxy. El tablero de Avamar
Administrator se muestra en la parte superior. Una máquina virtual de proxy aprovecha VMware CBT para
identificar los datos modificados. Con el aprovechamiento de DD Boost, las partes del proceso de deduplicación de
Data Domain se distribuyen a Avamar, donde la deduplicación del lado del cliente garantiza solo el envío de los
datos únicos desde el cliente Avamar hasta Data Domain. El sistema Data Domain altamente escalable puede
funcionar simultáneamente como objetivo para otras cargas de trabajo de archiving y de respaldo, como se
muestra a la derecha. Para esta prueba, se utilizó XtremIO como la plataforma de almacenamiento del lado del
cliente para eliminar la posibilidad de un cuello de botella de almacenamiento.
Figura 2. Descripción general de la solución: EMC Avamar y Data Domain
Avamar Administrator
Metadatos
VM 1
VM 2
VM de Máquinas virtuales
del proxy
Avamar VE
Respaldo de RMAN
VMware ESXi
Respaldo
LAN
LAN
Respaldo de mainframe
VADP/CBT
VMDK VM1
VMDK VM2
Data Domain
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Archiving
Validación de laboratorio: EMC Data Domain y Avamar
6
Validación de ESG Lab
ESG Lab llevó a cabo pruebas prácticas y auditorías de pruebas realizadas en uno de los laboratorios de EMC de
Hopkinton, Massachusetts. Las pruebas se diseñaron para demostrar la facilidad de integración de Avamar y Data
Domain, la eficiencia de la capacidad y del uso de CPU, y el rendimiento de respaldo y restauración, todo con un
enfoque en los respaldos de VMware.
Facilidad de integración
Los sistemas EMC Avamar y EMC Data Domain son extremadamente simples de integrar, lo que permite que las
organizaciones aprovechen la escalabilidad y la protección integrada de Data Domain para los respaldos de Avamar.
ESG Lab auditó el procedimiento de integración, que se llevó a cabo en unos pocos pasos y en menos de cinco
minutos.
Prueba de ESG Lab
Mediante un sistema Data Domain DD4500 encendido y conectado a la red, el primer paso fue agregar el sistema
Data Domain para que Avamar utilizara como objetivo. El aprovisionamiento se puede realizar completamente
dentro de la consola de administración de Avamar Administrator, sin tener que ejecutar la GUI o la CLI de Data
Domain System Manager. La GUI de Avamar Administrator en la figura 3 (izquierda) muestra la pestaña Server, que
indica las configuraciones del sistema de back-end. La esquina superior derecha de la pantalla muestra un servidor
Avamar disponible para la capacidad de back-end.
Figura 3. Adición del sistema Data Domain a través de la consola de Avamar Administrator
El próximo paso fue hacer clic en la pestaña Server, seleccionar la pestaña Server Management y, luego,
seleccionar Add Data Domain System (figura 3, a la derecha). En la pestaña System, se agregó el nombre de
sistema calificado (dd4500a), así como las credenciales y el nombre de cuenta de DD Boost (que se crearon durante
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
7
la configuración de dd4500a). Esto autenticó el sistema objetivo, y activó permisos de escritura para clientes
Avamar.
Un ajuste clave es la cantidad total de flujos de respaldo del cliente Avamar que se pueden ejecutar al mismo
tiempo; en este caso, se activaron 270 flujos. Dado que Data Domain puede funcionar como objetivo para varias
tareas de respaldo y archiving simultáneamente, es importante garantizar el equilibrio óptimo a fin de evitar que
una aplicación suscriba en exceso el sistema Data Domain objetivo de forma no intencional. Luego, se agregaron
detalles de SNMP para permitir que Avamar recopilara y mostrara los detalles con respecto al estado del sistema, a
las alertas y a la capacidad.
Una vez que se completaron estos pasos, ESG Lab pudo ver el sistema Data Domain objetivo dentro del tablero de
Avamar Administrator (figura 4, arriba). Además, desde las pestañas Server/Server Management, pudimos hacer
clic en el ícono dd de la barra de herramientas y ver los detalles del sistema dd4500a recientemente agregado,
incluido el nombre del host, la capacidad utilizada y la disponible, los bytes protegidos, el estado de replicación, el
límite de flujos, y los estados de cifrado, autenticación y monitoreo (figura 4, abajo).
Figura 4. Administración de Data Domain desde la GUI de Avamar Administrator
Con el dd4500a objetivo configurado adecuadamente, el último paso fue crear una política de respaldo de Avamar
para las máquinas virtuales de VMware. Para el trabajo de respaldo titulado VM_Test, se seleccionó la pestaña
Options. En el cuadro desplegable, seleccionamos Linux VMware Image y, luego, seleccionamos la casilla para
utilizar Change Block Tracking. A continuación, hicimos clic en la casilla de verificación Store Backup on Data
Domain system, seleccionamos dd4500a de la lista de objetivos disponibles e hicimos clic en OK. En este punto, el
siguiente respaldo manual o calendarizado para el conjunto de datos VM_Test enviaría los datos directamente al
sistema Data Domain objetivo.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
8
Figura 5. Creación de una política de respaldo
Por qué es importante
La flexibilidad de los centros de datos virtualizados actuales es un beneficio para los negocios, pero puede ser un
gran reto para la TI y, particularmente, para los administradores de respaldo. Muchas organizaciones ejecutan
sistemas aislados de infraestructura y aplicaciones de respaldo diferentes para los conjuntos de datos físicos y
virtuales, o para distintas aplicaciones empresariales. Esto quita tiempo valioso, extiende las ventanas de respaldo,
lo que puede interferir en las actividades de producción, y aumenta los gastos operacionales y de capital.
ESG Lab validó la integración rápida y sencilla y la creación de la política para la solución combinada Avamar/Data
Domain. En solo unos pocos pasos y en menos de cinco minutos, se agregó el sistema Data Domain objetivo a
través de la consola de Avamar Administrator y se creó una política de respaldo de máquinas virtuales. La facilidad
y la velocidad de integración hacen que sea una elección sencilla para los administradores que desean consolidar
los respaldos de una amplia variedad de aplicaciones, sistemas y ubicaciones con componentes flexibles y de
funciones completas de Avamar y Data Domain.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
9
Rendimiento y eficiencia
El rendimiento de respaldo y restauración tiene un gran impacto en las operaciones de producción. La velocidad de
los respaldos generalmente marca la diferencia entre completar el trabajo para todas las máquinas virtuales dentro
de una ventana de respaldo y dejar datos desprotegidos; la capacidad de restaurar velozmente permite la
reanudación rápida del negocio. La solución combinada Avamar/Data Domain ejecuta un respaldo de máquinas
virtuales extremadamente eficiente, mediante la deduplicación avanzada para reducir considerablemente la
cantidad de datos que se deben transferir y almacenar, lo que, a su vez, aumenta significativamente el rendimiento
de respaldo. Además, el uso eficiente de los recursos de CPU del host durante los respaldos es un factor importante
para los ambientes virtuales, ya que garantiza que el procesamiento de protección de datos no interfiera con las
actividades de producción.
Metodología de respaldo de Data Domain y Avamar
Un diferenciador clave de la solución Avamar/Data Domain es la metodología de respaldo. Después de un respaldo
completo inicial, solo los respaldos incrementales se realizan mediante Avamar. La integración con VMware CBT
garantiza el respaldo subsiguiente solo de datos nuevos o modificados, y DD Boost garantiza solo el envío de datos
únicos de Avamar a Data Domain. Los metadatos siempre se almacenan en un archivo diferente, lo que permite
que Avamar busque con rapidez los datos que se desean para la recuperación. Los datos modificados que se
respaldan se aplican a los datos de respaldo anteriores para crear un punto de recuperación después de cada
respaldo incremental. Esto significa que cada respaldo con Avamar demora el tiempo de un respaldo incremental,
pero en realidad se representa como un respaldo completo, lo que hace que la recuperación sea más rápida y
eficiente.
Esta funcionalidad completa y sin límites elimina la necesidad de que TI ejecute respaldos completos adicionales de
manera habitual y actualice el catálogo, como hacen las aplicaciones de respaldo tradicionales (consulte la figura 6).
Estos respaldos completos adicionales requieren tiempo y esfuerzo. Además, el proceso de restauración a través
del método tradicional requiere revertir el respaldo completo más reciente y los respaldos incrementales
subsiguientes, un proceso engorroso que puede provocar demoras y ser poco confiable.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
10
Figura 6. Método completo sin límites de Avamar/Data Domain frente al método tradicional
Avamar y Data Domain
Enero
Respaldo
completo
inicial
Febrero
Completo sin
límites
Soluciones de respaldo tradicionales
Enero
Febrero
Incrementales
Respaldo
completo
inicial
Incrementales
Respaldo
completo,
actualización de
catálogo
Incrementales
Respaldo
completo,
actualización de
catálogo
Incrementales
Respaldo
completo,
actualización de
catálogo
Respaldo
completo,
actualización de
catálogo
Restauración y respaldo de máquinas virtuales a nivel de imagen con Avamar
Debido a que Avamar está estrechamente integrado con VADP, los respaldos a nivel de imagen aprovechan las
máquinas virtuales de proxy para descargar el procesamiento de respaldo y deduplicación desde las máquinas
virtuales del cliente. vSphere se utiliza para conectar dinámicamente las máquinas virtuales del cliente a la máquina
virtual de proxy de Avamar (con un balanceo de carga entre múltiples proxis) sin transferir datos por medio de la
red, lo que permite respaldos rápidos de varias máquinas virtuales.
VMware CBT acelera aún más el respaldo enviando una lista de los bloques modificados al software de Avamar.
Luego, con el aprovechamiento de DD Boost, los bloques se dividen en segmentos de longitud variable y se
deduplican antes de enviarlos a Data Domain.
CBT también se puede utilizar para restaurar rápidamente los datos modificados a una máquina virtual existente.
Avamar hace un seguimiento del estado actual de máquina virtual y de los registros de CBT, identifica qué bloques
del punto de recuperación deseado deben restaurarse y los restaura rápidamente.
Prueba de ESG Lab
Para la prueba de rendimiento y eficiencia, ESG Lab aprovechó dos servidores VMware vCenter ESX 5.5 alojados en
servidores dobles Cisco UCS 240; cada servidor UCS alojó 50 máquinas virtuales, con un total de 200 máquinas
virtuales. El almacenamiento de los servidores consistió en dos módulos XtremIO con una capacidad útil de 7.56 TB
cada uno. La protección de datos fue proporcionada por un dispositivo virtual Avamar Virtual Edition 7.2 y un
sistema Data Domain DD4500 con una capacidad útil de 86 TB, aprovechando puertos de 10 GbE. Los datos de
prueba (varios archivos de aproximadamente 1 MB cada uno) se generaron y se modificaron para el procesamiento
de respaldo a través de una herramienta interna (Data Gen) y proporcionaron un conjunto de datos coherente
entre varias instancias de prueba.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
11
Se emplearon tres procedimientos de prueba:



Prueba de ciclo de respaldo simulado de 28 días mediante 200 máquinas virtuales.
Prueba de restauración simulada mediante 31 máquinas virtuales con restauración de CBT.
Prueba de escala de respaldo simulada mediante 200 máquinas virtuales.
Cada máquina virtual contaba con aproximadamente 70 GB de datos, incluido el sistema operativo y los datos en
archivos generados para crear datos de respaldo inicial y datos nuevos/modificados entre los respaldos. Las
métricas se registraron respecto de la deduplicación, del rendimiento del tiempo de ejecución del respaldo/de la
restauración, y de la CPU. Cada prueba se completó tres veces para evaluar la consistencia de los resultados. Se
utilizaron pruebas prácticas y auditorías de pruebas ejecutadas anteriormente.
En primer lugar, ESG Lab observó la eficiencia de capacidad que ofrece la solución Avamar/Data Domain, a partir de
la prueba de ciclo de respaldo simulado de 28 días mediante 200 máquinas virtuales. Para cada ejecución de
pruebas, la herramienta Data Gen creó un sistema de archivos simulado, que incluyó directorios y archivos, de
aproximadamente 50 GB por máquina virtual. Se realizó un respaldo completo inicial, y a continuación, se utilizó la
herramienta para generar un 4 % de datos modificados y un 0.125 % de datos nuevos por cliente. Luego, se ejecutó
un respaldo incremental. Esto se ejecutó 28 veces para simular un ciclo de respaldo típico de cuatro semanas.
Debido al método completo sin límites que utiliza Avamar, solo se necesita un único respaldo completo. Se
completaron tres ejecuciones de pruebas con un restablecimiento completo entre estas para garantizar un
ambiente limpio.
ESG Lab auditó los archivos de registro de cada prueba para recopilar las estadísticas de deduplicación. Las tres
ejecuciones de la prueba de respaldo completo de 28 días fueron virtualmente idénticas. En la figura 7, se muestran
los datos de una iteración de prueba.
Figura 7. Deduplicación durante la prueba de respaldo de 28 días
Deduplicación:
Prueba28-Day
de respaldo
deTest
28 días
Deduplication:
Backup
450
400
350
300
TiB
TiB
250
Tasa
de deduplicación
Dedupe
rate 72.3 x de
72.3 veces
200
150
100
50
0
Dataprotegidos
Protected
Datos
Data
Stored
after Dedupe/Compression
Datos
almacenados
después de la
deduplicación/compresión
Qué significan los números

La cantidad de datos protegidos de máquinas virtuales fue de 402.15 TiB.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar


12
La cantidad de datos almacenados en Data Domain después de la compresión y de la deduplicación fue de
5.56 TiB.
La reducción de capacidad de esta prueba fue del 98.6 %, lo que genera una tasa de deduplicación de
72.3 veces.
A continuación, ESG Lab analizó el rendimiento de respaldo del ciclo de respaldo de 28 días. Como se muestra en la
figura 8, el respaldo inicial de 200 clientes de máquinas virtuales (de 70 GB cada una) demoró dos horas y
56 minutos en completarse. Después de esto, cada respaldo incremental con un 4 % de datos modificados y un
0.125 % de datos nuevos demoró entre 7 y 10 minutos.
Figura 8. Rendimiento de respaldo
28-day Test
Runtimede ejecución
Prueba de respaldo
de Backup:
28 días: Tiempo
200.00
180.00
160.00
Minutos
Minutes
140.00
120.00
100.00
80.00
60.00
40.00
20.00
0.00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
Qué significan los números



El tiempo de ejecución del respaldo completo inicial fue de 176 minutos (2:56:12).
El tiempo de ejecución de los 28 respaldos incrementales fue de 8.68 minutos en promedio.
A pesar de que se transfirieron solo los datos incrementales, cada punto de recuperación representa una
imagen completa del cliente.
El gráfico conceptual de la figura 9 demuestra la eficiencia de capacidad y las ventajas relacionadas con el tiempo
de ejecución de la solución. El lado izquierdo de la figura representa las máquinas virtuales, incluida la capacidad
total protegida. CBT y el procesamiento de deduplicación de la solución reducen la cantidad de datos que se deben
transferir y aceleran el tiempo de ejecución del respaldo. En este caso, se transfirió un promedio de 19.8 GiB por día,
lo que genera un tiempo de ejecución del respaldo diario promedio de 8.68 minutos.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
13
Figura 9. Reducción de datos y tiempo de ejecución del respaldo
Prueba de respaldo de 28 días:
Tiempo de ejecución del respaldo y transferencia de datos
Datos protegidos:
402.15 TiB
Datos almacenados:
5.56 TiB
LAN
Tiempo de ejecución del
respaldo diario
promedio:
8.68 min.
Transferencia de datos
diaria promedio:
19.8 GiB
Luego, ESG Lab analizó los datos para una prueba de restauración a través de CBT. Después del restablecimiento
completo del ambiente, se generó otro conjunto de datos de 50 GB para 31 máquinas virtuales, lo que creó
máquinas virtuales de 70 GB cada una. Después de que se realizara un respaldo completo inicial, se ejecutó un solo
ciclo de modificación de datos. Luego, se llevaron a cabo las restauraciones de CBT para una sola máquina virtual,
para 10 máquinas virtuales de forma simultánea y, por último, para 20 máquinas virtuales de forma simultánea.
Esto simula la restauración después del daño o de la reversión de los datos de las aplicaciones a un momento
específico para una máquina virtual o para un grupo de máquinas virtuales. La figura 10 muestra el tiempo de
ejecución de restauración promedio de las tres instancias de prueba.
Figura 10. Rendimiento de restauración
Tiempo de ejecución de restauración a medida que escalan los
Restore Time as Clients Scale
clientes
Restore
20clientes
Clients
Restauración
de 20
Restauración
de 10
Restore
10clientes
Clients
Restauración
de 11cliente
Restore
Client
0
2
4
6
8
10
12
14
Minutos
Minutes
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
16
18
Validación de laboratorio: EMC Data Domain y Avamar
14
Qué significan los números




Solo los datos modificados, aproximadamente 1.5 GB, requirieron una restauración para cada máquina
virtual.
El rendimiento de restauración para un solo cliente fue de 7 minutos en promedio.
El rendimiento de restauración para 10 clientes fue de 10.5 minutos en promedio.
El rendimiento de restauración para 20 clientes fue de 15 minutos en promedio.
Luego, ESG Lab analizó la sobrecarga de CPU necesaria para las pruebas de respaldo. El procesamiento de respaldo
con la solución Avamar/Data Domain incluye deduplicación que se distribuye entre el cliente y el objetivo. ESG Lab
auditó los archivos de registro para la prueba de respaldo de 28 días a fin de determinar la utilización de CPU
respecto del sistema Data Domain objetivo y de los hosts de ESX.
El proceso de prueba de respaldo de 28 días incluyó la limpieza automatizada y la generación de datos nuevos entre
las ejecuciones de pruebas, seguidas de un respaldo completo, y luego, una serie de respaldos incrementales con
datos nuevos y modificados generados entre estos respaldos incrementales. Como se muestra en la figura 11, a lo
largo de la duración de la prueba, el porcentaje de utilización de CPU de Data Domain permaneció por debajo del
30 %, con un solo incremento inicial de aproximadamente el 90 % durante el primer respaldo completo. Se
observaron incrementos menores durante la limpieza y el restablecimiento que se ejecutaron entre las semanas de
simulación. Para los cuatro hosts de ESX, la utilización de CPU se mantuvo en un porcentaje muy bajo.
Figura 11. Utilización de CPU de ESX Server y Data Domain
Utilización
CPU: Prueba
de respaldo
de 28 días
CPUdel
Utilization:
28-day
Backup Test
100
90
80
70
Data Domain
Percentage
Porcentaje
60
ESX 1
50
ESX 2
40
ESX 3
30
ESX 4
20
10
0
Time
Hora
Qué significan los números

Con respecto a la prueba de ciclo de respaldo de 28 días, la CPU de Data Domain tuvo un promedio del
23 %, con incrementos en la utilización de aproximadamente un 90 % durante el respaldo completo.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar

15
Con respecto a la prueba de ciclo de respaldo de 28 días, para los cuatro hosts de ESX, la utilización de CPU
tuvo un promedio de entre el 6 % y el 8 %, y nunca superó el 15 %.
Por último, ESG Lab analizó el rendimiento de la solución Avamar/Data Domain durante el escalamiento de los
respaldos. Después del respaldo completo inicial, se agregaron datos nuevos y modificados, y se ejecutaron
50 respaldos incrementales de máquinas virtuales de forma simultánea. Se repitió el mismo proceso con 100, 150 y
200 respaldos incrementales simultáneos. La figura 12 muestra el crecimiento de datos para cada conjunto de
respaldos incrementales simultáneos y el tiempo para completarlos. Las barras de color azul oscuro muestran la
cantidad inicial de datos, las barras de color celeste muestran los datos modificados para cada conjunto de
máquinas virtuales, y la línea de color naranja muestra el tiempo necesario para el respaldo. Está claro que el
crecimiento de datos no afectó negativamente el rendimiento de respaldo.
Figura 12. Prueba de escala: Rendimiento de respaldo a medida que crecen los volúmenes de datos
11
200
10.8
180
10.6
160
10.4
140
10.2
120
10
100
9.8
80
9.6
60
9.4
40
9.2
20
9
Minutos
Minutes
TBs
TB
Scale
Test:Duración
Duration de
of Concurrent
Incremental
Backups
Prueba de
escala:
los respaldos
incrementales
simultáneos
0
Datos
de
Initialiniciales
Data 200
200
VM
VMs
Incremental
Incremental de
50
50Vms
VM
Datos
Initial data
iniciales
Incremental
Incremental 100
de
100
VM
VMs
Incremental150
de
Incremental
150
VM
VMs.
Datos
New/changed
data
nuevos/modificados
Incremental200
de
Incremental
200
VM
VMs
Minutos
Minutes
Qué significan los números




El respaldo completo inicial demoró 184 minutos.
El tiempo necesario para 50 respaldos incrementales simultáneos de máquinas virtuales fue de 11 minutos;
para 100 simultáneos, 8 minutos; para 150 simultáneos, 8 minutos; y para 200 simultáneos, 7 minutos.
No se necesitaron servidores de proxy adicionales para escalar a 200 máquinas virtuales.
Si bien se probaron 200 máquinas virtuales, la deduplicación global de esta solución probablemente
provocaría un aumento de rendimiento a medida que se agregan más máquinas virtuales al pool.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
16
Por qué es importante
El crecimiento continuo de los volúmenes de datos reta a la TI de muchas maneras, pero, en particular, en el
dominio de respaldo. Las organizaciones deben proteger y conservar los datos en caso de daño o desastre, así
como abordar las exigentes iniciativas de gobierno corporativo y de cumplimiento de normas. Almacenar y
conservar estos datos a largo plazo aumenta los costos. El crecimiento se exacerba debido a la proliferación de
máquinas virtuales, donde los respaldos generalmente almacenan copias redundantes de sistemas operativos,
aplicaciones y datos.
ESG Lab validó la capacidad de la solución Avamar/Data Domain de reducir significativamente la cantidad de datos
de respaldo con tecnologías de deduplicación. La deduplicación de longitud variable de Data Domain garantiza
tasas de deduplicación máximas. Esto minimiza las necesidades de almacenamiento y de ancho de banda para el
respaldo, lo que genera ahorros de costos y de tiempo para el negocio. Además, esto garantiza que la replicación
para la recuperación de desastres se beneficiará de la misma reducción de necesidades de ancho de banda, además
de los ahorros de costos y de tiempo. La prueba también validó la velocidad de respaldos simultáneos,
restauraciones simultáneas y respaldos de 200 máquinas virtuales. La capacidad de utilizar las restauraciones de
CBT garantiza una recuperación rápida y minimiza el impacto en su paquete de discos de protección de datos a
medida que su ambiente de máquinas virtuales escala. Por último, ESG Lab validó que el procesamiento de
respaldo para flujos de respaldo individuales, los flujos simultáneos y las tareas de restauración dejaron una gran
cantidad de CPU disponible en el sistema Data Domain objetivo y en los hosts de ESX.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
17
Puntos destacados de la validación de ESG Lab
 ESG Lab quedó impresionado con la facilidad y la velocidad de integración de Avamar y Data Domain, que
permite una administración consolidada para la protección de datos.
 Las tasas de deduplicación de datos de esta prueba demostraron la habilidad de reducir la capacidad más
de 73 veces, lo que permite a las organizaciones ahorrar en términos de almacenamiento y de ancho de
banda.
 A ESG Lab le complació observar que la utilización de CPU fue eficiente para el sistema Data Domain
objetivo y para los hosts de ESXi durante todo el procesamiento de respaldo, dejando una gran cantidad de
espacio libre para otras tareas.
 ESG Lab también valoró que cuando se necesitó un procesamiento intensivo, Data Domain descargó la
mayor parte de la carga del host.
 La prueba de rendimiento de respaldo demostró la ventaja de velocidad de los respaldos completos sin
límites con esta solución eficiente en términos de red y de capacidad. Además, ESG Lab validó que no hubo
impacto en el rendimiento durante los respaldos simultáneos de máquinas virtuales, y también validó la
restauración rápida y eficiente disponible cuando se utiliza VMware CBT.
Temas que deben tenerse en cuenta
 Data Domain minimiza los requisitos de almacenamiento aprovechando la deduplicación de longitud
variable, y la integración de DD Boost minimiza el ancho de banda distribuyendo las partes de la
deduplicación de Data Domain a Avamar para permitir la deduplicación del lado del cliente. Esto es
importante para los respaldos de máquinas virtuales, dado que generalmente contienen sistemas
operativos redundantes y otros datos.
 La eficiencia de la utilización de CPU es importante para los hosts de ESXi que son compatibles con las
aplicaciones de producción y para Data Domain que puede funcionar como objetivo para otras actividades
de protección al mismo tiempo.
 La restauración de CBT es una excelente opción que proporciona una restauración rápida en caso de daño
de los datos de una máquina virtual específica. Se debe tener en cuenta que la restauración de CBT no es
efectiva para una máquina virtual completamente destruida, ya que en ese caso se deben restaurar todos
los VMDK que componen la máquina virtual.
 Las tasas de deduplicación siempre dependen del tipo de datos que se respalda; algunos (como los datos en
archivos) tienden a tener datos duplicados importantes, mientras que otros (como los videos y las
imágenes) tienden a tener poca duplicación.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
18
La gran verdad
Cada año, una investigación de ESG revela que las organizaciones empresariales y los mercados de rango medio
colocan la mejora de la protección de datos, la administración del crecimiento de datos y el aumento de
virtualización de servidores entre sus principales prioridades de TI.2 El motivo es simple: La transformación de las
operaciones de producción tiene un impacto inmediato e importante en los mecanismos de protección. La
tecnología pionera de VMware lanzó una revolución que ha dado lugar a la implementación de la virtualización y a
la proliferación de máquinas virtuales en las organizaciones de todo el mundo; la protección de todos esos datos
continúa siendo un reto.
Avamar y Data Domain son soluciones de protección de datos altamente evolucionadas, y en conjunto son aún más
potentes.


Data Domain fue pionero en el campo de la deduplicación, pero, en este momento, su flexibilidad y
escalabilidad son igualmente importantes, algo fundamental para la protección de datos de VMware, ya
que las organizaciones activan rápidamente nuevas máquinas virtuales y se encuentran con cientos, e
incluso miles, de máquinas virtuales para proteger. Data Domain ofrece una flexibilidad incomparable y
proporciona de manera simultánea un objetivo para varias aplicaciones de respaldo diferentes; para
respaldos directos de aplicaciones empresariales, como Oracle RMAN, SQL, SAP y DB2; para respaldos
directos de almacenamiento primario, como VMAX3 y XtremIO; para respaldo de mainframe y sistemas
IBM i; y para soluciones de archiving, como SourceOne. Asimismo, mientras que la TI puede hacer un
seguimiento de todas las actividades de protección (por ejemplo, a través de EMC Data Protection Advisor),
otros administradores pueden manejar sus propios respaldos (por ejemplo, los DBA pueden ejecutar RMAN,
y los administradores de virtualización pueden ejecutar respaldos de máquinas virtuales). Esto distribuye el
trabajo de administrar varias actividades de protección de datos sin tener que comprar y administrar
paquetes de discos de infraestructuras diferentes. Data Domain también es conocido por su confiabilidad
integrada; se lo conoce como un sistema “desconfiado” debido a las funciones de verificación de datos, de
detección continua de fallas y de autorreparación de la arquitectura de invulnerabilidad de datos. Todas
estas características hacen que sea una solución sólida para pequeñas y grandes empresas, así como para
proveedores de servicios.
Avamar proporciona respaldos coherentes con las máquinas virtuales y las aplicaciones, con recuperación
rápida granular. También aprovecha VADP para los respaldos de VMware y está integrado con vSphere.
Como Data Domain, Avamar proporciona la escalabilidad que demandan los ambientes de servidores
virtuales, mediante máquinas virtuales de proxy que tienen balanceo de carga automático. La capacidad de
aprovechar CBT para el respaldo y la restauración acelera el rendimiento para ambas tareas, así como
también reduce la transferencia de datos en la red. Además, si bien en este proyecto no se probó, Avamar
proporciona acceso instantáneo de máquinas virtuales a las imágenes almacenadas en Data Domain, lo que
brinda la agilidad y la capacidad de recuperación rápida que las organizaciones necesitan en la actualidad
para mantener las operaciones de producción.
ESG Lab validó la combinación de Avamar y Data Domain en un escenario real para probar cómo funcionaría en el
ambiente del cliente. Esto incluyó la facilidad de integrar Avamar con Data Domain, algo fundamental en el
panorama de TI moderno. La prueba con 200 máquinas virtuales validó la eficiencia de la capacidad de los
mecanismos dobles de deduplicación, las ventajas en cuanto al rendimiento de los respaldos incrementales, la
capacidad de manejar cientos de respaldos de máquinas virtuales de forma simultánea y, a la vez, mantener un
rendimiento rápido, y la capacidad de aprovechar las restauraciones de CBT para lograr una recuperación rápida.
Muchas organizaciones actualmente recurren a dispositivos de respaldo integrados por dos razones clave: la
facilidad de implementación, y la reducción en los gastos operacionales y de capital. Si bien técnicamente no es una
solución de dispositivos integrados, la combinación de Data Domain y Avamar ofrece tasas de deduplicación más
altas que los dispositivos de respaldo integrados tradicionales, así como la escalabilidad, la flexibilidad y la agilidad
2
Fuente: Informe de investigación de ESG, 2015 IT Spending Intentions Survey, febrero de 2015.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
19
necesarias para proteger todo un ambiente sin concesiones. Es una combinación potente que puede ayudar a las
organizaciones a simplificar y a consolidar la protección de datos con una reducción en los costos.
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
Validación de laboratorio: EMC Data Domain y Avamar
20
Apéndice
Tabla 1. Banco de prueba de ESG Lab
Software de respaldo
Objetivo de disco
Avamar Virtual Edition 7.2
2 CPU virtuales
6 vRAM
900 GB de espacio en disco
Data Domain DD4500
DD OS 5.6.0.3
4 bandejas de discos ES30-30
4 interfaces de 10 GbE (2 utilizadas en las pruebas)
Virtualización
Servidores
VMware vCenter 5.5.2
4 servidores Cisco UCS 240
SO: SLES 12.3
Almacenamiento
Red
2 EMC XtremIO, de 7.56 TB de capacidad útil cada uno
10 GbE
Cómo se obtuvieron las mediciones en las pruebas
Todas las pruebas se llevaron a cabo para reflejar un escenario real: respaldos diarios con una tasa de cambio
realista durante un mes.



Deduplicación: Las mediciones de deduplicación se extrajeron directamente de Data Domain a través de
filesys show compression en los scripts que controlan los trabajos de respaldo. Se recopilaron los datos
inmediatamente después de que cada trabajo de respaldo se completara y se escribiera en un archivo de
registro.
Rendimiento de respaldo/restauración: Se utilizó la utilidad común time de Unix/Linux para determinar
cuánto tiempo demoró la ejecución de los trabajos de respaldo y de restauración. Todos los trabajos de
respaldo y de restauración se ejecutaron de scripts a través de la interfaz de la línea de comandos mccli de
Avamar con la utilidad time para enviar el tiempo de ejecución total de todos los trabajos de principio a fin.
Durante las pruebas, los resultados se escribieron en un archivo de registro.
CPU: Se recopiló información de CPU y de otros recursos del sistema para varios componentes en el
ambiente de pruebas a través de EMC Data Protection Advisor. También se utilizó DPA como segundo
método para verificar los resultados del tiempo de ejecución y de la deduplicación.bra
© 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados.
20 Asylum Street | Milford, MA 01757 | Tel.: 508-482-0188 Fax: 508-482-0218 | www.esg-global.com
Descargar