TENDENCIA De-duplicación, la mejor opción para los Datos Por Enrique Forbes, Gerente de Producto, División Backup and Recovery Systems EMC Cono Sur En el actual universo digital, el volumen de datos aumenta exponencialmente. Así, la De-duplicación resulta la mejor opción para la realización del back up, logrando más confiabilidad y simplicidad. A continuación, le presentamos las principales recomendaciones y claves de la De-duplicación. ducción en los costos de creación, captura, administración y almacenamiento de la información, concluyendo con una sexta parte del costo registrado en 2005. De acuerdo a la consultora, la inversión empresarial en el universo digital también se incrementó un 50%, alcanzando la suma de 4 trillones de dólares estadounidenses, desde el año 2005. Enrique Forbes, Gerente de Producto, División Backup and Recovery Systems EMC Cono Sur El universo digital y las grandes cantidades de información están impulsando una transformación social, científica y tecnológica. En la actualidad, las empresas manejan y desarrollan grandes volúmenes de información, los cuales siguen creciendo exponencialmente. Según el estudio de IDC sobre el Universo Digital, “Encontrando el Valor dentro del Caos” patrocinado por EMC, los datos de todo el mundo se duplican cada dos años. Así, para fines de 2011, fueron creados y replicados 1.8 zettabytes de información (1.8 trillón de gigabytes). El contenido de la información puede ser de dos tipos: estructurado o no estructurado. La información estructurada es toda aquella que se encuentra en filas y columnas: saldos, números identificación tributaria, de documentos, etc. La información no estructurada es toda la relacionada con Media, es decir, imágenes, fotos, videos, redes sociales, etc. En 2011, las tecnologías de “dominio de la información” generaron una re- Toda esta información es la esencia de la operación de empresas y organis- mos, y como tal deben tener certeza que estarán siempre disponible. Para ello, las organizaciones utilizan las tecnologías de back up, las cuales permiten tener copias de la información, asegurando así la disponibilidad. El back up es básicamente una copia de seguridad de la información pero alojada en otro dispositivo que puede ser un pendrive, un CD, un disco duro o una cinta. Sin embargo, en el mundo del back up existen una serie de problemas que se deben tener en cuenta para proteger adecuadamente la información. El primero está relacionado con la performance: puede suceder que la ventana de back up, es decir la franja de tiempo disponible para realizarlo, no alcance dado el volumen de información a proteger. En este caso, lo que se debe tener en cuenta es la recuperación de la información, para poder tomarla de back up y volver a colocarla en el sistema cuando sea necesario o cuando ocurra una pérdida de datos. Por este motivo, la recuperación resulta tan o más importante que el back » up mismo. Logicalis Now - Marzo 2012 | 35 TENDENCIA » Otro de los problemas son los costos de realizar back up. Los dispositivos, en los que se guarda la información copiada, generalmente son cintas que tienen un alto costo tanto de adquisición como de operación. Por otro lado, las cintas, por su naturaleza, resultan poco confiables ya que tienden a deteriorarse. En consecuencia, el back up a cinta resulta una tecnología obsoleta que las empresas están reemplazando aceleradamente por el disco. Para dar solución a estos problemas, surge la tecnología de De-duplicación, la cual hace que el back up y la recuperación sean más simples y confiables. La de-duplicación es el proceso de detectar e identificar bloques únicos de información a los efectos de remplazar los datos duplicados por referencias. Cuando se hace back up de forma tradicional hay una alta ineficiencia en los procesos de copia, ya que el mismo dato es copiado una y otra vez en los respaldos diarios, semanales, mensuales, etc. Así, por ejemplo, una empresa puede contar con 5 terabytes de información a resguardar. Sin embargo, al realizar back up de sus datos, esta información puede fácilmente generar 100 terabytes de información. La de-duplicación posibilita que el sistema revise si la información fue respaldada con anterioridad. De ser así, sólo graba una referencia hacia dicha información en lugar de los datos en sí. A medida que transcurre el tiempo, la tasa de de-duplicación alcanzada se incrementa y, así, en un back up tradicional de 4 meses se pueden alcanzar tasas de de-duplicación de 20, 30 e incluso más. En otras palabras, un back up, que con los métodos tradicionales ocupa 100 terabytes de almacenamiento, con de-duplicación utilizaría solamente 5 terabytes. En cuanto al lugar, la de-duplicación puede hacerse en el destino o en el origen. La de-duplicación en el destino significa que toda la información viaja por la red hasta el dispositivo con de-duplicación y, una vez allí, el dispositivo se encarga de hacer la de-du- De-duplicación en el Destino Network De-duplicación en el Origen Network 36 | Marzo 2012 - Logicalis Now plicación en línea y grabar solamente la información deduplicada. Esta tecnología es especialmente recomendada para utilizar en Data Centers. La de-duplicación en el origen significa que la información ya viaja deduplicada a través de la red. Para esto se instala un agente en cada equipo, sobre los que se quiere tomar back up y este agente es el encargado de revisar si la información fue previamente respaldada. De esa forma, envía a través de la red solo los datos únicos a ser respaldados al dispositivo de back up para que se guarden. Esta tecnología es ideal para entornos de oficinas remotas, en las que la comunicación resulta un obstáculo. También es recomendada para el back up de los ambientes virtuales y de laptops y desktops. Mientras que el back up tradicional ocupa 100 terabytes de almacenamiento, con la de-duplicación sólo utiliza 5 terabytes. En qué casos se aplica: Backup de bases de datos Backup de mainframe Backup de IBM iSeries En qué casos se aplica: Backup de oficinas remotas Backup de ambientes virtuales Backup de Desktop / Laptop