Incluya la eliminación de datos duplicados como parte de su estrategia general de copias de respaldo

12 de junio de 2007
Resumen Las copias de respaldo en disco ayudan a las organizaciones a hacer frente a algunos de los desafíos relacionados con las copias de respaldo. Por ello, la tecnología de eliminación de datos duplicados de Symantec debería formar parte de toda estrategia empresarial.

Introducción

El rápido aumento del almacenamiento en la empresa, tanto en centros de datos internos como externos, ha desafiado las estrategias de copias de respaldo tradicionales. En este artículo, se analizan dichos desafíos, se aporta información sobre síntomas que suelen preceder los problemas relacionados con la protección de grandes cantidades de datos y se investiga cómo la nueva tecnología de copias de respaldo en disco, llamada eliminación de datos duplicados, puede ser una herramienta eficaz para resolver los crecientes desafíos de las copias de respaldo y recuperación.

Cómo manejar un mar de datos

Las políticas de copias de respaldo de las empresas no han evolucionado demasiado en los últimos años. Las copias de respaldo de los datos suelen escribirse, en su mayoría, en cintas magnéticas todas las noches y se envían a un depósito externo para un almacenamiento seguro y para que estén disponibles en caso de que se produzca un desastre.

Sin embargo, a medida que el mundo avanza hacia un ciclo de trabajo de 24 horas y la cantidad de datos que se deben guardar en las copias de respaldo continúa aumentando rápidamente, el concepto de un período de "inactividad" prolongado destinado a la realización de las copias de respaldo y su mantenimiento resulta arcaico.

Algunas estadísticas obtenidas por la empresa de investigación TheInfoPro indican la gravedad de la situación. TheInfoPro descubrió que, entre las 1000 empresas clasificadas por la revista Fortune, la capacidad de almacenamiento promedio creció de 198 terabytes a principios de 2005 a 680 terabytes en octubre de 2006.Como solución a este problema, surgieron las tecnologías de copias de respaldo en disco.

"Las copias de respaldo suponen el área principal de mejoras para las 1000 empresas de almacenamiento clasificadas por Fortune en 2007", escribió el director general de TheInfoPro, Robert Stevenson, en un informe de diciembre de 2006. "El aumento del almacenamiento frontal, el cumplimiento de las normas y los tiempos cada vez más extensos de retención de datos han creado la necesidad de innovación en las copias de respaldo a fin de mantener los niveles más altos de protección de datos".

Estos son sólo algunos de los síntomas de problemas en la protección de datos:
  • Imposibilidad frecuente de completar los procesos de copias de respaldo en el primer intento.
  • Tareas de copia de respaldo demoradas hasta que exista un momento disponible para realizarlas.
  • Datos fundamentales no respaldados o respaldados con poca frecuencia.
  • Cintas de copias de respaldo no enviadas de manera adecuada o no protegidas contra la destrucción.
Las empresas que analizan las necesidades comerciales de una protección avanzada de datos en disco debería comenzar formulando las siguientes preguntas:
  • ¿Los datos de sus oficinas remotas se protegen continuamente?
  • ¿Puede recuperar datos rápidamente (como archivos o correos electrónicos) desde fuentes conectadas o no conectadas cuando se realizan auditorías o se debe realizar una recuperación de emergencia?
  • ¿Evalúa frecuentemente la recuperación de datos y la prontitud con que se pueden realizar las recuperaciones después de desastres?
  • ¿Sabe cuánto dinero gasta en protección de los distintos tipos de datos y si los datos que son más importantes cuentan con el mayor nivel de protección?
  • ¿Puede recuperar rápidamente aplicaciones y datos en caso de error humano, error del sistema o desastre?
  • ¿Puede demostrar e informar eficazmente los datos que están protegidos en las distintas unidades de negocios, ubicaciones y aplicaciones?
  • ¿Su inversión en soluciones de protección de datos y personal capacitado es adecuada para mantener un entorno avanzado?
  • ¿Puede encontrar, retener y reemplazar profesionales especializados en protección de datos?
Si bien pocas organizaciones pueden responder a todas estas preguntas de manera afirmativa, muchas respuestas negativas representan una clara evidencia de que la protección de datos no se está manejando de la manera adecuada.

Eliminación de datos redundantes

Una manera en la que las empresas pueden reducir el importante peso de los datos que se envían a copias de respaldo es el uso de la eliminación de datos duplicados, también conocida como optimización de la capacidad y eliminación de la redundancia. La eliminación de datos duplicados consiste en buscar instancias redundantes de datos de copia de respaldo en el nivel de subarchivo o de bloques en todos los datos de copia de respaldo o en todas las ubicaciones. De este modo, las empresas pueden reducir la cantidad de almacenamiento necesario para las copias de respaldo. Puede realizarse como parte del proceso de copia de respaldo en el servidor fuente, lo que reduce significativamente el ancho de banda necesario para los datos de copia de respaldo, o como un proceso aparte después de que los datos se enviaron a la aplicación de copias de respaldo, pero antes de escribirlos en el disco. Además de mejorar el proceso de copias de respaldo, la tecnología de eliminación de datos duplicados puede mejorar la recuperación tras un desastre mediante la reducción del ancho de banda necesario para transmitir grandes volúmenes de datos entre distintos sitios.

Según algunos expertos, la eliminación de datos duplicados puede reducir el almacenamiento total de copias de respaldo en factores de 100:1 o más (según la naturaleza de los datos) cuando se compara con los métodos tradicionales de copias de respaldo en cinta. Las reducciones de ancho de banda proporcionada por la tecnología de eliminación de datos duplicados en el cliente son incluso más significativas porque esa tecnología elimina la necesidad de utilizar un ciclo regular de copias de respaldo completas.

Veritas NetBackup PureDisk ofrece una protección de datos segura y con almacenamiento optimizado para oficinas remotas, entornos virtuales y centros de datos. NetBackup PureDisk combina la copia de respaldo basada en disco con la eliminación global de datos duplicados para mejorar el rendimiento y reducir el almacenamiento y el consumo de ancho de banda de las copias de respaldo. La administración basada en Web y la recuperación de datos permiten una administración flexible desde cualquier ubicación y la recuperación de archivos con el método "arrastrar y colocar". Con menos recursos de red, almacenamiento y soportes de cinta que administrar, los equipos empresariales de TI pueden aplicar de manera más coherente las políticas de cumplimiento y administración de datos de la empresa.

Conclusión

El volumen de datos de las empresas aumenta a una velocidad tan rápida que no hay tiempo para realizar las copias de respaldo de un día para el otro. Las empresas que se esfuerzan por alcanzar los objetivos de tiempo para realizar las copias de respaldo están estudiando nuevas soluciones de copia de respaldo en disco y cómo pueden integrarse con la infraestructura existente. Al aprovechar la eliminación de datos duplicados como parte de una estrategia general de copias de respaldo, las empresas pueden reducir de manera significativa el almacenamiento y el consumo de ancho de banda de las copias de respaldo, lo que las ayuda a respetar el cumplimiento y cumplir con los requisitos de servicio para la recuperación de datos.