Una copia de seguridad incremental es aquella en la que las copias sucesivas de los datos contienen solo la parte que ha cambiado desde que se realizó la copia de seguridad anterior. [1] [2] [3] [4] Cuando se necesita una recuperación completa, el proceso de restauración necesitaría la última copia de seguridad completa más todas las copias de seguridad incrementales hasta el punto de restauración. [5] Las copias de seguridad incrementales suelen ser deseables ya que reducen el uso del espacio de almacenamiento y son más rápidas de realizar que las copias de seguridad diferenciales . [6]
La forma más básica de copia de seguridad incremental consiste en identificar, registrar y, por lo tanto, conservar únicamente aquellos archivos que han cambiado desde la última copia de seguridad. Dado que los cambios suelen ser pocos, las copias de seguridad incrementales son mucho más pequeñas y rápidas que las copias de seguridad completas. Por ejemplo, después de una copia de seguridad completa el viernes, una copia de seguridad el lunes contendrá solo aquellos archivos que hayan cambiado desde el viernes. Una copia de seguridad el martes contendrá solo aquellos archivos que hayan cambiado desde el lunes, y así sucesivamente. Una restauración completa de los datos será naturalmente más lenta, ya que se deben restaurar todos los incrementos. Si alguna de las copias creadas falla, incluida la primera (completa), la restauración será incompleta. [7]
Un ejemplo de Unix sería:
rsync -e ssh -va --link-dest = $dst /hourly.1 $servidorremoto : $rutaremota $dst /hourly.0
El uso de la opción --link-dest de rsync es lo que hace que este comando sea un ejemplo de copia de seguridad incremental.
Un esquema de copia de seguridad incremental más sofisticado implica varios niveles de copia de seguridad numerados . Una copia de seguridad completa es de nivel 0. Una copia de seguridad de nivel n respaldará todo lo que haya cambiado desde la copia de seguridad de nivel n-1 más reciente . Supongamos, por ejemplo, que se realizó una copia de seguridad de nivel 0 un domingo. Una copia de seguridad de nivel 1 realizada el lunes incluiría solo los cambios realizados desde el domingo. Una copia de seguridad de nivel 2 realizada el martes incluiría solo los cambios realizados desde el lunes. Una copia de seguridad de nivel 3 realizada el miércoles incluiría solo los cambios realizados desde el martes. Si se realizó una copia de seguridad de nivel 2 el jueves, incluiría todos los cambios realizados desde el lunes porque el lunes fue la copia de seguridad de nivel n-1 más reciente.
Una copia de seguridad incremental de los cambios realizados entre dos instancias de un espejo puede ser hacia adelante o hacia atrás.
Si la versión más antigua del espejo se trata como la base y la versión más nueva como la versión revisada, el incremental producido es un incremental hacia adelante.
Si la versión más nueva del espejo se trata como la base y la versión más antigua como la versión revisada/modificada, el incremental producido es un incremental inverso.
Al realizar copias de seguridad mediante copias de seguridad incrementales inversas, cada vez que se realiza una copia de seguridad incremental inversa, se aplica (en sentido inverso) a la copia de seguridad completa (sintética) anterior, por lo que la copia de seguridad completa (sintética) actual siempre es una copia de seguridad del estado más reciente del sistema. Esto contrasta con las copias de seguridad incrementales hacia adelante, en las que la copia de seguridad completa actual es una copia de seguridad de la versión más antigua del sistema y, para obtener una copia de seguridad del estado más reciente del sistema, todas las copias de seguridad incrementales hacia adelante se deben aplicar a esa versión más antigua de forma sucesiva.
Al aplicar un incremento inverso a un espejo, el resultado será una versión anterior del espejo. Esto proporciona un medio para volver a cualquier versión anterior del espejo .
En otras palabras, después de la copia de seguridad completa inicial, cada copia de seguridad incremental sucesiva aplica los cambios a la copia de seguridad completa anterior, creando una nueva copia de seguridad completa sintética cada vez, pero manteniendo la capacidad de volver a versiones anteriores.
La principal ventaja de este tipo de copia de seguridad es que el proceso de recuperación es más eficiente, ya que la versión más reciente de los datos (que es la que se restaura con más frecuencia) es una copia de seguridad completa (sintética) y no es necesario aplicarle copias incrementales durante su restauración. La copia de seguridad incremental inversa funciona tanto con cintas como con discos, pero en la práctica suele funcionar mejor con discos.
Las empresas que utilizan el método de copia de seguridad incremental inversa incluyen Intronis y Zetta.net .
Este estilo es similar al concepto de copia de seguridad sintética. Después de una copia de seguridad completa inicial, solo las copias de seguridad incrementales se envían a un sistema de copia de seguridad centralizado. Este servidor realiza un seguimiento de todos los incrementos y envía los datos adecuados al cliente durante las restauraciones. Esto se puede implementar enviando cada copia incremental directamente a la cinta a medida que se toma y luego refactorizando las cintas según sea necesario. Si hay suficiente espacio en disco disponible, se puede mantener un espejo en línea junto con los cambios incrementales anteriores para que se puedan restaurar las versiones actuales o anteriores de los sistemas que se están respaldando. Este es un método adecuado en el caso de los sistemas bancarios. [ cita requerida ]
En las arquitecturas de nube modernas o en los escenarios de respaldo de disco a disco, esto es mucho más simple. Los datos se dividen en fragmentos y se colocan en un sistema de almacenamiento en la nube . Los metadatos sobre los fragmentos se almacenan en un sistema persistente, lo que permite que el sistema ensamble una copia de seguridad de un momento determinado a partir de estos fragmentos en el momento de la restauración. No es necesario refactorizar la cinta.
Este método realiza una copia de seguridad únicamente de los bloques dentro del archivo que han cambiado. Esto requiere un mayor nivel de integración entre el remitente y el receptor.
Estas tecnologías de backup son similares al método de backup incremental “a nivel de bloques”; sin embargo, el método de backup incremental a nivel de bytes (o binario) se basa en una variación binaria de los archivos respecto al backup anterior: mientras que las tecnologías basadas en bloques trabajan con unidades de cambio pesadas (bloques de 8K, 4K o 1K), las tecnologías basadas en bytes trabajan con la unidad mínima, ahorrando espacio al reflejar un cambio sobre un archivo. [8] Otra diferencia importante es que trabajan de forma independiente sobre el sistema de archivos. Actualmente, estas son las tecnologías que consiguen la mayor compresión relativa de los datos, convirtiéndose en una gran ventaja para las copias de seguridad realizadas a través de Internet. [ cita requerida ]
Una copia de seguridad sintética es un método alternativo para crear copias de seguridad completas. En lugar de leer y realizar copias de seguridad de los datos directamente desde el disco, sintetizará los datos de la copia de seguridad completa anterior (ya sea una copia de seguridad completa normal para la primera copia de seguridad o la copia de seguridad completa sintética anterior) y las copias de seguridad incrementales periódicas. Como solo las copias de seguridad incrementales leen datos del disco, estos son los únicos archivos que deben transferirse durante la replicación externa. Esto reduce en gran medida el ancho de banda necesario para la replicación externa. La copia de seguridad sintética no siempre funciona con la misma eficiencia. La velocidad de los datos cargados desde la máquina de destino a los datos sincronizados en el almacenamiento varía según la fragmentación del disco. [9]
Una copia de seguridad diferencial es una copia de seguridad acumulativa de todos los cambios realizados desde la última copia de seguridad completa o normal , es decir, las diferencias desde la última copia de seguridad completa. La ventaja de esto es que el tiempo de recuperación es más rápido, ya que solo se necesita una copia de seguridad completa y la última copia de seguridad diferencial para restaurar el sistema. La desventaja es que por cada día transcurrido desde la última copia de seguridad completa, es necesario realizar una copia de seguridad de más datos, especialmente si una proporción significativa de los datos ha cambiado.
Una copia de seguridad incremental perpetua hacia adelante [10] permite que la operación sintética cree una nueva copia de seguridad completa, que está limitada al tamaño del archivo incremental, en lugar del tamaño completo de un archivo de copia de seguridad completa como sucedería en un “modo hacia adelante con copias completas sintéticas”. La E/S total consumida es la misma que la incremental inversa, pero durante la duración de la actividad de copia de seguridad solo se utiliza 1 E/S de escritura y la instantánea de la VM se abre durante menos tiempo que la incremental inversa; las 2 E/S restantes se utilizan para actualizar el archivo de copia de seguridad completa.