stringtranslate.com

Almacenamiento de instancia única

El almacenamiento de instancia única ( SIS ) es la capacidad de un sistema de tomar múltiples copias de contenido y reemplazarlas por una única copia compartida. Es un medio para eliminar la duplicación de datos y aumentar la eficiencia. El SIS se implementa con frecuencia en sistemas de archivos , software de servidor de correo electrónico , respaldo de datos y otro software informático relacionado con el almacenamiento. El almacenamiento de instancia única es una variante simple de la deduplicación de datos . Si bien la deduplicación de datos puede funcionar a nivel de segmento o subbloque, el almacenamiento de instancia única funciona a nivel de archivo completo y elimina copias redundantes de archivos completos o mensajes de correo electrónico. [1]

Concepto

En el caso de un servidor de correo electrónico , el almacenamiento de instancia única significaría que se guarda una única copia de un mensaje dentro de su base de datos mientras que los buzones de correo individuales acceden al contenido a través de un puntero de referencia. Sin embargo, existe una idea errónea común de que el beneficio principal del almacenamiento de instancia única en servidores de correo es una reducción en los requisitos de espacio en disco. La verdad es que su beneficio principal es mejorar en gran medida la eficiencia de entrega de mensajes enviados a grandes listas de distribución. En un escenario de servidor de correo, los ahorros de espacio en disco del almacenamiento de instancia única son transitorios y disminuyen muy rápidamente con el tiempo. [ cita requerida ]

Cuando se utiliza junto con un software de copia de seguridad, el almacenamiento de instancia única puede reducir la cantidad de medios de archivo necesarios, ya que evita almacenar copias duplicadas del mismo archivo. A menudo, se instalan archivos idénticos en varias computadoras, por ejemplo, archivos del sistema operativo . Con el almacenamiento de instancia única, solo se escribe una copia de un archivo en el medio de copia de seguridad, lo que reduce el espacio. Esto se vuelve más importante cuando el almacenamiento se realiza fuera del sitio y en un almacenamiento en la nube como Amazon S3 . En tales casos, se ha informado que la deduplicación puede ayudar a reducir los costos de almacenamiento, los costos de ancho de banda y las ventanas de copia de seguridad hasta en 10:1. [2]

Novell GroupWise se creó sobre la base de un almacenamiento de instancia única, lo que explica su gran capacidad.

Los archivos de imagen de CD/DVD ISO se pueden optimizar para usar SIS para reducir el tamaño de una compilación de CD/DVD (si hay suficientes archivos duplicados) para que quepa en medios más pequeños.

SIS está relacionado con la búsqueda de duplicación de archivos en todo el sistema y con herramientas de detección de instancias de archivos múltiples como la aplicación P2P BearShare (versiones 5.n y anteriores), pero se diferencia en que SIS reduce la utilización de almacenamiento automáticamente y crea y conserva enlaces simbólicos, mientras que Bearshare permite la eliminación manual de duplicados y enlaces de iconos de tipo del Explorador de Windows y del sistema de archivos a nivel de usuario asociados .

Microsoft

El SIS se introdujo con la característica de Servicios de instalación remota de Windows 2000 Server . Un servidor típico puede contener diez o más configuraciones de instalación únicas (quizás con diferentes controladores de dispositivos o paquetes de software ), pero quizás solo el 20% de los datos pueden ser únicos entre configuraciones. [3] Microsoft afirma que "SIS funciona buscando un volumen de disco duro para identificar archivos duplicados. Cuando SIS encuentra archivos idénticos, guarda una copia del archivo en un repositorio central, llamado SIS Common Store, y reemplaza otras copias con punteros a las versiones almacenadas". [4] Los archivos se comparan únicamente por sus funciones hash ; los archivos con diferentes nombres o fechas se pueden consolidar siempre que los datos en sí sean idénticos. [3] Windows Server 2003 Standard Edition tiene capacidades SIS, pero está limitado a instalaciones de sistemas operativos OEM. [ cita requerida ]

El formato de imágenes de Windows basado en archivos introducido en Windows Vista también admitía el almacenamiento de instancia única. El almacenamiento de instancia única era una característica de Microsoft Exchange Server desde la versión 4.0 y también está presente en Windows Home Server de Microsoft . Solo elimina la duplicación de archivos adjuntos en Exchange 2007 y se eliminó por completo en Microsoft Exchange Server 2010. [5] Microsoft anunció Windows Storage Server 2008 (WSS2008) [6] con almacenamiento de instancia única el 1 de junio de 2009 y afirma que esta característica no está disponible en Windows Server 2008. [ 6]

La función está oficialmente obsoleta desde Windows Server 2012, cuando se introdujo un nuevo mecanismo de deduplicación de datos basado en fragmentos más potente. Permite deduplicar archivos con contenido similar siempre que tengan fragmentos de datos idénticos. Este mecanismo es más potente que SIS. [7] Desde Windows Server 2019, la función es totalmente compatible con ReFS. [8]

Véase también

Referencias

  1. ^ Explicación de las tasas de deduplicación y el almacenamiento de instancia única a los clientes. George Crump, Storage Switzerland
  2. ^ La deduplicación + Amazon S3 le permitirá ahorrar tiempo y dinero. Documento técnico: publicado en junio de 2008
  3. ^ ab Douceur, John (JD); Goebel, David; Corbin, Scott; Bolosky, Bill (agosto de 2000). "Almacenamiento de instancia única en Windows 2000" (PDF) . Microsoft Research . Microsoft Research y Balder Technology Group.
  4. ^ Almacenamiento de instancia única en Microsoft Windows Storage Server 2003 R2 Archivado el 4 de enero de 2007 en Wayback Machine : Documento técnico: publicado en mayo de 2006
  5. ^ [1] El blog del equipo de Exchange, Microsoft Corp.
  6. ^ de Windows Storage Server 2008 en Microsoft
  7. ^ FileCAB-Team (10 de abril de 2019). "Introducción a la deduplicación de datos en Windows Server 2012". Comunidad tecnológica de Microsoft .
  8. ^ "Interoperabilidad de deduplicación de datos". docs.microsoft.com . 29 de marzo de 2022.