stringtranslate.com

Separación de datos

En el almacenamiento de datos informáticos , la división de datos es la técnica de segmentar datos lógicamente secuenciales, como un archivo, de modo que los segmentos consecutivos se almacenen en diferentes dispositivos de almacenamiento físico.

Un ejemplo de división de datos. Los archivos A y B, de cuatro bloques cada uno, se distribuyen en los discos D1 a D3.

La creación de bandas es útil cuando un dispositivo de procesamiento solicita datos más rápidamente de lo que un único dispositivo de almacenamiento puede proporcionarlos. Al distribuir segmentos en múltiples dispositivos a los que se puede acceder simultáneamente, se aumenta el rendimiento total de datos. También es un método útil para equilibrar la carga de E/S en una serie de discos. La creación de bandas se utiliza en unidades de disco en almacenamiento de matriz redundante de discos independientes (RAID), controladores de interfaz de red , matrices de discos, diferentes computadoras en sistemas de archivos agrupados y almacenamiento orientado a cuadrícula , y RAM en algunos sistemas.

Método

Un método de creación de bandas se realiza entrelazando segmentos secuenciales en dispositivos de almacenamiento en forma circular desde el comienzo de la secuencia de datos. Esto funciona bien para la transmisión de datos, pero los accesos aleatorios posteriores requerirán saber qué dispositivo contiene los datos. Si los datos se almacenan de manera que a la dirección física de cada segmento de datos se le asigne una asignación uno a uno a un dispositivo en particular, el dispositivo para acceder a cada segmento solicitado se puede calcular a partir de la dirección sin conocer el desplazamiento de los datos dentro del secuencia completa.

Se podrían emplear otros métodos en los que los segmentos secuenciales no se almacenen en dispositivos secuenciales. Este entrelazado no secuencial puede resultar beneficioso en algunos esquemas de corrección de errores .

Ventajas y desventajas

Las ventajas de la creación de bandas incluyen el rendimiento y el rendimiento. El entrelazado de tiempo secuencial de los accesos a datos permite que el menor rendimiento de acceso a datos de cada dispositivo de almacenamiento se multiplique acumulativamente por el número de dispositivos de almacenamiento empleados. Un mayor rendimiento permite que el dispositivo de procesamiento de datos continúe su trabajo sin interrupción y, por lo tanto, finalice sus procedimientos más rápidamente. Esto se manifiesta en un mejor rendimiento del procesamiento de datos.

Debido a que diferentes segmentos de datos se guardan en diferentes dispositivos de almacenamiento, la falla de un dispositivo provoca la corrupción de toda la secuencia de datos. En efecto, la tasa de falla del conjunto de dispositivos de almacenamiento es igual a la suma de la tasa de falla de cada dispositivo de almacenamiento. Esta desventaja de la creación de bandas se puede superar mediante el almacenamiento de información redundante, como la paridad , con el fin de corregir errores. En un sistema de este tipo, la desventaja se supera a costa de requerir almacenamiento adicional.

Terminología

Los segmentos de datos secuenciales escritos o leídos desde un disco antes de que la operación continúe en el siguiente disco generalmente se denominan fragmentos , avances o unidades de franjas , mientras que sus grupos lógicos que forman operaciones de franjas únicas se denominan tiras o franjas . La cantidad de datos en un fragmento (unidad de franja), a menudo denominada en bytes, se conoce como tamaño del fragmento , tamaño de zancada , tamaño de franja , profundidad de franja o longitud de franja . La cantidad de discos de datos en la matriz a veces se denomina ancho de franja , pero también puede referirse a la cantidad de datos dentro de una franja. [1] [2] [3] [4]

La cantidad de datos en una zancada multiplicada por el número de discos de datos en la matriz (es decir, la profundidad de la franja por el ancho de la franja , que en la analogía geométrica produciría un área) a veces se denomina tamaño de la franja o ancho de la franja . [5] La división amplia ocurre cuando fragmentos de datos se distribuyen en múltiples matrices, posiblemente en todas las unidades del sistema. La creación de bandas estrechas se produce cuando los fragmentos de datos se distribuyen entre las unidades en una sola matriz.

Aplicaciones

La división de datos se utiliza en algunas bases de datos , como Sybase , y en ciertos dispositivos RAID bajo control de software o hardware, como el subsistema 9394 RAMAC Array de IBM . Los sistemas de archivos de clústeres también utilizan bandas. Oracle Automatic Storage Management permite que los archivos ASM tengan rayas gruesas o finas.

REDADA
En algunas configuraciones RAID, como RAID 0 , la falla de una unidad de un solo miembro de la matriz RAID provoca que se pierdan todos los datos almacenados. En otras configuraciones RAID, como RAID 5 que contiene paridad distribuida y proporciona redundancia , si una unidad miembro falla, los datos se pueden restaurar utilizando las otras unidades de la matriz.
LVM2
La división de datos también se puede lograr con Logical Volume Management (LVM) de Linux. El sistema LVM permite ajustar el grosor del patrón de trazado. Las herramientas LVM permitirán la implementación de segmentación de datos junto con la duplicación . LVM ofrece el beneficio adicional de almacenamiento en caché de lectura y escritura en NVM Express para un almacenamiento de rotación lenta. LVM tiene otras ventajas que no están directamente relacionadas con la división de datos (como instantáneas, cambio de tamaño dinámico, etc.).
Btrfs y ZFS
Tenga características similares a RAID pero con la seguridad de la integridad de los fragmentos para detectar bloques defectuosos y la flexibilidad adicional de agregar números arbitrarios de unidades adicionales. También tienen otras ventajas que no están directamente relacionadas con la división de datos (copia sobre escritura, etc.).

Ver también

Referencias

  1. ^ "Guía de administración de almacenamiento de Red Hat Enterprise Linux 6, capítulo 6. El sistema de archivos ext4". Sombrero rojo . 9 de octubre de 2014 . Consultado el 8 de febrero de 2015 .
  2. ^ "mdadm(8) - página de manual de Linux". linux.die.net . Consultado el 8 de febrero de 2015 .
  3. ^ "Documentación del kernel de Linux: configuración RAID". kernel.org . 11 de noviembre de 2014 . Consultado el 8 de febrero de 2015 .
  4. ^ "Tamaño del fragmento RAID" (PDF) . xyratex.com . Enero de 2008. págs. 6–7. Archivado desde el original (PDF) el 1 de agosto de 2014 . Consultado el 8 de febrero de 2015 .
  5. ^ "La profundidad de la franja es el tamaño de la franja, a veces llamada unidad de franja. El ancho de la franja es el producto de la profundidad de la franja y el número de unidades en el conjunto de franjas".