En el almacenamiento de datos informáticos , la segmentación de datos es la técnica de segmentar datos secuenciales de forma lógica, como un archivo, de modo que los segmentos consecutivos se almacenen en diferentes dispositivos de almacenamiento físico.
La segmentación es útil cuando un dispositivo de procesamiento solicita datos con mayor rapidez que la que puede proporcionar un único dispositivo de almacenamiento. Al distribuir segmentos entre varios dispositivos a los que se puede acceder simultáneamente, se aumenta el rendimiento total de los datos. También es un método útil para equilibrar la carga de E/S en una matriz de discos. La segmentación se utiliza en unidades de disco en el almacenamiento de matriz redundante de discos independientes (RAID), controladores de interfaz de red , matrices de discos, diferentes computadoras en sistemas de archivos en clúster y almacenamiento orientado a cuadrículas , y RAM en algunos sistemas.
Un método de segmentación se realiza intercalando segmentos secuenciales en dispositivos de almacenamiento de forma rotatoria desde el comienzo de la secuencia de datos. Esto funciona bien para la transmisión de datos, pero los accesos aleatorios posteriores requerirán saber qué dispositivo contiene los datos. Si los datos se almacenan de forma que la dirección física de cada segmento de datos se asigna a un dispositivo en particular, el dispositivo que accede a cada segmento solicitado se puede calcular a partir de la dirección sin conocer el desplazamiento de los datos dentro de la secuencia completa.
Se podrían emplear otros métodos en los que los segmentos secuenciales no se almacenen en dispositivos secuenciales. Este entrelazado no secuencial puede tener ventajas en algunos esquemas de corrección de errores .
Las ventajas de la segmentación incluyen el rendimiento y el rendimiento. El intercalado secuencial de accesos a los datos en el tiempo permite que el menor rendimiento de acceso a los datos de cada dispositivo de almacenamiento se multiplique de forma acumulativa por la cantidad de dispositivos de almacenamiento empleados. El aumento del rendimiento permite que el dispositivo de procesamiento de datos continúe su trabajo sin interrupciones y, por lo tanto, finalice sus procedimientos más rápidamente. Esto se manifiesta en un mejor rendimiento del procesamiento de datos.
Debido a que los distintos segmentos de datos se guardan en distintos dispositivos de almacenamiento, la falla de un dispositivo provoca la corrupción de la secuencia completa de datos. En efecto, la tasa de fallas de la matriz de dispositivos de almacenamiento es igual a la suma de la tasa de fallas de cada dispositivo de almacenamiento. Esta desventaja de la segmentación se puede superar mediante el almacenamiento de información redundante, como la paridad , con el fin de corregir errores. En un sistema de este tipo, la desventaja se supera a costa de requerir almacenamiento adicional.
Los segmentos de datos secuenciales escritos o leídos en un disco antes de que la operación continúe en el siguiente disco se denominan generalmente fragmentos , pasos o unidades de franja , mientras que sus grupos lógicos que forman operaciones de franja única se denominan franjas o rayas . La cantidad de datos en un fragmento (unidad de franja), a menudo denominada en bytes, se conoce de diversas formas como tamaño del fragmento , tamaño del paso , tamaño de franja , profundidad de franja o longitud de franja . El número de discos de datos en la matriz a veces se denomina ancho de franja , pero también puede referirse a la cantidad de datos dentro de una franja. [1] [2] [3] [4]
La cantidad de datos en un paso multiplicada por la cantidad de discos de datos en la matriz (es decir, la profundidad de la franja por el ancho de la franja , que en la analogía geométrica daría como resultado un área) a veces se denomina tamaño de la franja o ancho de la franja . [5] La formación de franjas anchas se produce cuando fragmentos de datos se distribuyen en varias matrices, posiblemente todas las unidades del sistema. La formación de franjas estrechas se produce cuando los fragmentos de datos se distribuyen en las unidades de una sola matriz.
La segmentación de datos se utiliza en algunas bases de datos , como Sybase , y en ciertos dispositivos RAID bajo control de software o hardware, como el subsistema de matriz RAMAC 9394 de IBM . Los sistemas de archivos de clústeres también utilizan la segmentación. Oracle Automatic Storage Management permite que los archivos ASM tengan una segmentación gruesa o fina.