En el almacenamiento en disco de una computadora , un sector es una subdivisión de una pista en un disco magnético o un disco óptico . Para la mayoría de los discos, cada sector almacena una cantidad fija de datos accesibles para el usuario, tradicionalmente 512 bytes para unidades de disco duro (HDD) y 2048 bytes para CD-ROM , DVD-ROM y BD-ROM . [1] Los HDD y SSD más nuevos utilizan sectores de 4096 bytes (4 KiB ), que se conocen como Formato avanzado (AF).
El sector es la unidad mínima de almacenamiento de un disco duro. [2] La mayoría de los esquemas de particionamiento de discos están diseñados para que los archivos ocupen un número entero de sectores independientemente del tamaño real del archivo. Los archivos que no llenan un sector completo tendrán el resto de su último sector lleno de ceros. En la práctica, los sistemas operativos normalmente operan en bloques de datos , que pueden abarcar varios sectores. [3]
Geométricamente, la palabra sector significa una porción de un disco entre un centro, dos radios y un arco correspondiente (ver Figura 1, punto B), que tiene forma de rebanada de pastel. Así, el sector del disco (Figura 1, punto C) se refiere a la intersección de una pista y un sector geométrico .
En las unidades de disco modernas, cada sector físico se compone de dos partes básicas: el área de encabezado del sector (normalmente denominada "ID") y el área de datos. El encabezado del sector contiene información utilizada por la unidad y el controlador; esta información incluye bytes de sincronización, identificación de dirección , indicador de falla e información de detección y corrección de errores. El encabezado también puede incluir una dirección alternativa que se utilizará si el área de datos no es confiable. La identificación de dirección se utiliza para garantizar que los mecanismos de la unidad hayan colocado el cabezal de lectura/escritura en la ubicación correcta. El área de datos contiene los bytes de sincronización, los datos del usuario y un código de corrección de errores (ECC) que se utiliza para verificar y posiblemente corregir errores que puedan haberse introducido en los datos.
La primera unidad de disco, la IBM 350 de 1957 , tenía diez sectores de 100 caracteres por pista; cada carácter tenía seis bits e incluía un bit de paridad. La cantidad de sectores por pista era idéntica en todas las superficies de grabación. No había ningún campo de identificación (ID) registrado asociado con cada sector. [4]
El almacenamiento en disco IBM 1301 de 1961 introdujo sectores de longitud variable, [ disputado (porque: la literatura no utiliza el término sector para bloques de longitud variable) – discutir ] denominados registros o registros físicos por IBM, y agregó a cada registro un campo de dirección de registro separado de los datos en un registro. [5] [6] Todas las unidades de disco modernas tienen campos de dirección de sector, llamados campos de ID, separados de los datos en un sector.
También en 1961, Bryant con su serie 4000 introdujo el concepto de grabación por zonas (ZBR), que permitía que el número de sectores por pista variara en función del diámetro de la pista (hay más sectores en una pista exterior que en una pista interior). [7] A finales de los años 1980, la grabación por zonas se volvió a utilizar en las unidades de disco anunciadas por Imprimis y Quantum [8] y en 1997 su uso en la industria era omnipresente. [9]
Las unidades de disco y otros DASD anunciados con el IBM System/360 en 1964 usaban sectores de longitud variable con formato automático, [ disputado (porque: la literatura no usa el término sector para bloques de longitud variable) – discutir ] denominados registros o registros físicos por IBM. Detectaban errores en todos los campos de sus registros con una verificación de redundancia cíclica (CRC) que reemplazaba la detección de paridad por carácter de generaciones anteriores. Estos registros físicos de IBM tienen tres partes básicas, un campo de recuento que actúa como un campo de identificación, un campo de clave opcional para ayudar en la búsqueda de datos y un campo de datos; en la práctica, la mayoría de los registros no tenían un campo de clave, indicado por una longitud de clave de cero. La estructura de estos tres campos se llama formato de pista CKD para un registro.
El almacenamiento en disco IBM 3330 de 1970 reemplazó el CRC en el campo de datos de cada registro con un código de corrección de errores (ECC) para mejorar la integridad de los datos al detectar la mayoría de los errores y permitir la corrección de muchos errores. [10] En última instancia, todos los campos de los sectores del disco tenían ECC.
Antes de la década de 1980, había poca estandarización de los tamaños de los sectores; las unidades de disco tenían un número máximo de bits por pista y varios fabricantes de sistemas subdividían la pista en diferentes tamaños de sector para adaptarse a sus sistemas operativos y aplicaciones. La popularidad de la PC a principios de la década de 1980 y la llegada de la interfaz IDE a fines de esa década llevaron a que un sector de 512 bytes se convirtiera en un tamaño de sector estándar de la industria para los discos duros y dispositivos de almacenamiento similares. [11] [ verificación fallida ]
En la década de 1970, IBM agregó dispositivos de almacenamiento de acceso directo con arquitectura de bloque fijo (FBA DASD) a su línea de CKD DASD. CKD DASD admitía múltiples sectores de longitud variable, mientras que IBM FBA DASD admitía tamaños de sector de 512, 1024, 2048 o 4096 bytes.
En 2000, la organización comercial de la industria, International Disk Drive Equipment and Materials Association ( IDEMA ) comenzó a trabajar para definir la implementación y los estándares que regirían los formatos de tamaño de sector que excedieran los 512 bytes para acomodar futuros aumentos en las capacidades de almacenamiento de datos. [11] A fines de 2007, en previsión de un futuro estándar IDEMA, Samsung y Toshiba comenzaron los envíos de unidades de disco duro de 1,8 pulgadas con sectores de 4096 bytes. En 2010, IDEMA completó el estándar de formato avanzado para unidades de 4096 sectores, [11] estableciendo la fecha para la transición de sectores de 512 a 4096 bytes como enero de 2011 para todos los fabricantes, [12] y las unidades de formato avanzado pronto se volvieron predominantes.
Mientras que sector significa específicamente el área física del disco, el término bloque se ha utilizado de manera imprecisa para referirse a un pequeño fragmento de datos. Bloque tiene múltiples significados según el contexto. En el contexto del almacenamiento de datos, un bloque del sistema de archivos es una abstracción sobre sectores del disco que posiblemente abarque múltiples sectores. En otros contextos, puede ser una unidad de un flujo de datos o una unidad de operación para una utilidad. [13] Por ejemplo, el programa Unix dd permite establecer el tamaño del bloque que se utilizará durante la ejecución con el parámetro . Esto especifica el tamaño de los fragmentos de datos tal como los entrega dd, y no está relacionado con sectores o bloques del sistema de archivos. bs=bytes
En Linux, el tamaño del sector del disco se puede determinar con sudo fdisk -l | grep "Sector size"
y el tamaño del bloque se puede determinar con sudo blockdev --getbsz /dev/sda
. [14]
En los sistemas de archivos de las computadoras , un clúster (a veces también llamado unidad de asignación o bloque ) es una unidad de asignación de espacio en disco para archivos y directorios. Para reducir la sobrecarga de la administración de las estructuras de datos en disco, el sistema de archivos no asigna sectores de disco individuales de manera predeterminada, sino grupos contiguos de sectores, llamados clústeres.
En un disco que utiliza sectores de 512 bytes, un clúster de 512 bytes contiene un sector, mientras que un clúster de 4 kibibytes ( KiB ) contiene ocho sectores.
Un clúster es la cantidad lógica más pequeña de espacio en disco que se puede asignar para almacenar un archivo. Por lo tanto, almacenar archivos pequeños en un sistema de archivos con clústeres grandes desperdiciará espacio en disco; este espacio desperdiciado en disco se denomina espacio desperdiciado . Para tamaños de clúster que son pequeños en comparación con el tamaño de archivo promedio, el espacio desperdiciado por archivo será estadísticamente aproximadamente la mitad del tamaño del clúster; para tamaños de clúster grandes, el espacio desperdiciado será mayor. Sin embargo, un tamaño de clúster más grande reduce la sobrecarga de contabilidad y la fragmentación, lo que puede mejorar la velocidad de lectura y escritura en general. Los tamaños de clúster típicos varían de 1 sector (512 B) a 128 sectores (64 KiB ).
Un clúster no necesita ser físicamente contiguo en el disco; puede abarcar más de una pista o, si se utiliza intercalación de sectores , incluso puede ser discontinuo dentro de una pista. Esto no debe confundirse con la fragmentación , ya que los sectores siguen siendo lógicamente contiguos.
Se produce un "clúster perdido" cuando se elimina un archivo de la lista de directorios, pero la tabla de asignación de archivos (FAT) aún muestra los clústeres asignados al archivo. [15]
El término cluster se cambió a unidad de asignación en DOS 4.0. Sin embargo, el término cluster todavía se usa ampliamente. [16]
Si un sector se define como la intersección entre un radio y una pista, como era el caso de los primeros discos duros y la mayoría de los disquetes, los sectores hacia el exterior del disco son físicamente más largos que los que están más cerca del eje. Debido a que cada sector todavía contiene el mismo número de bytes, los sectores externos tienen una densidad de bits menor que los internos, lo que es un uso ineficiente de la superficie magnética. La solución es la grabación de bits por zonas, en la que el disco se divide en zonas, cada una de las cuales abarca un pequeño número de pistas contiguas. Cada zona se divide luego en sectores de modo que cada sector tenga un tamaño físico similar. Debido a que las zonas externas tienen una circunferencia mayor que las zonas internas, se les asignan más sectores. Esto se conoce como grabación de bits por zonas . [17]
Una consecuencia de la grabación de bits de zona es que las lecturas y escrituras contiguas son notablemente más rápidas en las pistas externas (correspondientes a direcciones de bloque inferiores) que en las pistas internas, ya que más bits pasan bajo el cabezal con cada rotación; esta diferencia puede ser del 25% o más.
En 1998, el tamaño tradicional de sector de 512 bytes se identificó como un impedimento para aumentar la capacidad, que en ese momento estaba creciendo a un ritmo que excedía la Ley de Moore . El aumento de la longitud del campo de datos mediante la implementación del Formato avanzado utilizando sectores de 4096 bytes eliminó este impedimento; aumentó la eficiencia del área de superficie de datos entre un cinco y un trece por ciento, al tiempo que aumentó la resistencia del ECC, lo que a su vez permitió una mayor capacidad. El formato fue estandarizado por un consorcio industrial en 2005 y en 2011 se incorporó a todos los productos nuevos de todos los fabricantes de discos duros.