stringtranslate.com

Sistema de archivos orientado a registros

En informática , un sistema de archivos orientado a registros es un sistema de archivos donde los datos se almacenan como colecciones de registros . Esto contrasta con un sistema de archivos orientado a bytes, donde los datos se tratan como un flujo de bytes sin formato . Hay varios formatos de registro posibles diferentes; Los detalles varían según el sistema en particular. En general los formatos pueden ser de longitud fija o variable, con diferentes organizaciones físicas o mecanismos de relleno; Los metadatos pueden asociarse con los registros del archivo para definir la longitud del registro, o los datos pueden ser parte del registro. Se pueden proporcionar diferentes métodos de acceso a los registros, por ejemplo, los registros se pueden recuperar en orden secuencial , por clave o por número de registro.

Origen y características

Los sistemas de archivos orientados a registros se asocian frecuentemente con sistemas operativos de mainframe, como OS/360 y sucesores [1] y DOS/360 y sucesores , y sistemas operativos de rango medio, como RSX-11 y VMS . Sin embargo, se originaron antes en software como el Sistema de control de entrada/salida (IOCS). [2] Los registros, a veces llamados registros lógicos, a menudo se escriben juntos en bloques, a veces llamados registros físicos; esta es la norma para dispositivos de acceso directo y de cinta, pero los archivos en dispositivos de registro unitarios normalmente están desbloqueados, es decir, sólo hay un registro por bloque.

Los sistemas de archivos orientados a registros pueden ser compatibles con medios distintos a los dispositivos de acceso directo. Una baraja de tarjetas perforadas puede considerarse un archivo orientado a registros. Una cinta magnética es un ejemplo de medio que puede soportar registros de longitud uniforme o variable.

En un sistema de archivos de registros, un programador diseña los registros que pueden usarse en un archivo. Todos los programas de aplicación que acceden al archivo, ya sea agregando, leyendo o actualizando registros, comparten una comprensión del diseño de los registros. En DOS/360, OS/360 y sus sucesores no hay restricción en los patrones de bits que componen el registro de datos, es decir, no hay ningún carácter delimitador; esto no siempre es cierto en otro software, por ejemplo, ciertos tipos de registros para el procesador de control de archivos RCA (FCP) en los modelos 301, 501, 601 y 3301.

El archivo comienza a existir cuando se envía una solicitud de creación de archivo al sistema de archivos. Es posible que se incluya cierta información sobre el archivo con la solicitud de creación. Esta información puede especificar que el archivo tiene registros de longitud fija (todos los registros tienen el mismo tamaño) junto con el tamaño de los registros. Alternativamente, la especificación puede indicar que los registros tienen una longitud variable, junto con la longitud máxima del registro. Se puede especificar información adicional, incluido el factor de bloqueo, binario versus texto y el número máximo de registros.

Podrá permitirse leer sólo el comienzo de un registro; la siguiente lectura secuencial devuelve la siguiente colección de datos (registro) que el escritor pretendía agrupar. También se podrá permitir escribir sólo el comienzo de un registro. En estos casos, el registro se rellena con ceros binarios o con espacios, dependiendo de si el archivo se reconoce como un archivo binario o un archivo de texto.

Algunos sistemas operativos requieren que se incluyan en el programa rutinas de biblioteca específicas para el formato de registro. Esto significa que un programa que originalmente se esperaba que leyera un archivo de registro de longitud variable no puede leer un archivo de longitud fija. Estos sistemas operativos deben proporcionar utilidades de sistema de archivos para convertir archivos entre un formato y otro. Esto significa que puede ser necesario copiar el archivo (lo que requiere espacio de almacenamiento, tiempo y coordinación adicionales).

Otros sistemas operativos incluyen varias rutinas y asocian la rutina adecuada, según la organización de los archivos, en el momento de la ejecución.

En cualquier caso, se deben proporcionar cantidades significativas de código para administrar registros en rutinas protegidas para garantizar la integridad del archivo.

Una alternativa a un archivo orientado a registros es un archivo continuo, en el que el sistema de archivos trata un archivo como una secuencia no estructurada de bytes. Las solicitudes pueden imponer, aunque no es necesario, una estructura de registro. Este enfoque reduce significativamente el tamaño y la complejidad de la biblioteca y reduce la cantidad de utilidades necesarias para mantener los archivos.

Una convención de aplicación común para archivos de texto representados como secuencias es utilizar un delimitador de nueva línea para separar o terminar registros, comúnmente CR , CRLF o LF. Desafortunadamente, el tiempo de CPU requerido para analizar el delimitador de registros es significativo y la exclusión del patrón delimitador de registros de los datos frecuentemente no es deseable.

Una convención alternativa es incluir un campo de longitud en cada registro. La aplicación de escritura es responsable de imponer cualquier estructura de registro y la aplicación de lectura es responsable de separar los registros.

Ventajas y costos

Un archivo orientado a registros tiene varias ventajas. Después de que un programa escribe una colección de datos como un registro, el programa que lee ese registro entiende esos datos como una colección. A menudo un archivo contendrá varios registros relacionados en secuencia; después de que el programa lee el comienzo de la secuencia, la siguiente lectura secuencial devuelve la siguiente colección de datos (registro) que el escritor pretendía agrupar. Otra ventaja es que el registro tiene una longitud y normalmente no hay restricción sobre los patrones de bits que componen el registro de datos, es decir, no hay ningún carácter delimitador.

Generalmente hay un costo asociado con los archivos orientados a registros. Para registros de longitud fija, algunos registros pueden tener espacio no utilizado, mientras que para registros de longitud variable el campo delimitador o de longitud ocupa espacio. Los bloques de longitud variable pueden tener una sobrecarga debido a delimitadores o campos de longitud. Además, el dispositivo impone una sobrecarga. En una cinta magnética, la sobrecarga suele tener la forma de un espacio entre registros. En un dispositivo de acceso directo con sectores de longitud fija, puede haber espacio no utilizado en el último sector de un bloque. En un dispositivo de acceso directo con registros físicos de longitud variable, esa sobrecarga generalmente toma la forma de metadatos y espacios entre registros.

En un archivo compuesto por registros de longitud variable, se define una longitud máxima de registro para determinar el tamaño de los metadatos de longitud asociados con cada registro.

Una ventaja importante de los sistemas de archivos orientados a registros es que abstraen archivos guardados en papel en épocas anteriores. Un registro puede contener datos asociados con un particular, por ejemplo, edificio, contacto, empleado, parte, lugar.

Un segundo motivador de la idea de la orientación de registros es que, en cierto sentido, es la orientación más natural para el almacenamiento persistente en un dispositivo de almacenamiento físico no volátil pero lento. La mayoría de los dispositivos de almacenamiento físico sólo pueden comunicarse en unidades de un bloque. Porciones importantes de los núcleos de los sistemas operativos modernos y los controladores de dispositivos asociados se dedican a ocultar la naturaleza naturalmente estructurada y delimitada (y en cierto sentido un bloque es sólo un registro físico) de los dispositivos de almacenamiento físico. No es coincidencia que los sistemas de archivos orientados a registros surgieran antes en la historia de la informática que los sistemas de archivos orientados a flujos de bytes, cuando las capacidades de abstracción eran mucho menores.

Ver también

Referencias

  1. ^ z/OS DFSMS utilizando conjuntos de datos versión 2 versión 3 (PDF) , 2 de octubre de 2018, SC23-6855-30
  2. ^ Manual de referencia, sistema de control de entrada/salida IBM 709/7090 (PDF) . IBM . pag. 3. C28-6100-2 . Consultado el 12 de septiembre de 2020 .