Sistema de archivos con registro en diario

Un sistema de archivos con registro es un sistema de archivos que lleva un registro de los cambios que aún no se han confirmado en la parte principal del sistema de archivos , registrando el objetivo de dichos cambios en una estructura de datos conocida como " diario ", que suele ser un registro circular . En caso de que se produzca una caída del sistema o un corte de energía, dichos sistemas de archivos pueden volver a estar en línea más rápidamente y con una menor probabilidad de que se corrompan . ^[1]^[2]

Dependiendo de la implementación actual, un sistema de archivos con registro en diario puede solo realizar un seguimiento de los metadatos almacenados, lo que resulta en un mejor rendimiento a expensas de una mayor posibilidad de corrupción de datos. Alternativamente, un sistema de archivos con registro en diario puede realizar un seguimiento tanto de los datos almacenados como de los metadatos relacionados, mientras que algunas implementaciones permiten un comportamiento seleccionable a este respecto. ^[3]

Historia

En 1990, IBM introdujo JFS en AIX 3.1 como uno de los primeros sistemas de archivos comerciales de UNIX que implementó el registro en diario. ^[4] Al año siguiente, la idea se popularizó en un artículo ampliamente citado sobre sistemas de archivos estructurados en registros. ^[5] Esto se implementó posteriormente en el sistema de archivos NTFS de Windows NT de Microsoft en 1993, en el sistema de archivos HFS Plus de Apple en 1998 y en el sistema de archivos ext3 de Linux en 2001. ^[6]

Razón fundamental

La actualización de los sistemas de archivos para reflejar los cambios en los archivos y directorios suele requerir muchas operaciones de escritura independientes. Esto hace posible que una interrupción (como un corte de energía o un fallo del sistema ) entre escrituras deje las estructuras de datos en un estado intermedio no válido. ^[1]

Por ejemplo, eliminar un archivo en un sistema de archivos Unix implica tres pasos: ^[7]

Eliminar su entrada de directorio.
Liberar el inodo al grupo de inodos libres.
Devolver todos los bloques de disco al grupo de bloques de disco libres.

Si se produce un fallo después del paso 1 y antes del paso 2, habrá un inodo huérfano y, por lo tanto, una fuga de almacenamiento ; si se produce un fallo entre los pasos 2 y 3, los bloques utilizados anteriormente por el archivo no se pueden utilizar para nuevos archivos, lo que reduce efectivamente la capacidad de almacenamiento del sistema de archivos. Reorganizar los pasos tampoco ayuda. Si el paso 3 precedió al paso 1, un fallo entre ellos podría permitir que los bloques del archivo se reutilizaran para un nuevo archivo, lo que significa que el archivo parcialmente eliminado contendría parte del contenido de otro archivo y las modificaciones a cualquiera de los archivos aparecerían en ambos. Por otro lado, si el paso 2 precedió al paso 1, un fallo entre ellos haría que el archivo fuera inaccesible, a pesar de parecer existir.

Para detectar y recuperarse de estas inconsistencias, normalmente es necesario recorrer por completo las estructuras de datos, por ejemplo, con una herramienta como fsck (el verificador del sistema de archivos). ^[2] Esto se debe hacer normalmente antes de montar el sistema de archivos para el acceso de lectura y escritura. Si el sistema de archivos es grande y hay relativamente poco ancho de banda de E/S, esto puede llevar mucho tiempo y provocar tiempos de inactividad más prolongados si impide que el resto del sistema vuelva a estar en línea.

Para evitarlo, un sistema de archivos con registro asigna un área especial (el registro) en la que registra los cambios que realizará con antelación. Después de una falla, la recuperación simplemente implica leer el registro del sistema de archivos y reproducir los cambios desde este registro hasta que el sistema de archivos vuelva a ser consistente. Por lo tanto, se dice que los cambios son atómicos (no divisibles) en el sentido de que o bien se realizan correctamente (se realizaron correctamente originalmente o se reproducen completamente durante la recuperación) o bien no se reproducen en absoluto (se omiten porque aún no se habían escrito completamente en el registro antes de que ocurriera la falla).

Técnicas

Algunos sistemas de archivos permiten que el diario crezca, se reduzca y se reasigne como un archivo normal, mientras que otros colocan el diario en un área contigua o en un archivo oculto que se garantiza que no se moverá ni cambiará de tamaño mientras el sistema de archivos esté montado. Algunos sistemas de archivos también pueden permitir diarios externos en un dispositivo independiente, como una unidad de estado sólido o una RAM no volátil respaldada por batería. Los cambios en el diario pueden registrarse para obtener redundancia adicional, o el diario puede distribuirse en varios volúmenes físicos para protegerse contra fallas del dispositivo.

El formato interno del diario debe protegerse contra fallas mientras se escribe en el diario. Muchas implementaciones de diario (como la capa JBD2 en ext4 ) incluyen cada cambio registrado con una suma de comprobación, entendiendo que una falla dejaría un cambio escrito parcialmente con una suma de comprobación faltante (o no coincidente) que simplemente se puede ignorar al reproducir el diario en el próximo montaje.

Revistas físicas

Un diario físico registra una copia anticipada de cada bloque que luego se escribirá en el sistema de archivos principal. Si se produce una falla cuando se está escribiendo en el sistema de archivos principal, la escritura se puede reproducir hasta completarse la próxima vez que se monte el sistema de archivos. Si se produce una falla cuando se está registrando la escritura en el diario, la escritura parcial tendrá una suma de comprobación faltante o no coincidente y se puede ignorar en el próximo montaje.

Los diarios físicos imponen una importante penalización de rendimiento porque cada bloque modificado debe ser enviado dos veces al almacenamiento, pero pueden ser aceptables cuando se requiere protección absoluta contra fallas. ^[8]

Revistas lógicas

Un diario lógico almacena solo los cambios en los metadatos de los archivos en el diario y sacrifica la tolerancia a fallas por un rendimiento de escritura sustancialmente mejor. ^[9] Un sistema de archivos con un diario lógico aún se recupera rápidamente después de una falla, pero puede permitir que los datos de archivos no registrados y los metadatos registrados se desincronizan entre sí, lo que causa corrupción de datos.

Por ejemplo, agregar algo a un archivo puede implicar tres escrituras independientes en:

El inodo del archivo , para indicar en los metadatos del archivo que su tamaño ha aumentado.
El mapa de espacio libre, para marcar una asignación de espacio para los datos que se agregarán.
El espacio recién asignado, para escribir realmente los datos adjuntos.

En un diario que solo contenga metadatos, no se registraría el paso 3. Si no se realizó el paso 3, pero se repiten los pasos 1 y 2 durante la recuperación, se agregará basura al archivo.

Peligros de escritura

La caché de escritura en la mayoría de los sistemas operativos ordena sus escrituras (usando el algoritmo del elevador o algún esquema similar) para maximizar el rendimiento. Para evitar un riesgo de escritura fuera de orden con un diario de solo metadatos, las escrituras de datos de archivo deben ordenarse de modo que se asignen al almacenamiento antes que sus metadatos asociados. Esto puede ser complicado de implementar porque requiere coordinación dentro del núcleo del sistema operativo entre el controlador del sistema de archivos y la caché de escritura. Un riesgo de escritura fuera de orden también puede ocurrir si un dispositivo no puede escribir bloques inmediatamente en su almacenamiento subyacente, es decir, no puede vaciar su caché de escritura en el disco debido a que la escritura diferida está habilitada.

Para complicar las cosas, muchos dispositivos de almacenamiento masivo tienen sus propios cachés de escritura, en los que pueden reordenar agresivamente las escrituras para un mejor rendimiento. (Esto es particularmente común en los discos duros magnéticos, que tienen grandes latencias de búsqueda que se pueden minimizar con la ordenación por elevador). Algunos sistemas de archivos con registro en diario asumen de manera conservadora que dicha reordenación de escritura siempre tiene lugar y sacrifican el rendimiento por la corrección al obligar al dispositivo a vaciar su caché en ciertos puntos del registro (llamados barreras en ext3 y ext4 ). ^[10]

Alternativas

Actualizaciones suaves

Algunas implementaciones de UFS evitan el registro y, en su lugar, implementan actualizaciones suaves : ordenan sus escrituras de tal manera que el sistema de archivos en el disco nunca sea inconsistente, o que la única inconsistencia que se pueda crear en caso de una falla sea una pérdida de almacenamiento. Para recuperarse de estas pérdidas, el mapa de espacio libre se concilia con un recorrido completo del sistema de archivos en el siguiente montaje. Esta recolección de basura generalmente se realiza en segundo plano. ^[11]

Sistemas de archivos estructurados en registros

En los sistemas de archivos estructurados en registros , la penalización por escritura doble no se aplica porque el diario en sí es el sistema de archivos: ocupa todo el dispositivo de almacenamiento y está estructurado de modo que se puede recorrer como lo haría un sistema de archivos normal.

Sistemas de archivos de copia y escritura

Los sistemas de archivos con copia en escritura completa (como ZFS y Btrfs ) evitan los cambios en el lugar de los datos de los archivos al escribir los datos en bloques recién asignados, seguidos de metadatos actualizados que apuntarían a los nuevos datos y rechazarían los antiguos, seguidos de metadatos que apuntarían a estos, y así sucesivamente hasta el superbloque o la raíz de la jerarquía del sistema de archivos. Esto tiene las mismas propiedades de conservación de la corrección que un diario, sin la sobrecarga de la doble escritura.

Véase también

ÁCIDO
Comparación de sistemas de archivos
Base de datos
Registro de intenciones
Sistema de archivos con registro (JFS) : un sistema de archivos creado por IBM
Procesamiento de transacciones
Versiones del sistema de archivos

Referencias

^ ab Jones, M Tim (4 de junio de 2008), Anatomía de los sistemas de archivos de registro en diario de Linux, IBM DeveloperWorks, archivado desde el original el 21 de febrero de 2009 , consultado el 13 de abril de 2009
^ ab Arpaci-Dusseau, Remzi H.; Arpaci-Dusseau, Andrea C. (21 de enero de 2014), Crash Consistency: FSCK and Journaling (PDF) , Arpaci-Dusseau Books, archivado (PDF) del original el 24 de enero de 2014 , consultado el 22 de enero de 2014
^ "tune2fs(8) – Página del manual de Linux". linux.die.net . Archivado desde el original el 25 de febrero de 2015 . Consultado el 20 de febrero de 2015 .
^ Chang, A.; Mergen, MF; Rader, RK; Roberts, JA; Porter, SL (enero de 1990), "Evolución de las funciones de almacenamiento en AIX versión 3 para procesadores RISC System/6000" (PDF) , IBM Journal of Research and Development , 34:1 : 105–109, doi :10.1147/rd.341.0105
^ Rosembaum, Mendel; Ousterhout, John (febrero de 1991). El diseño y la implementación de un sistema de archivos con estructura de registro (PDF) . 13.º Simposio anual de la ACM sobre principios de sistemas operativos.
^ "'2.4.15-final' - MARC". marc.info . Consultado el 24 de marzo de 2018 .
^ Sistemas de archivos de Tanenbaum, AS (2008). Sistemas operativos modernos (3.ª ed., págs. 287). Upper Saddle River, NJ: Prentice Hall.
^ Tweedie, Stephen (2000), "Ext3, sistema de archivos con registro en diario", Actas del Simposio de Linux de Ottawa : 24-29
^ Prabhakaran, Vijayan; Arpaci-Dusseau, Andrea C; Arpaci-Dusseau, Remzi H, "Análisis y evolución de los sistemas de archivos con registro en diario" (PDF) , Conferencia técnica anual de USENIX de 2005 , Asociación USENIX, archivado (PDF) del original el 26 de septiembre de 2007 , consultado el 27 de julio de 2007.
^ Corbet, Jonathan (21 de mayo de 2008), Barreras y sistemas de archivos de registro, archivado desde el original el 14 de marzo de 2010 , consultado el 6 de marzo de 2010
^ Seltzer, Margo I; Ganger, Gregory R; McKusick, M Kirk, "Journaling Versus Soft Updates: Asynchronous Meta-data Protection in File Systems", Conferencia técnica anual USENIX de 2000 , Asociación USENIX, archivado desde el original el 26 de octubre de 2007 , consultado el 27 de julio de 2007.