Administrador de bloqueo distribuido

Los sistemas operativos utilizan administradores de bloqueo para organizar y serializar el acceso a los recursos. Un administrador de bloqueo distribuido (DLM) se ejecuta en cada máquina de un clúster, con una copia idéntica de una base de datos de bloqueo de todo el clúster. De esta manera, un DLM proporciona aplicaciones de software que se distribuyen en un clúster en varias máquinas con un medio para sincronizar sus accesos a recursos compartidos .

Los DLM se han utilizado como base para varios sistemas de archivos en clúster exitosos , en los que las máquinas de un clúster pueden utilizar el almacenamiento de cada una a través de un sistema de archivos unificado , con importantes ventajas de rendimiento y disponibilidad . El principal beneficio de rendimiento proviene de la solución del problema de coherencia de la caché de disco entre las computadoras participantes. El DLM se utiliza no sólo para bloquear archivos sino también para coordinar todos los accesos al disco . VMScluster , el primer sistema de agrupación en clústeres de uso generalizado, se basó en OpenVMS DLM precisamente de esta manera.

Recursos

El DLM utiliza un concepto generalizado de recurso , que es alguna entidad a la que se debe controlar el acceso compartido. Esto puede estar relacionado con un archivo, un registro, un área de memoria compartida o cualquier otra cosa que elija el diseñador de la aplicación . Se puede definir una jerarquía de recursos, de modo que se puedan implementar varios niveles de bloqueo. Por ejemplo, una base de datos hipotética podría definir una jerarquía de recursos de la siguiente manera:

Base de datos
Mesa
Registro
Campo

Luego, un proceso puede adquirir bloqueos en la base de datos en su conjunto y luego en partes particulares de la base de datos. Se debe obtener un bloqueo en un recurso principal antes de poder bloquear un recurso subordinado.

Modos de bloqueo

Un proceso que se ejecuta dentro de un VMSCluster puede obtener un bloqueo en un recurso. Hay seis modos de bloqueo que se pueden otorgar y estos determinan el nivel de exclusividad que se otorga; es posible convertir el bloqueo a un nivel superior o inferior de modo de bloqueo. Cuando todos los procesos han desbloqueado un recurso, la información del sistema sobre el recurso se destruye.

Nulo (NL). Indica interés en el recurso, pero no impide que otros procesos lo bloqueen. Tiene la ventaja de que el recurso y su bloque de valor de bloqueo se conservan, incluso cuando ningún proceso lo bloquea.
Lectura simultánea (CR). Indica el deseo de leer (pero no actualizar) el recurso. Permite que otros procesos lean o actualicen el recurso, pero impide que otros tengan acceso exclusivo a él. Esto generalmente se emplea en recursos de alto nivel, para poder obtener bloqueos más restrictivos en recursos subordinados.
Escritura simultánea (CW). Indica un deseo de leer y actualizar el recurso. También permite que otros procesos lean o actualicen el recurso, pero impide que otros tengan acceso exclusivo a él. Esto también suele emplearse en recursos de alto nivel, para poder obtener bloqueos más restrictivos en recursos subordinados.
Lectura protegida (PR). Este es el bloqueo compartido tradicional , que indica un deseo de leer el recurso pero impide que otros lo actualicen. Sin embargo, otros también pueden leer el recurso.
Escritura protegida (PW). Este es el bloqueo de actualización tradicional , que indica el deseo de leer y actualizar el recurso e impide que otros lo actualicen. Sin embargo, otras personas con acceso de lectura simultánea pueden leer el recurso.
Exclusivo (EX). Este es el bloqueo exclusivo tradicional que permite el acceso de lectura y actualización del recurso y evita que otros tengan acceso a él.

La siguiente tabla de verdad muestra la compatibilidad de cada modo de bloqueo con los demás:

Obtener un candado

Un proceso puede obtener un bloqueo en un recurso poniendo en cola una solicitud de bloqueo. Esto es similar a la técnica QIO que se utiliza para realizar E/S. La solicitud de bloqueo en cola puede completarse de forma sincrónica, en cuyo caso el proceso espera hasta que se conceda el bloqueo, o de forma asincrónica, en cuyo caso se produce un AST cuando se obtiene el bloqueo.

También es posible establecer un AST de bloqueo , que se activa cuando un proceso ha obtenido un bloqueo que está impidiendo el acceso al recurso por parte de otro proceso. El proceso original puede entonces, opcionalmente, tomar medidas para permitir el acceso del otro (por ejemplo, degradando o liberando el bloqueo).

Bloquear valor de bloqueo

Un bloque de valor de bloqueo está asociado con cada recurso. Esto puede ser leído por cualquier proceso que haya obtenido un bloqueo en el recurso (que no sea un bloqueo nulo) y puede ser actualizado por un proceso que haya obtenido una actualización protegida o un bloqueo exclusivo en él.

Se puede utilizar para contener cualquier información sobre el recurso que elija el diseñador de la aplicación. Un uso típico es contener un número de versión del recurso. Cada vez que se actualiza la entidad asociada (por ejemplo, un registro de base de datos), el titular del bloqueo incrementa el bloque de valor del bloqueo. Cuando otro proceso desea leer el recurso, obtiene el bloqueo apropiado y compara el valor de bloqueo actual con el valor que tenía la última vez que el proceso bloqueó el recurso. Si el valor es el mismo, el proceso sabe que la entidad asociada no ha sido actualizada desde la última vez que la leyó y por lo tanto no es necesario volver a leerla. Por tanto, esta técnica se puede utilizar para implementar varios tipos de caché en una base de datos o aplicación similar.

Detección de interbloqueo

Cuando uno o más procesos han obtenido bloqueos sobre recursos, es posible producir una situación en la que cada uno impide que otro obtenga un bloqueo y ninguno de ellos puede continuar. Esto se conoce como punto muerto ( EW Dijkstra originalmente lo llamó abrazo mortal ). ^[1]

Un ejemplo simple es cuando el Proceso 1 obtuvo un bloqueo exclusivo en el Recurso A y el Proceso 2 obtuvo un bloqueo exclusivo en el Recurso B. Si el Proceso 1 intenta bloquear el Recurso B, tendrá que esperar a que el Proceso 2 lo libere. Pero si el Proceso 2 intenta bloquear el Recurso A, ambos procesos se esperarán eternamente el uno al otro.

El DLM de OpenVMS comprueba periódicamente si hay situaciones de bloqueo. En el ejemplo anterior, la segunda solicitud de bloqueo en cola de uno de los procesos regresaría con un estado de interbloqueo. Entonces le correspondería a este proceso tomar medidas para resolver el punto muerto, en este caso liberando el primer bloqueo que obtuvo.

Agrupación de Linux

Tanto Red Hat como Oracle han desarrollado software de agrupación en clústeres para Linux .

OCFS2 , el sistema de archivos Oracle Cluster, se agregó ^[2] al kernel oficial de Linux con la versión 2.6.16, en enero de 2006. La advertencia del código de calidad alfa en OCFS2 se eliminó en 2.6.19.

El software de clúster de Red Hat, incluidos su DLM y GFS2, se agregó oficialmente al kernel de Linux ^[3] con la versión 2.6.19, en noviembre de 2006.

Ambos sistemas utilizan un DLM inspirado en el venerable VMS DLM. ^[4] DLM de Oracle tiene una API más simple. (La función principal, dlmlock()tiene ocho parámetros, mientras que el SYS$ENQservicio VMS y Red Hat dlm_locktienen 11).

Otras implementaciones

Otras implementaciones de DLM incluyen las siguientes:

Google ha desarrollado Chubby , un servicio de bloqueo para sistemas distribuidos débilmente acoplados. ^[5] Está diseñado para bloqueo de grano grueso y también proporciona un sistema de archivos distribuido limitado pero confiable. Partes clave de la infraestructura de Google, incluidos Google File System , Bigtable y MapReduce , utilizan Chubby para sincronizar los accesos a recursos compartidos. Aunque Chubby fue diseñado como un servicio de bloqueo, ahora se usa mucho dentro de Google como servidor de nombres , reemplazando al DNS . ^[5]
Apache ZooKeeper , que fue creado en Yahoo , es un software de código abierto y también puede usarse para realizar bloqueos distribuidos ^{[6] .}
Etcd es un software de código abierto, desarrollado en CoreOS bajo la licencia Apache. ^[7] También se puede utilizar para realizar bloqueos distribuidos. ^[8]
Redis es un almacén y caché de valores clave avanzado, con licencia BSD y de código abierto. ^[9] Redis se puede utilizar para implementar el algoritmo Redlock para la gestión de bloqueos distribuidos. ^[10]
HashiCorp's Consul , ^[11] que fue creado por HashiCorp , es un software de código abierto y también se puede utilizar para realizar bloqueos distribuidos.
El administrador de bloqueo distribuido Taooka ^[12] utiliza el método "try lock" para evitar puntos muertos . También puede especificar un TTL para cada bloqueo con una precisión de nanosegundos.
Un DLM también es un componente clave de proyectos de imagen de sistema único (SSI) más ambiciosos, como OpenSSI .

Referencias

^ Gehani, Narain (1991). Ada: programación concurrente. Prensa de silicio. pag. 105.ISBN 9780929306087.
^ kernel/git/torvalds/linux.git - Árbol de fuentes del kernel de Linux ^{[ enlace muerto permanente ]} . Kernel.org. Recuperado el 18 de septiembre de 2013.
^ kernel/git/torvalds/linux.git: árbol de fuentes del kernel de Linux Archivado el 18 de julio de 2012 en archive.today . Git.kernel.org (7 de diciembre de 2006). Recuperado el 18 de septiembre de 2013.
^ El sistema de archivos OCFS2. Lwn.net (24 de mayo de 2005). Recuperado el 18 de septiembre de 2013.
^ ab Publicación de investigación de Google: Servicio de bloqueo distribuido Chubby. Investigación.google.com. Recuperado el 18 de septiembre de 2013.
^ [1]. Zookeeper.apache.org. Recuperado el 18 de septiembre de 2013.
^ "CoreOS". coreos.com .
^ etcd: almacén de valores clave confiable y distribuido para los datos más críticos de un sistema distribuido, CoreOS, 2018-01-16 , consultado el 20 de septiembre de 2016
^ redis.io http://redis.io/ . Consultado el 14 de abril de 2015 . {{cite web}}: Falta o está vacío |title=( ayuda ) ^{[ falta título ]}
^ "Cerraduras distribuidas con Redis - Redis". redis.io . Consultado el 14 de abril de 2015 .
^ Descripción general del cónsul. Recuperado el 19 de febrero de 2015.
^ Descripción de Taooka Archivado el 3 de mayo de 2017 en Wayback Machine. Consultado el 4 de mayo de 2017.

Manual de referencia de servicios de sistemas HP OpenVMS – $ENQ
Oficial: un administrador de bloqueo distribuido simple escrito en Ruby
FLoM: un administrador de bloqueo distribuido gratuito y de código abierto que se puede utilizar para sincronizar comandos de shell, scripts y software C, C++, Java, PHP y Python desarrollado a medida.