stringtranslate.com

Protocolo de confirmación de dos fases

En el procesamiento de transacciones , bases de datos y redes de computadoras , el protocolo de compromiso de dos fases ( 2PC , tupac ) es un tipo de protocolo de compromiso atómico (ACP). Es un algoritmo distribuido que coordina todos los procesos que participan en una transacción atómica distribuida sobre si confirmar o abortar (revertir) la transacción. Este protocolo (un tipo especializado de protocolo de consenso ) logra su objetivo incluso en muchos casos de falla temporal del sistema (que involucra fallas de proceso, nodo de red, comunicación, etc.) y, por lo tanto, se usa ampliamente. [1] [2] [3] Sin embargo, no es resistente a todas las configuraciones de falla posibles y, en casos raros, se necesita intervención manual para remediar un resultado. Para adaptarse a la recuperación de una falla (automática en la mayoría de los casos), los participantes del protocolo utilizan el registro de los estados del protocolo. Los procedimientos de recuperación del protocolo utilizan los registros de registro, que normalmente tardan en generarse pero sobreviven a los fallos . Existen muchas variantes de protocolo que difieren principalmente en las estrategias de registro y los mecanismos de recuperación. Aunque generalmente están destinados a usarse con poca frecuencia, los procedimientos de recuperación constituyen una parte sustancial del protocolo, debido a que el protocolo debe considerar y respaldar muchos escenarios de falla posibles.

En una "ejecución normal" de cualquier transacción distribuida (es decir, cuando no se produce ningún fallo, que suele ser la situación más frecuente), el protocolo consta de dos fases:

  1. La fase de solicitud de compromiso (o fase de votación), en la que un proceso coordinador intenta preparar todos los procesos participantes de la transacción (participantes, cohortes o trabajadores nombrados) para tomar los pasos necesarios para comprometer o abortar la transacción y votar, ya sea "Sí": confirmar (si la ejecución de la parte local del participante de la transacción ha finalizado correctamente), o "No": cancelar (si se ha detectado un problema con la parte local), y
  2. La fase de confirmación, en la que, basándose en la votación de los participantes, el coordinador decide si comprometerse (solo si todos han votado "Sí") o abortar la transacción (en caso contrario), y notifica el resultado a todos los participantes. Luego, los participantes siguen con las acciones necesarias (comprometer o abortar) con sus recursos transaccionales locales (también llamados recursos recuperables; por ejemplo, datos de bases de datos) y sus respectivas partes en el resto de resultados de la transacción (si corresponde).

El protocolo de confirmación de dos fases (2PC) no debe confundirse con el protocolo de bloqueo de dos fases (2PL), un protocolo de control de concurrencia .

Suposiciones

El protocolo funciona de la siguiente manera: un nodo es el coordinador designado, que es el sitio maestro, y el resto de los nodos de la red son designados participantes. El protocolo asume que:

  1. hay almacenamiento estable en cada nodo con un registro de escritura anticipada ,
  2. ningún nodo falla para siempre,
  3. los datos en el registro de escritura anticipada nunca se pierden ni se dañan en un fallo, y
  4. dos nodos cualesquiera pueden comunicarse entre sí.

La última suposición no es demasiado restrictiva, ya que la comunicación de red normalmente puede redirigirse. Los dos primeros supuestos son mucho más sólidos; Si un nodo queda totalmente destruido, se pueden perder datos.

El protocolo lo inicia el coordinador una vez que se ha alcanzado el último paso de la transacción. A continuación, los participantes responden con un mensaje de acuerdo o un mensaje de cancelación dependiendo de si la transacción se ha procesado correctamente en el participante.

Algoritmo básico

Fase de solicitud de confirmación (o votación)

  1. El coordinador envía un mensaje de consulta para confirmar a todos los participantes y espera hasta haber recibido una respuesta de todos los participantes.
  2. Los participantes ejecutan la transacción hasta el punto en el que se les pedirá que se comprometan. Cada uno escribe una entrada en su registro de deshacer y una entrada en su registro de rehacer .
  3. Cada participante responde con un mensaje de acuerdo (el participante vota Sí para comprometerse), si las acciones del participante tuvieron éxito, o un mensaje de cancelación (el participante vota No para comprometerse), si el participante experimenta una falla que hará imposible comprometerse.

Fase de compromiso (o finalización)

Éxito

Si el coordinador recibió un mensaje de acuerdo de todos los participantes durante la fase de solicitud de confirmación:

  1. El coordinador envía un mensaje de confirmación a todos los participantes.
  2. Cada participante completa la operación y libera todos los bloqueos y recursos retenidos durante la transacción.
  3. Cada participante envía un acuse de recibo al coordinador.
  4. El coordinador completa la transacción cuando se hayan recibido todos los acuses de recibo.

Falla

Si algún participante vota No durante la fase de solicitud de confirmación (o expira el tiempo de espera del coordinador):

  1. El coordinador envía un mensaje de reversión a todos los participantes.
  2. Cada participante deshace la transacción utilizando el registro de deshacer y libera los recursos y bloqueos retenidos durante la transacción.
  3. Cada participante envía un acuse de recibo al coordinador.
  4. El coordinador deshace la transacción cuando se han recibido todos los acuses de recibo.

Flujo de mensajes

Coordinador Participante CONSULTA PARA COMPROMETER --------------------------------> VOTAR SÍ/NO preparar*/abortar* <-------------------------------confirmar*/abortar* COMMIT/ROLLBACK --------------------------------> RECONOCIMIENTO confirmar*/abortar* <-------------------------------- fin

Un * junto al tipo de registro significa que el registro está obligado a almacenarse de forma estable. [4]

Desventajas

  1. La mayor desventaja del protocolo de confirmación de dos fases es que es un protocolo de bloqueo.
  2. Si el coordinador falla permanentemente, algunos participantes nunca resolverán sus transacciones: después de que un participante haya enviado un mensaje de acuerdo como respuesta al mensaje de solicitud de confirmación del coordinador, se bloqueará hasta que se reciba una confirmación o una reversión.
  3. Un protocolo de compromiso de dos fases no puede recuperarse de manera confiable de una falla tanto del coordinador como de un miembro de la cohorte durante la fase de compromiso. Si solo el coordinador hubiera fallado y ningún miembro de la cohorte hubiera recibido un mensaje de confirmación, se podría inferir con seguridad que no se había producido ninguna confirmación. Sin embargo, si tanto el coordinador como un miembro de la cohorte fallaron, es posible que el miembro de la cohorte fallido fuera el primero en ser notificado y realmente hubiera realizado la confirmación. Incluso si se selecciona un nuevo coordinador, no puede continuar con la operación con confianza hasta que haya recibido el acuerdo de todos los miembros de la cohorte y, por lo tanto, debe bloquear hasta que todos los miembros de la cohorte respondan.

Implementación del protocolo de confirmación de dos fases

Arquitectura común

En muchos casos el protocolo 2PC se distribuye en una red informática. Se distribuye fácilmente mediante la implementación de múltiples componentes 2PC dedicados similares entre sí, generalmente denominados administradores de transacciones (TM; también conocidos como agentes 2PC o monitores de procesamiento de transacciones), que llevan a cabo la ejecución del protocolo para cada transacción (por ejemplo, The Open Group ) . s X/Abrir XA ). En las bases de datos involucradas con una transacción distribuida, los participantes, tanto el coordinador como los participantes, se registran para cerrar TM (que generalmente residen en los mismos nodos de red respectivos que los participantes) para terminar esa transacción usando 2PC. Cada transacción distribuida tiene un conjunto ad hoc de TM, las TM en las que se registran los participantes de la transacción. Existe un líder, el TM coordinador, para cada transacción para coordinar 2PC, generalmente el TM de la base de datos del coordinador. Sin embargo, la función de coordinador se puede transferir a otra TM por motivos de rendimiento o confiabilidad. En lugar de intercambiar mensajes de 2PC entre ellos, los participantes intercambian los mensajes con sus respectivas MT. Las TM relevantes se comunican entre sí para ejecutar el esquema de protocolo 2PC anterior, "que representa" a los respectivos participantes, para finalizar esa transacción. Con esta arquitectura, el protocolo está completamente distribuido (no necesita ningún componente de procesamiento central ni estructura de datos) y se amplía con la cantidad de nodos de red (tamaño de la red) de manera efectiva.

Esta arquitectura común también es eficaz para la distribución de otros protocolos de compromiso atómico además de 2PC, ya que todos estos protocolos utilizan el mismo mecanismo de votación y propagación de resultados a los participantes del protocolo. [1] [2]

Optimizaciones de protocolo

Se han realizado investigaciones en bases de datos sobre formas de obtener la mayoría de los beneficios del protocolo de compromiso de dos fases y al mismo tiempo reducir los costos mediante optimizaciones del protocolo [1] [2] [3] y ahorro de operaciones de protocolo bajo ciertos supuestos de comportamiento del sistema.

Presunto aborto y presunto compromiso

El aborto presunto o el compromiso presunto son optimizaciones comunes. [2] [3] [5] Una suposición sobre el resultado de las transacciones, ya sea confirmada o abortada, puede guardar tanto los mensajes como las operaciones de registro de los participantes durante la ejecución del protocolo 2PC. Por ejemplo, cuando se presume un aborto, si durante la recuperación del sistema de una falla el procedimiento de recuperación no encuentra evidencia registrada de la confirmación de alguna transacción, entonces se supone que la transacción ha sido abortada y actúa en consecuencia. Esto significa que no importa si los abortos se registran o no, y dicho registro se puede guardar bajo esta suposición. Normalmente se paga una penalización de operaciones adicionales durante la recuperación de una falla, según el tipo de optimización. Por lo tanto, la mejor variante de optimización, si la hay, se elige de acuerdo con las estadísticas de fallas y resultados de las transacciones.

Protocolo de confirmación de dos fases del árbol

El protocolo Tree 2PC [2] (también llamado Nested 2PC o Recursive 2PC) es una variante común de 2PC en una red informática , que utiliza mejor la infraestructura de comunicación subyacente. Los participantes en una transacción distribuida normalmente se invocan en un orden que define una estructura de árbol, el árbol de invocación, donde los participantes son los nodos y los bordes son las invocaciones (enlaces de comunicación). El mismo árbol se utiliza habitualmente para completar la transacción mediante un protocolo 2PC, pero, en principio, también se puede utilizar otro árbol de comunicación para esto. En un árbol 2PC el coordinador es considerado la raíz ("cima") de un árbol de comunicación (árbol invertido), mientras que los participantes son los demás nodos. El coordinador puede ser el nodo que originó la transacción (invoca de forma recursiva (transitiva) a los demás participantes), pero también otro nodo en el mismo árbol puede asumir el rol de coordinador. Los mensajes 2PC del coordinador se propagan "hacia abajo" en el árbol, mientras que los mensajes al coordinador son "recopilados" por un participante de todos los participantes debajo de él, antes de enviar el mensaje apropiado "arriba" en el árbol (excepto un mensaje de cancelación, que se propaga "hacia arriba" inmediatamente después de recibirlo o si el participante actual inicia el aborto).

El protocolo de compromiso dinámico de dos fases (Compromiso dinámico de dos fases, D2PC) [2] [6] es una variante del Árbol 2PC sin un coordinador predeterminado. Incluye varias optimizaciones que se han propuesto anteriormente. Los mensajes de acuerdo (votos Sí) comienzan a propagarse desde todas las hojas, cada hoja cuando completa sus tareas en nombre de la transacción (estando lista). Un nodo intermedio (no hoja) envía listo cuando un mensaje de acuerdo al último (único) nodo vecino del cual aún no se ha recibido el mensaje de acuerdo. El coordinador se determina dinámicamente mediante la carrera de mensajes de acuerdo sobre el árbol de transacciones, en el lugar donde chocan. Chocan en un nodo del árbol de transacciones, para ser el coordinador o en el borde del árbol. En el último caso, uno de los dos nodos de los bordes se elige como coordinador (cualquier nodo). D2PC es óptimo en el tiempo (entre todas las instancias de un árbol de transacciones específico y cualquier implementación específica del protocolo Tree 2PC; todas las instancias tienen el mismo árbol; cada instancia tiene un nodo diferente como coordinador): al elegir un coordinador óptimo, D2PC compromete tanto al coordinador y cada participante en el mínimo tiempo posible, permitiendo la liberación más temprana posible de los recursos bloqueados en cada participante de la transacción (nodo de árbol).

Ver también

Referencias

  1. ^ abc Philip A. Bernstein , Vassos Hadzilacos, Nathan Goodman (1987): Recuperación y control de concurrencia en sistemas de bases de datos, Capítulo 7, Addison Wesley Publishing Company, ISBN  0-201-10715-5
  2. ^ abcdef Gerhard Weikum , Gottfried Vossen (2001): Sistemas de información transaccional, capítulo 19, Elsevier, ISBN 1-55860-508-8 
  3. ^ abc Philip A. Bernstein, Eric Newcomer (2009): Principios del procesamiento de transacciones, segunda edición Archivado el 7 de agosto de 2010 en Wayback Machine , Capítulo 8, Morgan Kaufmann (Elsevier), ISBN 978-1-55860-623-4 
  4. ^ C. Mohan , Bruce Lindsay y R. Obermarck (1986): "Gestión de transacciones en el sistema de gestión de bases de datos distribuidas R*", ACM Transactions on Database Systems (TODS) , volumen 11, número 4, diciembre de 1986, páginas 378 - 396
  5. ^ C. Mohan , Bruce Lindsay (1985): "Protocolos de confirmación eficientes para el modelo de árbol de procesos de transacciones distribuidas", Revisión de sistemas operativos ACM SIGOPS , 19 (2), págs. 40-52 (abril de 1985)
  6. ^ Yoav Raz (1995): "El protocolo de compromiso dinámico de dos fases (D2PC)", Teoría de bases de datos - ICDT '95 , Apuntes de conferencias sobre informática , volumen 893/1995, págs. 162-176, Springer, ISBN 978-3- 540-58907-5