stringtranslate.com

Imagen única del sistema

En la informática distribuida , un clúster de imagen de sistema único ( SSI ) es un clúster de máquinas que parece ser un solo sistema. [1] [2] [3] El concepto a menudo se considera sinónimo del de sistema operativo distribuido , [4] [5] pero una sola imagen puede presentarse para propósitos más limitados, solo para la programación de trabajos , por ejemplo, que puede ser Esto se logra mediante una capa adicional de software sobre las imágenes del sistema operativo convencional que se ejecuta en cada nodo . [6] El interés en los clusters SSI se basa en la percepción de que pueden ser más sencillos de usar y administrar que los clusters más especializados.

Diferentes sistemas SSI pueden proporcionar una ilusión más o menos completa de un único sistema.

Características de los sistemas de agrupación en clústeres SSI

Diferentes sistemas SSI pueden, según el uso previsto, proporcionar algún subconjunto de estas características.

Migración de procesos

Muchos sistemas SSI proporcionan migración de procesos . [7] Los procesos pueden comenzar en un nodo y trasladarse a otro nodo, posiblemente por razones administrativas o de equilibrio de recursos . [nota 1] A medida que los procesos se mueven de un nodo a otro, otros recursos asociados (por ejemplo, recursos de IPC ) se pueden mover con ellos.

Puntos de control del proceso

Algunos sistemas SSI permiten puntos de control de los procesos en ejecución, lo que permite guardar y recargar su estado actual en una fecha posterior. [nota 2] Los puntos de control pueden verse como relacionados con la migración, ya que la migración de un proceso de un nodo a otro se puede implementar marcando primero los puntos de control del proceso y luego reiniciándolo en otro nodo. Alternativamente, los puntos de control pueden considerarse como una migración al disco .

Espacio de proceso único

Algunos sistemas SSI proporcionan la ilusión de que todos los procesos se ejecutan en la misma máquina: las herramientas de gestión de procesos (por ejemplo, "ps", "kill" en sistemas tipo Unix ) operan en todos los procesos del clúster.

Raíz única

La mayoría de los sistemas SSI proporcionan una vista única del sistema de archivos. Esto se puede lograr mediante un simple servidor NFS , dispositivos de disco compartido o incluso replicación de archivos.

La ventaja de una vista raíz única es que los procesos se pueden ejecutar en cualquier nodo disponible y acceder a los archivos necesarios sin precauciones especiales. Si el clúster implementa la migración de procesos, una vista raíz única permite accesos directos a los archivos desde el nodo donde se está ejecutando el proceso actualmente.

Algunos sistemas SSI proporcionan una forma de "romper la ilusión", teniendo algunos archivos específicos de nodos incluso en una única raíz. HP TruCluster proporciona un "enlace simbólico dependiente del contexto" (CDSL) que apunta a diferentes archivos según el nodo que accede a él. HP VMScluster proporciona una lista de búsqueda de nombres lógicos con archivos específicos del nodo que ocluyen los archivos compartidos del clúster cuando sea necesario. Esta capacidad puede ser necesaria para tratar con clústeres heterogéneos , donde no todos los nodos tienen la misma configuración. En configuraciones más complejas, como múltiples nodos de múltiples arquitecturas en múltiples sitios, varios discos locales pueden combinarse para formar una única raíz lógica.

Espacio de E/S único

Algunos sistemas SSI permiten que todos los nodos accedan a los dispositivos de E/S (por ejemplo, cintas, discos, líneas serie, etc.) de otros nodos. Puede haber algunas restricciones sobre los tipos de accesos permitidos (por ejemplo, OpenSSI no puede montar dispositivos de disco de un nodo en otro nodo).

Espacio único IPC

Algunos sistemas SSI permiten que procesos en diferentes nodos se comuniquen utilizando mecanismos de comunicación entre procesos como si se estuvieran ejecutando en la misma máquina. En algunos sistemas SSI esto puede incluso incluir memoria compartida (se puede emular en software con memoria compartida distribuida ).

En la mayoría de los casos, el IPC entre nodos será más lento que el IPC en la misma máquina, posiblemente drásticamente más lento para la memoria compartida. Algunos clústeres SSI incluyen hardware especial para reducir esta desaceleración.

Dirección IP del clúster

Algunos sistemas SSI proporcionan una " dirección IP del clúster ", una dirección única visible desde fuera del clúster que se puede utilizar para contactar al clúster como si fuera una sola máquina. Esto se puede utilizar para equilibrar la carga de llamadas entrantes al clúster, dirigiéndolas a nodos con carga ligera, o para redundancia, moviendo la dirección del clúster de una máquina a otra a medida que los nodos se unen o abandonan el clúster. [nota 3]

Ejemplos

Los ejemplos aquí varían desde plataformas comerciales con capacidades de escalamiento hasta paquetes/marcos para crear sistemas distribuidos, así como aquellos que realmente implementan una única imagen de sistema.

  1. ^ Muchos de los clústeres SSI basados ​​en Linux pueden utilizar el servidor virtual de Linux para implementar una única dirección IP de clúster.
  2. ^ Verde significa que el software se desarrolla activamente
  3. ^ El Dr. Stefan Bosse lleva adelante el desarrollo de amebas en BSS Lab Archivado el 3 de febrero de 2009 en Wayback Machine.
  4. ^ Guardian90 TR90.8 Basado en investigación y desarrollo de Tandem Computers c/o Andrea Borr en [1]
  5. ^ LinuxPMI es el sucesor de openMosix
  6. ^ LOCUS se utilizó para crear IBM AIX TCF
  7. ^ LOCUS utilizó tuberías con nombre para IPC
  8. ^ openMosix era una bifurcación de MOSIX
  9. ^ Open-Sharedroot es un clúster raíz compartido de ATIX
  10. ^ UnixWare NonStop Clusters fue una base para OpenSSI

Ver también

Notas

  1. ^ por ejemplo, puede ser necesario sacar procesos de larga ejecución de un nodo que se va a cerrar por mantenimiento
  2. ^ Los puntos de control son particularmente útiles en clústeres utilizados para computación de alto rendimiento , evitando la pérdida de trabajo en caso de reinicio de un clúster o nodo.
  3. ^ "dejar un grupo" es a menudo un eufemismo para estrellarse

Referencias

  1. ^ Pfister, Gregory F. (1998), En busca de conglomerados , Upper Saddle River, Nueva Jersey: Prentice Hall PTR, ISBN 978-0-13-899709-0, OCLC  38300954
  2. ^ Buyya, Rajkumar; Cortés, Toni; Jin, Hai (2001), "Imagen de sistema único" (PDF) , Revista internacional de aplicaciones informáticas de alto rendimiento , 15 (2): 124, doi :10.1177/109434200101500205, S2CID  38921084
  3. ^ Healy, Felipe; Lynn, Theo; Barrett, Enda; Morrison, John P. (2016), "Imagen de sistema único: una encuesta" (PDF) , Journal of Parallel and Distributed Computing , 90–91: 35–51, doi :10.1016/j.jpdc.2016.01.004, hdl : 10468/4932
  4. ^ Coulouris, George F; Dollimore, Jean; Kindberg, Tim (2005), Sistemas distribuidos: conceptos y diseño, Addison Wesley, p. 223, ISBN 978-0-321-26354-4
  5. ^ Bolosky, William J.; Draves, Richard P.; Fitzgerald, Robert P.; Fraser, Christopher W.; Jones, Michael B.; Knoblock, Todd B.; Rashid, Rick (5 de mayo de 1997), "Instrucciones del sistema operativo para el próximo milenio", 6º taller sobre temas candentes en sistemas operativos (HotOS-VI) , Cape Cod, MA, págs. 106–110, CiteSeerX 10.1.1.50 .9538 , doi :10.1109/HOTOS.1997.595191, ISBN  978-0-8186-7834-9, S2CID  15380352{{citation}}: Mantenimiento CS1: falta el editor de la ubicación ( enlace )
  6. ^ Prabhu, CSR (2009), Computación en red y en clústeres, Phi Learning, pág. 256, ISBN 978-81-203-3428-1
  7. ^ Smith, Jonathan M. (1988), "Un estudio de los mecanismos de migración de procesos" (PDF) , Revisión de sistemas operativos ACM SIGOPS , 22 (3): 28–40, CiteSeerX 10.1.1.127.8095 , doi :10.1145/47671.47673, S2CID  6611633 
  8. ^ "SO AIX PS/2".
  9. ^ "Repositorio GitHub de raíz abierta y compartida". GitHub .
  10. ^ Lucio, Rob; Presotto, Dave; Thompson, Ken; Trickey, Howard (1990), "Plan 9 de Bell Labs", en Actas de la conferencia UKUUG de verano de 1990, p. 8. La migración de procesos también está deliberadamente ausente del Plan 9. {{citation}}: Falta o está vacío |title=( ayuda )