stringtranslate.com

Imagen de sistema único

En computación distribuida , un clúster de imagen de sistema único ( SSI ) es un clúster de máquinas que parece ser un solo sistema. [1] [2] [3] El concepto a menudo se considera sinónimo del de un sistema operativo distribuido , [4] [5] pero una sola imagen se puede presentar para propósitos más limitados, solo la programación de tareas , por ejemplo, lo que se puede lograr por medio de una capa adicional de software sobre las imágenes de sistemas operativos convencionales que se ejecutan en cada nodo . [6] El interés en los clústeres SSI se basa en la percepción de que pueden ser más simples de usar y administrar que los clústeres más especializados.

Diferentes sistemas SSI pueden proporcionar una ilusión más o menos completa de un sistema único.

Características de los sistemas de clusterización SSI

Diferentes sistemas SSI pueden, dependiendo del uso previsto, proporcionar algún subconjunto de estas características.

Migración de procesos

Muchos sistemas SSI proporcionan migración de procesos . [7] Los procesos pueden comenzar en un nodo y ser movidos a otro nodo, posiblemente por razones administrativas o de equilibrio de recursos . [nota 1] A medida que los procesos se mueven de un nodo a otro, otros recursos asociados (por ejemplo, recursos IPC ) pueden moverse con ellos.

Puntos de control de procesos

Algunos sistemas SSI permiten la creación de puntos de control de los procesos en ejecución, lo que permite guardar su estado actual y volver a cargarlo en una fecha posterior. [nota 2] La creación de puntos de control se puede considerar relacionada con la migración, ya que la migración de un proceso de un nodo a otro se puede implementar creando primero un punto de control del proceso y luego reiniciándolo en otro nodo. Alternativamente, la creación de puntos de control se puede considerar como una migración al disco .

Espacio de proceso único

Algunos sistemas SSI proporcionan la ilusión de que todos los procesos se ejecutan en la misma máquina: las herramientas de gestión de procesos (por ejemplo, "ps", "kill" en sistemas tipo Unix ) operan en todos los procesos del clúster.

Raíz única

La mayoría de los sistemas SSI proporcionan una vista única del sistema de archivos. Esto se puede lograr mediante un servidor NFS simple , dispositivos de disco compartidos o incluso replicación de archivos.

La ventaja de una única vista raíz es que los procesos pueden ejecutarse en cualquier nodo disponible y acceder a los archivos necesarios sin precauciones especiales. Si el clúster implementa la migración de procesos, una única vista raíz permite el acceso directo a los archivos desde el nodo donde se está ejecutando el proceso.

Algunos sistemas SSI ofrecen una forma de "romper la ilusión" al tener algunos archivos específicos de nodos incluso en una única raíz. HP TruCluster ofrece un "enlace simbólico dependiente del contexto" (CDSL) que apunta a diferentes archivos según el nodo que accede a él. HP VMScluster ofrece un nombre lógico de lista de búsqueda con archivos específicos de nodos que ocultan los archivos compartidos del clúster cuando es necesario. Esta capacidad puede ser necesaria para tratar con clústeres heterogéneos , donde no todos los nodos tienen la misma configuración. En configuraciones más complejas, como múltiples nodos de múltiples arquitecturas en varios sitios, varios discos locales pueden combinarse para formar la única raíz lógica.

Espacio de E/S único

Algunos sistemas SSI permiten que todos los nodos accedan a los dispositivos de E/S (p. ej., cintas, discos, líneas seriales, etc.) de otros nodos. Puede haber algunas restricciones sobre los tipos de acceso permitidos (por ejemplo, OpenSSI no puede montar dispositivos de disco de un nodo en otro nodo).

Espacio IPC único

Algunos sistemas SSI permiten que los procesos de distintos nodos se comuniquen mediante mecanismos de comunicación entre procesos como si estuvieran ejecutándose en la misma máquina. En algunos sistemas SSI, esto puede incluir incluso memoria compartida (puede emularse en software con memoria compartida distribuida ).

En la mayoría de los casos, la IPC entre nodos será más lenta que la IPC en la misma máquina, posiblemente mucho más lenta para la memoria compartida. Algunos clústeres SSI incluyen hardware especial para reducir esta lentitud.

Dirección IP del clúster

Algunos sistemas SSI proporcionan una " dirección IP de clúster ", una única dirección visible desde fuera del clúster que se puede utilizar para contactar con el clúster como si fuera una sola máquina. Esto se puede utilizar para equilibrar la carga de las llamadas entrantes al clúster, dirigiéndolas a nodos con poca carga, o para redundancia, moviendo la dirección del clúster de una máquina a otra a medida que los nodos se incorporan o abandonan el clúster. [nota 3]

Ejemplos

Los ejemplos aquí varían desde plataformas comerciales con capacidades de escalamiento hasta paquetes/marcos para crear sistemas distribuidos, así como aquellos que realmente implementan una única imagen del sistema.

  1. ^ Muchos de los clústeres SSI basados ​​en Linux pueden usar el servidor virtual Linux para implementar una única dirección IP de clúster
  2. ^ Verde significa que el software se desarrolla activamente
  3. ^ El desarrollo de la ameba es llevado adelante por el Dr. Stefan Bosse en el laboratorio BSS Archivado el 3 de febrero de 2009 en Wayback Machine.
  4. ^ Guardian90 TR90.8 Basado en investigación y desarrollo de Tandem Computers c/o Andrea Borr en [1]
  5. ^ LinuxPMI es el sucesor de openMosix
  6. ^ LOCUS se utilizó para crear IBM AIX TCF
  7. ^ LOCUS utilizó canales con nombre para IPC
  8. ^ openMosix fue una bifurcación de MOSIX
  9. ^ Open-Sharedroot es un clúster raíz compartido de ATIX
  10. ^ UnixWare NonStop Clusters fue la base para OpenSSI

Véase también

Notas

  1. ^ por ejemplo, puede ser necesario mover procesos que se ejecutan durante mucho tiempo fuera de un nodo que se cerrará por mantenimiento
  2. ^ Los puntos de control son particularmente útiles en clústeres utilizados para computación de alto rendimiento , evitando la pérdida de trabajo en caso de reinicio de un clúster o nodo.
  3. ^ "Salir de un grupo" es a menudo un eufemismo para "caer"

Referencias

  1. ^ Pfister, Gregory F. (1998), En busca de cúmulos , Upper Saddle River, NJ: Prentice Hall PTR, ISBN 978-0-13-899709-0, OCLC  38300954
  2. ^ Buyya, Rajkumar; Cortes, Toni; Jin, Hai (2001), "Imagen de sistema único" (PDF) , Revista internacional de aplicaciones informáticas de alto rendimiento , 15 (2): 124, doi :10.1177/109434200101500205, S2CID  38921084
  3. ^ Healy, Philip; Lynn, Theo; Barrett, Enda; Morrison, John P. (2016), "Imagen de un solo sistema: un estudio" (PDF) , Journal of Parallel and Distributed Computing , 90–91: 35–51, doi :10.1016/j.jpdc.2016.01.004, hdl :10468/4932
  4. ^ Coulouris, George F; Dollimore, Jean; Kindberg, Tim (2005), Sistemas distribuidos: conceptos y diseño, Addison Wesley, pág. 223, ISBN 978-0-321-26354-4
  5. ^ Bolosky, William J.; Draves, Richard P.; Fitzgerald, Robert P.; Fraser, Christopher W.; Jones, Michael B.; Knoblock, Todd B.; Rashid, Rick (5 de mayo de 1997), "Operating System Directions for the Next Millennium", 6th Workshop on Hot Topics in Operating Systems (HotOS-VI) , Cape Cod, MA, págs. 106-110, CiteSeerX 10.1.1.50.9538 , doi :10.1109/HOTOS.1997.595191, ISBN  978-0-8186-7834-9, Número de identificación del sujeto  15380352{{citation}}: Mantenimiento de CS1: falta la ubicación del editor ( enlace )
  6. ^ Prabhu, CSR (2009), Computación en red y en clúster, Phi Learning, pág. 256, ISBN 978-81-203-3428-1
  7. ^ Smith, Jonathan M. (1988), "Un estudio de los mecanismos de migración de procesos" (PDF) , ACM SIGOPS Operating Systems Review , 22 (3): 28–40, CiteSeerX 10.1.1.127.8095 , doi :10.1145/47671.47673, S2CID  6611633 
  8. ^ "Sistema operativo AIX PS/2".
  9. ^ "Repositorio GitHub Open-Sharedroot". GitHub .
  10. ^ Pike, Rob; Presotto, Dave; Thompson, Ken; Trickey, Howard (1990), "Plan 9 de Bell Labs", en Actas de la Conferencia UKUUG de verano de 1990, pág. 8, La migración de procesos también está deliberadamente ausente del Plan 9. {{citation}}: Falta o está vacío |title=( ayuda )