stringtranslate.com

HTCóndor

HTCondor es un marco de software informático de alto rendimiento y código abierto para la paralelización distribuida de grano grueso de tareas computacionalmente intensivas. [1] Se puede utilizar para administrar la carga de trabajo en un grupo dedicado de computadoras o para distribuir el trabajo en computadoras de escritorio inactivas, lo que se conoce como recolección de ciclos . HTCondor se ejecuta en los sistemas operativos Linux , Unix , Mac OS X , FreeBSD y Microsoft Windows . HTCondor puede integrar tanto recursos dedicados (clústeres montados en bastidor) como máquinas de escritorio no dedicadas (búsqueda de ciclos) en un entorno informático.

HTCondor es desarrollado por el equipo HTCondor de la Universidad de Wisconsin-Madison y está disponible gratuitamente para su uso. HTCondor sigue una filosofía de código abierto y tiene la licencia Apache 2.0. [2]

Si bien HTCondor aprovecha el tiempo de computación no utilizado, dejar las computadoras encendidas para usarlas con HTCondor aumentará el consumo de energía y los costos asociados. A partir de la versión 7.1.1, HTCondor puede hibernar y reactivar máquinas según políticas especificadas por el usuario, una característica que anteriormente solo estaba disponible a través de software de terceros.

Historia

El desarrollo de HTCondor comenzó en 1988.

HTCondor se conocía anteriormente como Cóndor; el nombre se cambió en octubre de 2012 para resolver una demanda de marca. [3]

HTCondor fue el software de programación utilizado para distribuir trabajos para el primer borrador del ensamblaje del Genoma Humano.

Ejemplo de uso

El grupo HTCondor de la instalación de supercomputación avanzada (NAS) de la NASA consta de aproximadamente 350 estaciones de trabajo SGI y Sun compradas y utilizadas para desarrollo de software, visualización, correo electrónico, preparación de documentos y otras tareas. Cada estación de trabajo ejecuta un demonio que vigila las E/S del usuario y la carga de la CPU. Cuando una estación de trabajo ha estado inactiva durante dos horas, se asigna un trabajo de la cola por lotes a la estación de trabajo y se ejecutará hasta que el demonio detecte una pulsación de tecla, un movimiento del mouse o un uso elevado de CPU que no sea de HTCondor. En ese momento, el trabajo se eliminará de la estación de trabajo y se volverá a colocar en la cola por lotes.

Características

HTCondor puede ejecutar trabajos tanto secuenciales como paralelos. Los trabajos secuenciales se pueden ejecutar en varios "universos" diferentes, incluido el "vainilla", que proporciona la capacidad de ejecutar la mayoría de los programas "listos para lotes", y el "universo estándar", en el que la aplicación de destino se vuelve a vincular con la biblioteca de E/S de HTCondor. que proporciona E/S de trabajos remotos y puntos de control de trabajos. HTCondor también proporciona un "universo local" que permite ejecutar trabajos en el "host de envío".

En el mundo de los trabajos paralelos, HTCondor admite la interfaz de paso de mensajes estándar y la máquina virtual paralela (Goux, et al. 2000), además de su propia biblioteca Master Worker "MW" para tareas extremadamente paralelas.

HTCondor-G permite que los trabajos de HTCondor utilicen recursos que no están bajo su control directo. Se utiliza principalmente para comunicarse con recursos de red y nube , como Globus anterior a WS y WS, Nordugrid ARC , UNICORE y Amazon Elastic Compute Cloud . Pero también se puede utilizar para comunicarse con otros sistemas por lotes, como Torque/PBS y LSF . Actualmente se está desarrollando soporte para Sun Grid Engine como parte del proyecto EGEE . [ cita necesaria ]

HTCondor admite la API de trabajo DRMAA . Esto permite a los clientes compatibles con DRMAA enviar y monitorear trabajos de HTCondor. La implementación de referencia de SAGA C++ proporciona un complemento (adaptador) de HTCondor, que hace que el envío y monitoreo de trabajos de HTCondor esté disponible a través de las API Python y C++ de SAGA.

Otras características de HTCondor incluyen "DAGMan", que proporciona un mecanismo para describir las dependencias del trabajo.

Ver también

Referencias

  1. ^ Tailandés, Douglas; Tannenbaum, Todd; Livny, Mirón (2005). "Computación distribuida en la práctica: la experiencia Condor" (PDF) . Concurrencia y Computación: Práctica y Experiencia . 17 (2–4): 323–356. CiteSeerX 10.1.1.6.3035 . doi :10.1002/cpe.938. S2CID  15450656. 
  2. ^ "HTCondor - Información de licencia". investigación.cs.wisc.edu .
  3. ^ Tannenbaum, Todd. "El nombre de "Cóndor" cambia a "HTCondor"" . Consultado el 11 de marzo de 2013 .

enlaces externos