Punto de referencia del desafío HPC

HPC Challenge Benchmark combina varios puntos de referencia para probar una serie de atributos independientes del rendimiento de los sistemas informáticos de alto rendimiento (HPC). El proyecto ha sido copatrocinado por el programa de sistemas informáticos de alta productividad de la DARPA , el Departamento de Energía de los Estados Unidos y la Fundación Nacional de la Ciencia . ^[2]

Contexto

El rendimiento de aplicaciones complejas en sistemas HPC puede depender de una variedad de atributos de rendimiento independientes del hardware. El HPC Challenge Benchmark es un esfuerzo por mejorar la visibilidad en este espacio multidimensional mediante la combinación de la medición de varios de estos atributos en un solo programa.

Aunque los atributos de rendimiento de interés no son específicos de ninguna arquitectura informática en particular, la implementación de referencia del HPC Challenge Benchmark en C y MPI supone que el sistema en prueba es un clúster de sistemas multiprocesador de memoria compartida conectados por una red . Debido a esta suposición de una estructura de sistema jerárquica, la mayoría de las pruebas se ejecutan en varios modos de operación diferentes. Siguiendo la notación utilizada por los informes de evaluación comparativa, los resultados etiquetados como "único" significan que la prueba se ejecutó en un procesador elegido aleatoriamente en el sistema, los resultados etiquetados como "estrella" significan que se ejecutó una copia independiente de la prueba simultáneamente en cada procesador del sistema, y los resultados etiquetados como "globales" significan que todos los procesadores estaban trabajando en coordinación para resolver un solo problema (con datos distribuidos entre los nodos del sistema).

Componentes

El benchmark consta actualmente de 7 pruebas (con los modos de funcionamiento indicados para cada una):

HPL ^[3] (High Performance LINPACK ): mide el rendimiento de un solucionador para un sistema denso de ecuaciones lineales (global).
DGEMM – mide el rendimiento de la multiplicación matriz-matriz (simple, estrella).
STREAM ^[4] – mide el ancho de banda de memoria sostenida hacia/desde la memoria (simple, estrella).
PTRANS – mide la velocidad a la que el sistema puede transponer una matriz grande (global).
RandomAccess : mide la tasa de actualizaciones de 64 bits de elementos seleccionados aleatoriamente de una tabla grande (individual, estrella, global).
FFT: realiza una transformada rápida de Fourier en un vector unidimensional grande utilizando el algoritmo Cooley-Tukey generalizado (simple, estrella, global).
Ancho de banda y latencia de comunicación: mediciones de rendimiento centradas en MPI basadas en el parámetro de referencia de latencia/ancho de banda b_eff ^[5] .

Atributos de rendimiento

En un nivel alto, las pruebas tienen como objetivo proporcionar cobertura de cuatro atributos importantes de rendimiento: aritmética de punto flotante de doble precisión (DGEMM y HPL), ancho de banda de memoria local (STREAM), ancho de banda de red para mensajes "grandes" (PTRANS, RandomAccess, FFT, b_eff) y ancho de banda de red para mensajes "pequeños" (RandomAccess, b_eff). Algunos de los códigos son más complejos que otros y pueden tener sensibilidades de rendimiento adicionales. Por ejemplo, en algunos sistemas, el rendimiento de HPL puede verse limitado por el ancho de banda de red y/o la latencia de red.

Competencia

El concurso anual HPC Challenge Award en la Supercomputing Conference se centra en cuatro de los puntos de referencia más desafiantes del conjunto:

HPL global
Global RandomAccess (o punto de referencia de acceso aleatorio BSS )
EP STREAM (Tríada) por sistema
FFT global

Hay dos clases de premios:

Clase 1 : Mejor desempeño en una ejecución base u optimizada enviada al sitio web HPC Challenge. ^[6]
Clase 2 : Implementación más "elegante" de cuatro o cinco núcleos computacionales, incluidos tres o más de los puntos de referencia del HPC Challenge. ^[7]

Véase también

Localidad de referencia

Referencias

^ "Lanzamientos · icl-utk-edu/hpcc". github.com . Consultado el 12 de abril de 2021 .
^ "La supercomputadora Cray X1 ha obtenido los puntajes más altos en las pruebas de referencia del HPC Challenge patrocinadas por el gobierno". 14 de junio de 2004. Archivado desde el original el 30 de marzo de 2009. Consultado el 22 de enero de 2010 .
^ "HPL: una implementación portátil del modelo de referencia Linpack de alto rendimiento para computadoras con memoria distribuida". Laboratorio de computación innovadora, Universidad de Tennessee en Knoxville . Consultado el 10 de junio de 2015 .
^ "STREAM: Ancho de banda de memoria sostenible en computadoras de alto rendimiento" . Consultado el 10 de junio de 2015 .
^ "Ancho de banda efectivo (b_eff) Benchmark". Centro de computación de alto rendimiento de Stuttgart . Consultado el 10 de junio de 2015 .
^ El punto de referencia está diseñado para permitir la sustitución de un conjunto limitado de funciones por versiones más optimizadas, sin dejar de ser una ejecución "básica". Se permiten modificaciones adicionales (pero aún limitadas) en la categoría de ejecuciones "optimizadas".
^ "Competencia de premios HPC Challenge". Programa HPCS de DARPA . Consultado el 23 de enero de 2010 .

Enlaces externos

Sitio web oficial de HPC Challenge Benchmark
Sitio web oficial del concurso de premios HPC Challenge
Evaluación del rendimiento de referencia de acceso aleatorio BSS y optimización del acceso a memoria aleatoria en núcleos múltiples con alta productividad (Premio al mejor artículo) en ACM/IEEE HiPC 2010