Interconexión toroidal

Una interconexión toroidal es una topología de red sin conmutador para conectar nodos de procesamiento en un sistema informático paralelo .

Introducción

En geometría , un toroide se crea al hacer girar un círculo alrededor de un eje coplanar al círculo. Si bien esta es una definición general en geometría, las propiedades topológicas de este tipo de forma describen la topología de la red en su esencia.

Ilustración de geometría

En las representaciones siguientes, el primero es un toro unidimensional, un círculo simple. El segundo es un toroide de dos dimensiones, con forma de "rosquilla". La animación ilustra cómo se genera un toroide de dos dimensiones a partir de un rectángulo conectando sus dos pares de aristas opuestas. En una dimensión, una topología toroidal es equivalente a una red de interconexión en anillo , en forma de círculo. En dos dimensiones, se vuelve equivalente a una malla de dos dimensiones, pero con conexión adicional en los nodos de borde.

Un toro de una dimensión, un círculo.
Un toroide de dos dimensiones, un donut.
Generando un toro de dos dimensiones a partir de un rectángulo de dos dimensiones.

Topología de red Torus

Una interconexión toroidal es una topología sin conmutador que puede verse como una interconexión en malla con nodos dispuestos en una matriz rectilínea de N = 2, 3 o más dimensiones, con procesadores conectados a sus vecinos más cercanos y los procesadores correspondientes en bordes opuestos de la matriz conectada.[1] En esta red , cada nodo tiene 2N conexiones. Esta topología lleva el nombre de la red formada de esta manera, que es topológicamente homogénea a un toro de N dimensiones .

Visualización

Las primeras 3 dimensiones de la topología de la red toroidal son más fáciles de visualizar y se describen a continuación:

Ilustración de toro 1D
Ilustración de toro 2D
Ilustración de toro 3D

Toro 1D: una dimensión, n nodos están conectados en circuito cerrado con cada nodo conectado a sus dos vecinos más cercanos. La comunicación puede tener lugar en dos direcciones, +x y −x. Un Toro 1D es lo mismo que una interconexión en anillo .
Toro 2D: dos dimensiones con grado de cuatro, los nodos se imaginan dispuestos en una red rectangular bidimensional de n filas y n columnas, con cada nodo conectado a sus cuatro vecinos más cercanos y los nodos correspondientes en bordes opuestos conectados. La comunicación puede tener lugar en cuatro direcciones: +x, −x, +y y −y. El total de nodos de un Toro 2D es n ² .
Toro 3D: en tres dimensiones, los nodos se imaginan en una red tridimensional en forma de prisma rectangular, con cada nodo conectado con sus seis vecinos, con los nodos correspondientes en las caras opuestas de la matriz conectados. Cada borde consta de n nodos. la comunicación puede tener lugar en seis direcciones, +x, −x, +y, −y, +z, −z. Cada borde de un Toro 3D consta de n nodos. El total de nodos de 3D Torus es n ³ .
ND Toro: N dimensiones, cada nodo de un toro de N dimensión tiene 2N vecinos, la comunicación puede tener lugar en 2N direcciones. Cada borde consta de n nodos. El total de nodos de este toro es n ^N . La principal motivación para tener una mayor dimensión de toro es lograr un mayor ancho de banda, menor latencia y mayor escalabilidad.

Las matrices de dimensiones superiores son difíciles de visualizar. El conjunto de reglas anterior muestra que cada dimensión superior agrega otro par de conexiones vecinas más cercanas a cada nodo.

Actuación

Varios superordenadores de la lista TOP500 utilizan redes toroidales tridimensionales, por ejemplo, Blue Gene/L y Blue Gene/P de IBM , y el Cray XT3. ^[1]Blue Gene/Q de IBM utiliza una red toroidal de cinco dimensiones. La computadora K de Fujitsu y el PRIMEHPC FX10 utilizan una interconexión de malla 3D toroidal tridimensional patentada llamada Tofu. ^[2]

Simulación de rendimiento de Torus 3D

Sandeep Palur y el Dr. Ioan Raicu del Instituto de Tecnología de Illinois realizaron experimentos para simular el rendimiento del toroide en 3D. Sus experimentos se realizaron en una computadora con 250 GB de RAM, 48 núcleos y arquitectura x86_64. El simulador que utilizaron fue ROSS (Sistema de Simulación Optimista de Rensselaer). Se centraron principalmente en tres aspectos:

Tamaño de red variable
Número variable de servidores
Tamaño de mensaje variable

Concluyeron que el rendimiento disminuye con el aumento de los servidores y el tamaño de la red. De lo contrario, el rendimiento aumenta con el aumento del tamaño del mensaje. ^[3]

Rendimiento del producto 6D Torus

Fujitsu Limited desarrolló un modelo de computadora toroidal 6D llamado "Tofu". En su modelo, un toro 6D puede alcanzar un ancho de banda fuera del chip de 100 GB/s, una escalabilidad 12 veces mayor que un toro 3D y una alta tolerancia a fallos. El modelo se utiliza en la computadora K y Fugaku . ^[4]

Ventajas y desventajas

Ventajas

Mayor velocidad, menor latencia: Debido a la conexión de bordes opuestos, los datos tienen más opciones para viajar de un nodo a otro, lo que aumenta considerablemente la velocidad.
Mejor equidad: En una interconexión de malla 4×4, la distancia más larga entre nodos es desde la esquina superior izquierda hasta la esquina inferior derecha. Cada dato toma 6 saltos para recorrer el camino más largo. Pero en una interconexión Torus 4×4, la esquina superior izquierda puede viajar a la esquina inferior derecha con solo 2 saltos.
Menor consumo de energía: Dado que los datos tienden a recorrer menos saltos, el consumo de energía tiende a ser menor.

Desventajas

Complejidad del cableado: Los cables adicionales pueden dificultar el proceso de enrutamiento en la fase de diseño físico. Para colocar más cables en el chip, es probable que sea necesario aumentar el número de capas de metal o disminuir la densidad del chip, lo que es más caro. De lo contrario, los cables que conectan los bordes opuestos pueden ser mucho más largos que otros cables. Esta desigualdad de longitudes de enlace puede causar problemas debido al retraso de RC .
Costo: Si bien los enlaces envolventes largos pueden ser la forma más sencilla de visualizar la topología de la conexión, en la práctica, las restricciones en la longitud de los cables a menudo hacen que los enlaces envolventes largos no sean prácticos. En cambio, los nodos conectados directamente (incluidos los nodos que la visualización anterior coloca en bordes opuestos de una cuadrícula, conectados por un enlace envolvente largo) se colocan físicamente casi uno al lado del otro en una red toroidal plegada. ^[5]^[6] Cada enlace en la red de toroide plegado es muy corto (casi tan corto como los enlaces vecinos más cercanos en una interconexión de red simple) y, por lo tanto, tiene baja latencia. ^[7]

Ver también

Referencias

^ NR Agida y col. 2005 Blue Gene/L Torus Interconnection Network , IBM Journal of Research and Development, Vol 45, No 2/3 Marzo-mayo de 2005, página 265 "Copia archivada" (PDF) . Archivado desde el original (PDF) el 15 de agosto de 2011 . Consultado el 9 de febrero de 2012 .{{cite web}}: Mantenimiento CS1: copia archivada como título ( enlace )
^ Fujitsu presenta el cable HPC de supercomputadora Post-K el 7 de noviembre de 2011
^ Sandeep, Palur; Raicu, Dr. Ioan. "Comprensión del rendimiento de la red Torus mediante simulaciones" (PDF) . Consultado el 28 de noviembre de 2016 .
^ Inoue, Tomohiro. "La interconexión 6D Mesh/Torus de la computadora K" (PDF) . Fujitsu . Consultado el 28 de noviembre de 2016 .
^ "Topología toroide de mundo pequeño".
^ Pavel Tvrdik. "Temas de informática paralela: incrustaciones y simulaciones de IN: incrustación óptima de tori en mallas".
^ "La arquitectura 3D Torus y el enfoque Eurotech".