stringtranslate.com

Origen de la SGI 2000

El SGI Origin 2000 es una familia de servidores de gama media y alta desarrollados y fabricados por Silicon Graphics (SGI). Fueron introducidos en 1996 para suceder al SGI Challenge y al POWER Challenge. En el momento de su introducción, ejecutaban el sistema operativo IRIX , originalmente la versión 6.4 y, posteriormente, la 6.5. Una variante del Origin 2000 con capacidad gráfica se conoce como Onyx2 . Una variante de nivel de entrada basada en la misma arquitectura pero con una implementación de hardware diferente se conoce como Origin 200. El Origin 2000 fue sucedido por el Origin 3000 en julio de 2000 y se discontinuó el 30 de junio de 2002.

El Origin 2000, conocido como ASCI Blue Mountain, en el Laboratorio Nacional de Los Álamos en 2001

Modelos

La familia fue anunciada el 7 de octubre de 1996. [1] El proyecto recibió el nombre en código Lego , y también se lo conoció como SN0, para indicar el primero de una serie de arquitecturas de nodos escalables, en contraste con las arquitecturas multiprocesador simétricas anteriores de la serie SGI Challenge . [2]

El Origin 2100 es prácticamente igual a los otros modelos excepto que no se puede actualizar a otros modelos (a menos que se reemplacen las tarjetas del enrutador, etc.)

El número máximo de CPU que SGI comercializó para el Origin 2000 fue de 128 CPU; por encima de 64 CPU, el producto originalmente se denominó "CRAY Origin 2000" ya que Cray Research acaba de fusionarse con SGI. [1] Tres modelos Origin 2000 son capaces de utilizar 512 CPU y 512 GB de memoria, pero nunca se comercializaron como sistema para los clientes. Uno de los modelos Origin 2000 de 512 CPU se instaló en las instalaciones de SGI en Eagan, Minnesota, con fines de prueba y los otros dos se vendieron al Centro de Investigación Ames de la NASA en Mountain View, California, para computación científica especializada. Los Origin 2800 de 512 CPU costaron aproximadamente 40 millones de dólares cada uno y la entrega de los sistemas Origin 3000 , escalables hasta 512 o 1024 CPU a un precio más bajo por rendimiento, hizo que el Origin 2800 de 512 CPU quedara obsoleto.

Varios clientes también compraron sistemas de la serie Origin 2000 de 256 CPU, aunque SGI tampoco los comercializó nunca como producto.

La instalación más grande de la serie SGI Origin 2000 fue la Blue Mountain de la Iniciativa de Computación Estratégica Acelerada (ASCI) en Los Alamos National Labs. Incluía 48 sistemas Origin 2000 de 128 CPU, todos conectados a través de la Interfaz Paralela de Alto Rendimiento (HIPPI), para un total de 6144 procesadores. En el momento de la prueba, se ubicó en el segundo lugar de la lista TOP500 de las computadoras más rápidas del mundo. Esa prueba se completó con solo 40 nodos de 128 CPU cada uno y registró un rendimiento sostenido de 1,6 teraflops. Con todos los nodos conectados, pudo mantener 2,1 teraflops y un pico de más de 2,5 teraflops. El Laboratorio Nacional de Los Alamos también tenía otro sistema Origin de 128 CPU (para un total de 1536 CPU) como parte de la misma prueba.

El laboratorio de simulación climática del Centro Nacional de Investigación Atmosférica (NCAR) tenía un sistema Origin 2000 llamado "Ute" con 128 CPU. Fue entregado el 18 de mayo de 1998 y dado de baja el 15 de julio de 2002. [3] Un sistema más pequeño en el NCAR se llamó dataproc, entregado el 29 de marzo, con 16 CPU. [4] Los sistemas en NASA Ames incluían uno llamado Harvard Lomax con 512 CPU, uno llamado Joseph Steger con 128 CPU, uno llamado Grace Hopper con 64 CPU y uno llamado Alan Turing con 24 CPU. [5] [6]

Hardware

Cada módulo Origin 2000 se basa en nodos que se conectan a una placa base . Cada módulo puede contener hasta cuatro placas de nodos, dos placas de enrutador y doce opciones XIO . Luego, los módulos se montan dentro de un gabinete de escritorio o un bastidor. Los gabinetes de escritorio solo pueden contener un módulo, mientras que los bastidores pueden contener dos. En configuraciones con más de dos módulos, se utilizan varios bastidores.

^1 Las cifras especificadas son para configuraciones máximas.

El Origin 200 utiliza algunos de los componentes arquitectónicos, pero en una realización física muy diferente que no es escalable. [7]

Arquitectura

Un sistema Origin 2000 está compuesto de nodos conectados entre sí por una red de interconexión. Utiliza la memoria compartida distribuida, a veces denominada arquitectura Scalable Shared-Memory Multiprocessing (S 2 MP). El Origin 2000 utiliza NUMAlink (originalmente llamado CrayLink) para la interconexión de su sistema. Los nodos están conectados a placas de enrutador, que utilizan cables NUMAlink para conectarse a otros nodos a través de sus enrutadores. La topología de red del Origin 2000 es un hipercubo grueso con cerdas . En configuraciones con más de 64 procesadores, se utiliza en su lugar una topología de red de hipercubo grueso jerárquico. Se pueden instalar cables NUMAlink adicionales, llamados enlaces Xpress, entre los puertos de enrutador estándar no utilizados para reducir la latencia y aumentar el ancho de banda. Los enlaces Xpress solo se pueden utilizar en sistemas que tienen 16 o 32 procesadores, ya que estas son las únicas configuraciones con una topología de red que permite que los puertos no utilizados se utilicen de esa manera.

La arquitectura tiene sus raíces en el proyecto DASH de la Universidad de Stanford , dirigido por John L. Hennessy , que incluyó a dos de los diseñadores de Origin. [8] [9]

Placas de enrutador

El Origin 2000 utiliza cuatro placas enrutadoras diferentes. Cada placa enrutadora sucesiva permite conectar una mayor cantidad de nodos.

Enrutador nulo

El enrutador nulo conecta dos nodos en el mismo módulo. Un sistema que utiliza el enrutador nulo no se puede expandir ya que no hay conectores externos.

Enrutador de estrellas

El enrutador Star puede conectar hasta cuatro nodos. Siempre se utiliza junto con un enrutador estándar para que funcione correctamente.

Enrutador estándar (enrutador de bastidor)

El enrutador estándar puede conectar hasta 32 nodos. Contiene un circuito integrado específico de la aplicación (ASIC) conocido como interconexión en canalización escalable para enrutamiento de puntos finales distribuidos (SPIDER), que funciona como enrutador para la red NUMAlink. El ASIC SPIDER tiene seis puertos, cada uno con un par de enlaces unidireccionales, conectados a una barra transversal que permite que los puertos se comuniquen entre sí. [10]

Enrutador Meta (Enrutador Cray)

El Meta Router se utiliza junto con los Routers Estándar para conectar más de 32 nodos. Puede conectar hasta 64 nodos.

Nodos

Cada nodo Origin 2000 se instala en una única placa de circuito impreso de 16" x 11" que contiene uno o dos procesadores, la memoria principal, la memoria de directorio y el ASIC Hub. La placa del nodo se conecta a la placa base a través de un conector CPOP (Compression Pad-on-Pad) de 300 pads. El conector combina en realidad dos conexiones, una a la red del enrutador NUMAlink y otra al subsistema de E/S XIO.

Procesador

Cada procesador y su caché secundaria se encuentran en una tarjeta hija HIMM (módulo de memoria en línea horizontal) que se conecta a la placa de nodos. En el momento de su introducción, el Origin 2000 utilizaba la placa IP27, con uno o dos procesadores R10000 a 180 MHz con 1 MB de caché secundaria. También estaba disponible un modelo de gama alta con dos procesadores R10000 a 195 MHz con 4 MB de caché secundaria. En febrero de 1998, se introdujo la placa IP31 con dos procesadores R10000 a 250 MHz con 4 MB de caché secundaria. Más tarde, la placa IP31 se actualizó para admitir dos procesadores R12000 a 300, 350 o 400 MHz . Los modelos de 300 y 400 MHz tenían 8 MB de caché L2, mientras que el modelo de 350 MHz tenía 4 MB de caché L2. Cerca del final de su vida útil, se puso a disposición una variante de la placa IP31 que podía utilizar el R14000 de 500 MHz con cachés L2 de 8 MB.

Memoria principal y memoria de directorio

Cada placa de nodo puede soportar un máximo de 4 GB de memoria a través de 16 ranuras DIMM mediante el uso de DIMM SDRAM de memoria ECC patentados con capacidades de 16, 32, 64 y 256 MB. Debido a que el bus de memoria tiene 144 bits de ancho (128 bits para datos y 16 bits para ECC), los módulos de memoria se insertan en pares. Para soportar el modelo de memoria compartida distribuida Origin 2000, los módulos de memoria son propietarios e incluyen memoria de directorio, que contiene información sobre el contenido de cachés remotos para mantener la coherencia de caché , admitiendo hasta 32 procesadores. Se requiere memoria de directorio adicional en configuraciones con más de 32 procesadores. La memoria de directorio adicional está contenida en DIMM propietarios que se insertan en ocho ranuras DIMM reservadas para su uso.

ASIC de concentrador

El ASIC Hub interconecta los procesadores, la memoria y el XIO con la interconexión del sistema NUMAlink 2. El ASIC contiene cinco secciones principales: la barra transversal (conocida como "XB"), la interfaz de E/S (conocida como "II"), la interfaz de red (conocida como "NI"), la interfaz del procesador (conocida como "PI") y la interfaz de memoria y directorio (conocida como "DM"), que también sirve como controlador de memoria. Las interfaces se comunican entre sí a través de búferes FIFO que están conectados a la barra transversal. Cuando dos procesadores están conectados al ASIC Hub, el nodo no se comporta de manera SMP . En cambio, los dos procesadores funcionan por separado y sus buses se multiplexan sobre la interfaz de un solo procesador. Esto se hizo para ahorrar pines en el ASIC Hub. El ASIC Hub tiene una frecuencia de reloj de 100 MHz y contiene 900.000 puertas fabricadas en un proceso de metal de cinco capas.

Subsistema de E/S

El subsistema de E/S se basa en el ASIC Crossbow (Xbow), que comparte muchas similitudes con el ASIC SPIDER. Dado que el ASIC Xbow está pensado para su uso con el protocolo XIO, más sencillo, su hardware también es más sencillo, lo que permite que el ASIC tenga ocho puertos, en comparación con los seis puertos del ASIC SPIDER. Dos de los puertos se conectan a las placas de nodo y los seis restantes a las tarjetas XIO. Aunque el bus nativo del subsistema de E/S es XIO, también se pueden utilizar los buses PCI-X y VME64 , proporcionados por los puentes XIO.

En todos los sistemas hay una placa base de E/S IO6. Se trata de una tarjeta XIO que proporciona:

El IO6G (G de Graphics) tenía dos puertos seriales adicionales y puertos para teclado y mouse además de los puertos mencionados anteriormente. El IO6G era necesario en sistemas con tarjetas gráficas Onyx para conectar el teclado y el mouse.

Notas

  1. ^ ab "Silicon Graphics y Cray Research presentan la familia de servidores Modular Origin: los sistemas de gran ancho de banda revolucionan la economía de la compra de computadoras con una escalabilidad perfecta". Nota de prensa . 7 de octubre de 1996. Archivado desde el original el 7 de julio de 1997 . Consultado el 21 de septiembre de 2013 .
  2. ^ "Silicon Graphics renueva por completo sus estaciones y servidores". Computer Business Review . 7 de octubre de 1996.
  3. ^ "SGI Origin 2000 (ute): 1998–2002". Galería de supercomputadoras SCD . Centro Nacional de Investigación Atmosférica . Archivado desde el original el 21 de septiembre de 2013. Consultado el 21 de septiembre de 2013 .
  4. ^ "SGI Origin 2000 (dataproc): 1999–2004". Galería de supercomputadoras SCD . Centro Nacional de Investigación Atmosférica . Archivado desde el original el 25 de septiembre de 2013. Consultado el 21 de septiembre de 2013 .
  5. ^ "La NASA bautizará una supercomputadora con el nombre de un astronauta de Columbia". Nota de prensa . NASA. 10 de mayo de 2004 . Consultado el 21 de septiembre de 2013 .
  6. ^ Raymond D. Turney (22 de octubre de 2004). "Comparación de 250 MHz R10K Origin 2000 y 400 MHz Origin 2000 utilizando NAS Parallel Benchmarks" (PDF) . Informe técnico NAS 01-007 . Archivado desde el original (PDF) el 22 de diciembre de 2016. Consultado el 21 de septiembre de 2013 .
  7. ^ James Laudon; Daniel Lenoski (23 de febrero de 1997). "Descripción general del sistema de la línea de productos SGI Origin 200/2000". Actas IEEE COMPCON 97. Compendio de artículos . IEEE. págs. 150–156. doi :10.1109/CMPCON.1997.584688. ISBN. 978-0-8186-7804-2.S2CID16688054  .​
  8. ^ Daniel Lenoski; James Laudon; Truman Joe; David Nakahira; Luis Stevens; Anoop Gupta; John L. Hennessy (mayo de 1992). "El prototipo DASH: implementación y rendimiento". ACM Sigarch Computer Architecture News . 2 (2): 92–103. doi : 10.1145/146628.139706 .
  9. ^ James Laudon; Daniel Lenoski (mayo de 1997). "El origen de SGI: un servidor ccNUMA altamente escalable" (PDF) . ACM Sigarch Computer Architecture News . 25 (2): 241–251. doi :10.1145/384286.264206.
  10. ^ Mike Galles (1996). "Interconexión escalable por tuberías para enrutamiento distribuido de puntos finales: el chip SGI SPIDER". Actas del simposio Hot Interconnects . Universidad de Stanford: 141–146.

Cronología de la SGI

SGI PrismSGI Origin 3000 and Onyx 3000Origin 2000SGI ChallengeOnyx 300Onyx 2SGI OnyxSGI CrimsonSGI AltixSGI Origin 200SGI Indigo² and Challenge MSGI TezroSGI Octane2SGI OctaneSGI Indigo² and Challenge MSGI IRIS 4DSGI FuelSGI IndigoSGI IRIS 4DSGI O2SGI O2SGI IndySGI IRIS 4DSGI IRISSGI IRISSGI IRISVisual WorkstationSGI IRISSGI IRIS

Referencias

Enlaces externos