stringtranslate.com

Crayón-2

Un Cray-2 y su "cascada" de refrigeración Fluorinert , anteriormente con número de serie 2101, el único sistema de 8 procesadores jamás fabricado, para NERSC
Un Cray-2 operado por la NASA
Vista frontal del superordenador Cray-2 de 1985, Musée des Arts et Métiers , París
Vista lateral del superordenador Cray-2 de 1985, Musée des Arts et Métiers , París
Detalle de la parte superior del Cray-2
Dentro del Cray-2

El Cray-2 es un superordenador con cuatro procesadores vectoriales fabricado por Cray Research a partir de 1985. Con un rendimiento máximo de 1,9 GFLOPS , era la máquina más rápida del mundo cuando se lanzó al mercado, reemplazando al Cray X-MP en ese puesto. A su vez, fue reemplazado en ese puesto por el Cray Y-MP en 1988.

El Cray-2 fue el primero de los diseños de Seymour Cray en utilizar con éxito varias CPU. Esto se había intentado en el CDC 8600 a principios de la década de 1970, pero los transistores de lógica acoplada al emisor (ECL) de la época eran demasiado difíciles de empaquetar en una máquina funcional. El Cray-2 abordó este problema mediante el uso de circuitos integrados ECL , empaquetándolos en un novedoso cableado 3D que aumentó enormemente la densidad del circuito.

El denso envoltorio y las cargas térmicas resultantes fueron un problema importante para el Cray-2. Esto se resolvió de una manera única, forzando el líquido Fluorinert eléctricamente inerte a través del circuito bajo presión y luego enfriándolo fuera de la caja del procesador. El sistema de refrigeración en "cascada" único llegó a representar la informática de alto rendimiento a los ojos del público y se lo vio en muchas películas informativas y como accesorio cinematográfico durante algún tiempo.

A diferencia del Cray-1 original, el Cray-2 tuvo dificultades para ofrecer un rendimiento máximo. Otras máquinas de la empresa, como la X-MP y la Y-MP, superaron en ventas al Cray-2 por un amplio margen. Cuando Cray comenzó a desarrollar el Cray-3 , la empresa optó por desarrollar la serie Cray C90 en su lugar. Esta es la misma secuencia de eventos que ocurrió cuando se estaba desarrollando el 8600 y, como en ese caso, Cray abandonó la empresa.

Diseño inicial

Tras el exitoso lanzamiento de su famoso Cray-1 , Seymour Cray se dedicó a diseñar su sucesor. En 1979, se hartó de las interrupciones de la dirección en lo que ahora era una gran empresa y, como ya había hecho en el pasado, decidió renunciar a su puesto de dirección y mudarse para formar un nuevo laboratorio. Al igual que en su traslado original a Chippewa Falls, Wisconsin, desde la sede de Control Data en Minneapolis, Minnesota , la dirección de Cray comprendió sus necesidades y apoyó su traslado a un nuevo laboratorio en Boulder, Colorado . Trabajando como consultor independiente en estos nuevos laboratorios Cray, a partir de 1980 formó un equipo y comenzó a trabajar en un diseño completamente nuevo. Este laboratorio cerraría más tarde y una década más tarde se abriría una nueva instalación en Colorado Springs .

Cray había atacado previamente el problema del aumento de velocidad con tres avances simultáneos: más unidades funcionales para dar al sistema un mayor paralelismo, un empaquetado más compacto para disminuir los retrasos de la señal y componentes más rápidos para permitir una mayor velocidad de reloj. El ejemplo clásico de este diseño es el CDC 8600 , que empaquetó cuatro máquinas similares a la CDC 7600 basadas en lógica ECL en un cilindro de 1 × 1 metro y las hizo funcionar a una velocidad de ciclo de 8 ns (125 MHz ). Desafortunadamente, la densidad necesaria para lograr este tiempo de ciclo condujo a la caída de la máquina. Las placas de circuito en el interior estaban densamente empaquetadas y, dado que incluso un solo transistor defectuoso haría que fallara un módulo completo, empaquetar más de ellos en las tarjetas aumentaba enormemente la posibilidad de falla. Refrigerar los componentes individuales estrechamente empaquetados también representó un gran desafío.

Una solución a este problema, a la que ya se habían abocado la mayoría de los fabricantes de ordenadores, era utilizar circuitos integrados (CI) en lugar de componentes individuales. Cada CI incluía una selección de componentes de un módulo precableado en un circuito mediante el proceso de construcción automatizado. Si un CI no funcionaba, se probaba con otro. En la época en que se estaba diseñando el 8600, la sencilla tecnología basada en MOSFET no ofrecía la velocidad que Cray necesitaba. Sin embargo, las mejoras incesantes cambiaron las cosas a mediados de los años 70 y el Cray-1 había podido utilizar CI más nuevos y seguir funcionando a unos respetables 12,5 ns (80 MHz). De hecho, el Cray-1 era en realidad algo más rápido que el 8600 porque incorporaba mucha más lógica al sistema debido al pequeño tamaño de los CI.

Aunque el diseño de los circuitos integrados siguió mejorando, el tamaño físico de los mismos se vio limitado en gran medida por límites mecánicos; el componente resultante tenía que ser lo suficientemente grande como para soldarse en un sistema. Era posible lograr mejoras espectaculares en la densidad, como lo demostraba la rápida mejora en el diseño de microprocesadores , pero para el tipo de circuitos integrados que utilizaba Cray, los que representaban una parte muy pequeña de un circuito completo, el diseño se había estancado. Para obtener otro aumento de diez veces en el rendimiento con respecto al Cray-1, el objetivo que perseguía Cray, la máquina tendría que volverse más compleja. Por lo tanto, una vez más recurrió a una solución similar a la 8600, duplicando la velocidad del reloj mediante una mayor densidad, añadiendo más de estos procesadores más pequeños al sistema básico y luego intentando resolver el problema de sacar el calor de la máquina.

Otro problema de diseño era la creciente brecha de rendimiento entre el procesador y la memoria principal . En la era del CDC 6600, la memoria funcionaba a la misma velocidad que el procesador y el principal problema era introducir datos en ella. Cray lo solucionó añadiendo diez ordenadores más pequeños al sistema, lo que les permitía trabajar con el almacenamiento externo más lento (discos y cintas) y "meter" datos en la memoria cuando el procesador principal estaba ocupado. Esta solución ya no ofrecía ninguna ventaja; la memoria era lo suficientemente grande como para que se pudieran leer conjuntos de datos completos, pero los procesadores funcionaban mucho más rápido que la memoria y a menudo pasaban mucho tiempo esperando a que llegaran los datos. Añadir cuatro procesadores simplemente empeoró el problema.

Para evitar este problema, el nuevo diseño de la memoria bancaria y dos conjuntos de registros (los registros B y T) se reemplazaron por un bloque de 16 KWord de la memoria más rápida posible llamada memoria local, no una caché, uniendo los cuatro procesadores de fondo a ella con canales separados de alta velocidad. Esta memoria local recibía datos de un procesador de primer plano dedicado que, a su vez, estaba conectado a la memoria principal a través de un canal de Gbit/s por CPU; los X-MP, por el contrario, tenían tres, para dos cargas simultáneas y un almacenamiento, y los Y-MP/C-90 tenían cinco canales para evitar el cuello de botella de von Neumann . La tarea del procesador de primer plano era "hacer funcionar" la computadora, manejando el almacenamiento y haciendo un uso eficiente de los múltiples canales en la memoria principal. Impulsaba a los procesadores de fondo al pasar las instrucciones que debían ejecutar a través de ocho búferes de 16 palabras , en lugar de atar los canales de caché existentes a los procesadores de fondo. Las CPU modernas también utilizan una variación de este diseño, aunque el procesador en primer plano ahora se conoce como unidad de carga/almacenamiento y no es una máquina completa en sí misma.

Los bancos de memoria principal se organizaron en cuadrantes para que se pudiera acceder a ellos al mismo tiempo, lo que permitía a los programadores distribuir sus datos en la memoria para obtener un mayor paralelismo. La desventaja de este enfoque es que el costo de configurar la unidad de dispersión/recolección en el procesador de primer plano era bastante alto. Los conflictos de paso correspondientes a la cantidad de bancos de memoria sufrían una penalización de rendimiento (latencia), como ocurría ocasionalmente en algoritmos basados ​​en FFT de potencia de 2. Como el Cray 2 tenía una memoria mucho más grande que los Cray 1 o los X-MP, este problema se solucionó fácilmente agregando un elemento adicional sin usar a una matriz para distribuir el trabajo.

Placas de circuitos empaquetadas y nuevas ideas de diseño

Los primeros modelos Cray-2 pronto se basaron en un diseño que utilizaba grandes placas de circuitos llenas de circuitos integrados. Esto hacía que fuera extremadamente difícil soldarlas entre sí, y la densidad seguía sin ser suficiente para alcanzar sus objetivos de rendimiento. Los equipos trabajaron en el diseño durante unos dos años antes de que el propio Cray "se diera por vencido" y decidiera que lo mejor sería simplemente cancelar el proyecto y despedir a todos los que trabajaban en él. Les Davis, antiguo colaborador de diseño de Cray que había permanecido en la sede de Cray, decidió que debía continuar con la tarea con una prioridad baja. Después de algunos pequeños movimientos de personal, el equipo continuó prácticamente como antes.

Módulo lógico típico, que muestra el empaquetamiento compacto. Los pines pogo que conectan las tarjetas entre sí son las varillas de color dorado que se ven entre los circuitos integrados.

Seis meses después, Cray tuvo su momento de inspiración . Convocó a los ingenieros principales a una reunión y presentó una nueva solución al problema. En lugar de fabricar una placa de circuito más grande, cada "tarjeta" consistiría en una pila tridimensional de ocho, conectadas entre sí en el centro de las placas mediante pines que sobresalían de la superficie (conocidos como "pogos" o "z-pins"). Las tarjetas se colocaron unas sobre otras, por lo que la pila resultante tenía solo unos 30 mm de altura.

Con este tipo de densidad, no había forma de que funcionara ningún sistema convencional refrigerado por aire; había muy poco espacio para que el aire fluyera entre los circuitos integrados. En su lugar, el sistema se sumergiría en un tanque de un nuevo líquido inerte de 3M , Fluorinert . El líquido refrigerante se impulsaba lateralmente a través de los módulos bajo presión y el caudal era de aproximadamente una pulgada por segundo. El líquido calentado se enfriaba utilizando intercambiadores de calor de agua helada y se devolvía al tanque principal. El trabajo en el nuevo diseño comenzó en serio en 1982, varios años después de la fecha de inicio original.

Mientras esto sucedía, se estaba desarrollando el Cray X-MP bajo la dirección de Steve Chen en la sede de Cray, y parecía que le daría una seria competencia al Cray-2. Para abordar esta amenaza interna, así como una serie de máquinas japonesas más nuevas similares al Cray-1, el sistema de memoria del Cray-2 se mejoró drásticamente, tanto en tamaño como en número de "conductos" hacia los procesadores. Cuando finalmente se entregó la máquina en 1985, los retrasos habían sido tan largos que gran parte de sus beneficios de rendimiento se debían a la memoria más rápida. Comprar la máquina realmente tenía sentido solo para usuarios con grandes conjuntos de datos para procesar.

El primer Cray-2 que se entregó poseía más memoria física (256 MWord ) que todas las máquinas Cray entregadas anteriormente juntas. La simulación pasó de un ámbito 2-D o 3-D básico a un ámbito 3-D más fino porque el cálculo no tenía que depender de una memoria virtual lenta.

Usos y sucesores

El Cray-2 fue desarrollado principalmente para los Departamentos de Defensa y Energía de los Estados Unidos . Los usos tendían a ser para la investigación de armas nucleares o el desarrollo oceanográfico ( sonar ). Sin embargo, el primer Cray-2 (número de serie 1) se utilizó en el Centro Nacional de Computación de Energía de Fusión Magnética en el Laboratorio Nacional Lawrence Livermore para la investigación energética no clasificada. También encontró su camino en agencias civiles (como el Centro de Investigación Ames de la NASA ), universidades y corporaciones de todo el mundo. Por ejemplo, Ford y General Motors utilizaron el Cray-2 para procesar modelos complejos de análisis de elementos finitos de carrocerías de automóviles y para realizar pruebas de choque virtuales de componentes de carrocería antes de la producción.

El Cray-2 habría sido reemplazado por el Cray-3 , pero debido a problemas de desarrollo solo se construyó un único Cray-3 y nunca se pagó por él. El descendiente espiritual del Cray-2 es el Cray X1 , ofrecido por Cray .

Comparación con ordenadores posteriores

En 2012, Piotr Luszczek (un ex estudiante de doctorado de Jack Dongarra ) presentó resultados que demostraban que un iPad 2 igualaba el rendimiento histórico del Cray-2 en un benchmark LINPACK integrado . [1]

Trivialidades

Debido al uso de refrigeración líquida, el Cray-2 recibió el apodo de "Burbujas", y los chistes comunes alrededor de la computadora hacían referencia a este sistema único. Los chistes incluían carteles de "No pescar", representaciones de cartón del monstruo del Lago Ness saliendo del tanque del intercambiador de calor, peces de plástico dentro del intercambiador, etc. El consumo de energía del Cray-2 era de 150-200 kW. Las investigaciones realizadas en el Laboratorio Nacional Lawrence Livermore a principios de la década de 1990 indicaron que, en cierta medida, el poliéter perfluorado utilizado para enfriar los circuitos del Cray-2 se descompondría para formar el gas extremadamente tóxico perfluoroisobutileno . [2] En ese momento, Cray había creado un póster que mostraba la "cámara de burbujas" transparente por la que pasaba el fluido refrigerante para lograr un efecto visual, con un derrame del mismo material brillando en el piso; la broma era que si esto realmente ocurría, la instalación tendría que ser evacuada. [3] El fabricante del líquido desarrolló un depurador que podría colocarse en línea con la bomba y que degradaría catalíticamente este producto de descomposición tóxico.

Cada pila vertical de módulos lógicos se encontraba sobre una pila de módulos de potencia que alimentaban barras colectoras de 5 voltios , cada una de las cuales suministraba unos 2200 amperios. El Cray-2 estaba alimentado por dos motogeneradores que consumían 480 V trifásicos .

Véase también

Referencias

  1. ^ Larabel, Michael (16 de septiembre de 2012). «Apple iPad 2 tan rápido como la supercomputadora Cray-2». Archivado desde el original el 20 de febrero de 2015. Consultado el 19 de febrero de 2015 .
  2. ^ Kwan, J. Kelly, R, Miller G. Presentación en la Conferencia Americana de Higiene Industrial, Salt Lake City, UT, mayo de 1991
  3. ^ Kelly, RJ, Experiencia personal [¿ fuente poco confiable? ]

Enlaces externos