Cell (microprocesador)

[4]​ La primera gran aplicación comercial del Cell fue la videoconsola PlayStation 3 de Sony.

[7]​[8]​ Existe un vídeo tutorial sobre cómo programar el Cell a disposición del público.

[10]​ En el año 2000, Sony Computer Entertainment, Toshiba Corporation, e IBM formaron una alianza (STI) para diseñar y manufacturar el procesador.

[11]​ Durante este periodo, IBM registró diversas patentes relacionadas con la arquitectura Cell, el proceso de fabricación y el entorno software.

[19]​ Mercury ha comercializado desde entonces blades, servidores convencionales en armario y aceleradoras PCI-Express con procesadores Cell.

Mercury e IBM hacen uso del procesador Cell al completo, con sus 8 SPEs activas.

En un análisis simple, el procesador Cell se puede descomponer en cuatro partes: Para alcanzar el alto rendimiento necesario para tareas matemáticas intensivas, tales como decodificar o codificar secuencias MPEG, generar o transformar datos 3D, o llevar a cabo análisis Fourier de datos, el procesador Cell aúna las SPE y el PPE por medio del EIB para proporcionarles acceso tanto a la memoria principal como a dispositivos externos de almacenamiento.

El PPE, que es capaz de ejecutar un sistema operativo convencional, posee el control sobre las SPEs y puede comenzar, interrumpir y programar procesos para que se ejecuten en las mismas.

[20]​ Junto al QS22 y la computadora RoadRunner, el procesador PowerXCell también está disponible como un acelerador en una tarjeta PCI-Express y se utiliza como el procesador de núcleo en el proyecto QPACE.

El conocido CDC6600 empleaba un único procesador, muy rápido, para manejar los cálculos matemáticos, mientras que diez sistemas de menor velocidad ejecutaban programas más pequeños para así mantener a la memoria principal alimentada con datos.

El PPE trabaja con sistemas operativos convencionales debido a su similitud con otros procesadores Power PC de 64 bit, mientras que las SPEs están diseñadas para la ejecución de código vectorizado en coma flotante.

Adicionalmente, IBM ha incorporado una unidad Altivec,[22]​ la cual se encuentra configurada para procesar datos de coma flotante en doble precisión mediante pipelines.

El almacenamiento local no opera como la caché de una CPU convencional, ya que no es ni transparente al software ni contiene estructuras para la predicción de los datos a cargar.

Para datos en precisión doble, usualmente empleados en computadores personales, el rendimiento del Cell decrece considerablemente, pero aún alcanza los 12,8 GFLOPS.

[23]​ Toshiba ha desarrollado un coprocesador operado por cuatro SPEs y ningún PPE, llamado SpursEngine, que está diseñado para acelerar 3D y efectos de películas en electrónica de consumo.

A un canal EIB no se le permite comunicar datos que requieran más de seis pasos.

A pesar del deseo original de IBM de implementar el EIB como un conmutador (crossbar) más potente, la configuración circular que adoptaron para economizar recursos en muy raras ocasiones representa un factor limitador en el rendimiento del chip Cell como un todo.

[29]​ Sin embargo, otras restricciones técnicas se ven involucradas en el mecanismo de arbitraje para los paquetes que son aceptados en el bus.

En la práctica el ancho de banda efectivo del EIB puede también estar limitado por los participantes involucrados en el anillo.

El valor teórico de 204,8 GB/s, el más citado, es el mejor a tener en cuenta, considerando cualesquiera otros aspectos.

La controladora adaptadora de memoria (MIC) está separada del macro XIO y ha sido diseñada por IBM.

El adaptador de sistema empleado en Cell, también un diseño Rambus, es conocido como FlexIO.

La interface FlexIO puede poseer una frecuencia de reloj independiente (típicamente, a 3,2 GHz).

Empresas como Blizzard utilizan este tipo de servidores para alojar sus juegos en línea masivos.

Se dice que esta combinación producirá el primer computador capaz de operar a la velocidad del petaflop.

Usará una versión actualizada del procesador Cell, fabricada con tecnología de 65 nm y con SPUs mejoradas que puedan manejar cálculos en doble precisión en los registros de 128 bits, alcanzando los 100 GFLOPS en doble precisión.

[41]​ El factor principal para comprobar si Cell llega a desarrollar su potencial de rendimiento es la adaptación del software.

Las tareas se sincronizan empleando semáforos o multitexes tal y como ocurre en sistemas operativos convencionales.

Las tareas listas para su ejecución esperan en una cola a que las SPE las ejecute.

[46]​ Tanto el PPE como las SPEs se pueden programar en C/C++ empleando una API común que proporcionan librerías.

El procesador Cell B.E. de una placa principal de la PS3.
Peter Hofstee , uno de los jefes de arquitectos del Cell.
Esquema del procesador Cell.
Esquema del PPE.
Esquema del SPE.
Toshiba Cell Regza 55X1