stringtranslate.com

Sorpresa por un solo evento

Se sospecha que un fallo aislado en las computadoras de vuelo de este Airbus A330 durante el vuelo 72 de Qantas el 7 de octubre de 2008 dio lugar a un fallo de funcionamiento de la aeronave que casi terminó en un accidente después de que las computadoras experimentaran varias fallas. [1]

Un error de evento único ( SEE, por sus siglas en inglés), también conocido como un error de evento único ( SEU , por sus siglas en inglés), es un cambio de estado causado por una sola partícula ionizante (por ejemplo, iones, electrones, fotones) que golpea un nodo sensible en un dispositivo microelectrónico activo, como un microprocesador , una memoria de semiconductores o transistores de potencia . El cambio de estado es el resultado de la carga libre creada por la ionización en o cerca de un nodo importante de un elemento lógico (por ejemplo, un "bit" de memoria). El error en la salida o el funcionamiento del dispositivo causado como resultado del impacto se denomina SEU o error suave .

El SEU en sí no se considera que dañe permanentemente la funcionalidad de los transistores o circuitos, a diferencia del caso del enclavamiento de evento único (SEL), la ruptura de compuerta de evento único (SEGR) o la quema de evento único (SEB). Todos estos son ejemplos de una clase general de efectos de radiación en dispositivos electrónicos llamados efectos de evento único (SEEs).

Historia

Las anomalías de un solo evento se describieron por primera vez durante las pruebas nucleares sobre la superficie , de 1954 a 1957, cuando se observaron muchas anomalías en los equipos de monitoreo electrónico. Se observaron más problemas en la electrónica espacial durante la década de 1960, aunque era difícil separar las fallas leves de otras formas de interferencia. En 1972, un satélite Hughes experimentó una anomalía en la que la comunicación con el satélite se perdió durante 96 segundos y luego se recuperó. Los científicos Dr. Edward C. Smith, Al Holman y Dr. Dan Binder explicaron la anomalía como una anomalía de un solo evento (SEU) y publicaron el primer artículo SEU en la revista IEEE Transactions on Nuclear Science en 1975. [2] En 1978, Timothy C. May y MH Woods describieron la primera evidencia de errores leves de partículas alfa en materiales de embalaje . En 1979, James Ziegler de IBM , junto con W. Lanford de Yale , describieron por primera vez el mecanismo por el cual un rayo cósmico a nivel del mar podría causar una perturbación de un solo evento en la electrónica. En 1979 también se realizó la primera prueba de "efectos de un solo evento" de iones pesados ​​del mundo en una instalación de acelerador de partículas, realizada en el ciclotrón y Bevatron de 88 pulgadas del Laboratorio Nacional Lawrence Berkeley . [3]

Causa

Los SEU terrestres surgen debido a que las partículas cósmicas chocan con los átomos de la atmósfera, lo que crea cascadas o lluvias de neutrones y protones, que a su vez pueden interactuar con los circuitos electrónicos. En geometrías submicrónicas profundas, esto afecta a los dispositivos semiconductores en la atmósfera.

En el espacio, existen partículas ionizantes de alta energía como parte del fondo natural, conocidas como rayos cósmicos galácticos (GCR). Los eventos de partículas solares y los protones de alta energía atrapados en la magnetosfera de la Tierra ( cinturones de radiación de Van Allen ) exacerban este problema. Las altas energías asociadas con el fenómeno en el entorno de partículas espaciales generalmente hacen que el aumento del blindaje de las naves espaciales sea inútil en términos de eliminar los SEU y los fenómenos catastróficos de un solo evento (por ejemplo, el enganche destructivo ). Los neutrones atmosféricos secundarios generados por los rayos cósmicos también pueden tener una energía lo suficientemente alta como para producir SEU en la electrónica en vuelos de aeronaves sobre los polos o a grandes altitudes. Las cantidades traza de elementos radiactivos en los paquetes de chips también dan lugar a SEU.

Prueba de sensibilidad de SEU

La sensibilidad de un dispositivo a la energía electromagnética se puede estimar empíricamente colocando un dispositivo de prueba en una corriente de partículas en un ciclotrón u otro acelerador de partículas . Esta metodología de prueba particular es especialmente útil para predecir la tasa de error suave (SER, soft error rate) en entornos espaciales conocidos, pero puede ser problemática para estimar la SER terrestre a partir de neutrones. En este caso, se debe evaluar una gran cantidad de piezas, posiblemente a diferentes altitudes, para encontrar la tasa real de alteración.

Otra forma de estimar empíricamente la tolerancia al SEU es utilizar una cámara protegida de la radiación, con una fuente de radiación conocida, como el cesio-137 .

Al probar microprocesadores para SEU, también se debe evaluar el software utilizado para ejercitar el dispositivo para determinar qué secciones del dispositivo se activaron cuando se produjeron SEU.

SEU y diseño de circuitos

Por definición, las SEU no destruyen los circuitos involucrados, pero pueden causar errores. En los microprocesadores basados ​​en el espacio, una de las partes más vulnerables a menudo son las memorias caché de 1er y 2do nivel, porque estas deben ser muy pequeñas y tener una velocidad muy alta, lo que significa que no retienen mucha carga. A menudo, estas cachés se desactivan si se configuran diseños terrestres para sobrevivir a las SEU. Otro punto de vulnerabilidad es la máquina de estados en el control del microprocesador, por el riesgo de entrar en estados "muertos" (sin salidas), sin embargo, estos circuitos deben impulsar todo el procesador, por lo que tienen transistores relativamente grandes para proporcionar corrientes eléctricas relativamente grandes y no son tan vulnerables como se podría pensar. Otro componente vulnerable del procesador es la RAM, y más específicamente la RAM estática (SRAM) utilizada en las memorias caché. Las memorias SRAM generalmente se diseñan con tamaños de transistores cercanos al mínimo permitido por la tecnología para asignar el número máximo de bits por unidad de área. Los tamaños pequeños de transistores y la alta densidad de bits hacen que las memorias sean uno de los componentes más susceptibles a las SEU. [4] Para garantizar la resiliencia a los SEU, a menudo se utiliza una memoria de corrección de errores , junto con circuitos para leer periódicamente (lo que lleva a la corrección) o limpiar (si la lectura no lleva a la corrección) la memoria de errores, antes de que los errores abrumen los circuitos de corrección de errores.

En circuitos digitales y analógicos, un solo evento puede provocar que uno o más pulsos de voltaje (es decir, fallas) se propaguen a través del circuito, en cuyo caso se lo denomina transitorio de evento único (SET). Dado que el pulso que se propaga no es técnicamente un cambio de "estado" como en una unidad lógica secuencial (SEU) de memoria, se debe diferenciar entre SET y SEU. Si un SET se propaga a través de circuitos digitales y da como resultado que se bloquee un valor incorrecto en una unidad lógica secuencial, se lo considera un SEU.

Los problemas de hardware también pueden ocurrir por razones relacionadas. Bajo ciertas circunstancias (tanto de diseño de circuitos, diseño de procesos y propiedades de partículas) un tiristor " parásito " inherente a los diseños CMOS puede activarse, causando efectivamente un aparente cortocircuito entre la alimentación y la tierra. Esta condición se conoce como bloqueo y, en ausencia de contramedidas constructivas, a menudo destruye el dispositivo debido a una fuga térmica . La mayoría de los fabricantes diseñan para evitar el bloqueo y prueban sus productos para garantizar que el bloqueo no se produzca por impactos de partículas atmosféricas. Para evitar el bloqueo en el espacio, a menudo se utilizan sustratos epitaxiales , silicio sobre aislante (SOI) o silicio sobre zafiro (SOS) para reducir aún más o eliminar la susceptibilidad.

SEU notable

Véase también

Referencias

  1. ^ Preguntas frecuentes sobre perturbaciones de evento único inducidas por neutrones (SEU), Microsemi Corporation , consultado el 7 de octubre de 2018. La causa se ha rastreado hasta errores en una computadora de a bordo que se sospecha que fueron inducidos por rayos cósmicos.
  2. ^ Binder, Smith, Holman (1975). "Anomalías satelitales causadas por rayos cósmicos galácticos". IEEE Transactions on Nuclear Science . NS-22, núm. 6 (6): 2675–2680. Bibcode :1975ITNS...22.2675B. doi :10.1109/TNS.1975.4328188. S2CID  3032512 – vía IEEE Explore.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
  3. ^ Petersen, Koga, Shoga, Pickel y Price (2013). "La revolución del evento único". IEEE Transactions on Nuclear Science . Vol. 60, N.º 3.
  4. ^ Torrens, G.; Alheyasat, A.; Alorda, B.; Barcelo, S.; Segura, J.; Bota, SA (2020). "Efecto del ancho del transistor en la dependencia del voltaje de la fuente de alimentación de α-SER en SRAM CMOS de 6T". IEEE Transactions on Nuclear Science . 67 (5): 811–817. Bibcode :2020ITNS...67..811T. doi :10.1109/TNS.2020.2983586. ISSN  0018-9499. S2CID  216198845.
  5. ^ Ian Johnston (17 de febrero de 2017). «Las partículas cósmicas pueden alterar las elecciones y hacer que los aviones caigan por el cielo, advierten los científicos». The Independent . Consultado el 5 de septiembre de 2018 .
  6. ^ La amenaza invisible de los neutrones (2012), Target 4 Flight Path 30L Publications, Laboratorio Nacional de Los Álamos

Lectura adicional

Generalidades del SEU
SEU en dispositivos lógicos programables
SEU en microprocesadores
Tesis de maestría y disertaciones doctorales relacionadas con SEU