Tolerancia a fallos es particularmente buscado en sistemas de alta disponibilidad.
La recuperación en retroceso requiere que las operaciones entre el puesto de control y los errores detectados pueda ser inalterable.
Un neumático llano pinchado puede ser utilizado por una cantidad tiempo limitado a una velocidad reducida.
Por ejemplo, grandes camiones de carga pueden perder un neumático sin mayores consecuencias.
Proveer un diseño tolerante de fallos para cada componente no siempre tiene que ser una opción.
Por tanto, agregar cinturones de seguridad para todos los vehículos es una excelente idea.
Una máquina tolerante de fallos rígida utiliza elementos replicados funcionando en paralelo.
En cualquier momento, todas las repeticiones de cada elemento deben estar en el mismo estado.
Una máquina con dos repeticiones de cada elemento se denomina redundancia modular dual (RMD).
La votación del circuito sólo puede detectar una discrepancia y la recuperación depende de otros métodos.
Una máquina con tres repeticiones de cada elemento se denomina redundancia modular triple (RMT).
Este modelo se puede aplicar a cualquier mayor número de replicaciones.
Las ventajas de los diseños orientados a fallos son evidentes, mientras que muchos de sus inconvenientes no: El hardware con tolerancia a fallos requiere a veces que las piezas rotas pueden ser extraídas y reemplazadas por nuevas piezas mientras el sistema sigue funcionando (en informática conocido como sustitución en caliente).
Los formatos de datos también pueden ser diseñados para degradarse correctamente.
El lenguaje HTML por ejemplo, está diseñado para ser compatible, lo cual permite a los navegadores web ignorar las nuevas entidades HTML que no entienden sin provocar que el documento sea inutilizable.
Hay una diferencia entre tolerancia a fallos y sistemas que rara vez tienen problemas.