El tiempo medio de recuperación ( MTTR ) [1] [2] [3] es el tiempo promedio que tardará un dispositivo en recuperarse de cualquier falla. Los ejemplos de tales dispositivos van desde fusibles de reinicio automático (donde el MTTR sería muy corto, probablemente segundos), hasta sistemas completos que deben repararse o reemplazarse.
El MTTR normalmente sería parte de un contrato de mantenimiento, donde el usuario pagaría más por un MTTR del sistema de 24 horas que por uno de, digamos, 7 días. Esto no significa que el proveedor garantice que el sistema volverá a funcionar dentro de las 24 horas (o 7 días) posteriores a la notificación del fallo. Esto significa que el tiempo medio de reparación tenderá a las 24 horas (o 7 días). Una medida más útil del contrato de mantenimiento es el tiempo máximo de recuperación, que puede medirse fácilmente y responsabilizar al proveedor.
Tenga en cuenta que algunos proveedores interpretarán que MTTR significa "tiempo medio para responder" y otros lo interpretarán como "tiempo medio para reemplazar/reparar/recuperar/resolver". El primero indica que el proveedor reconocerá un problema e iniciará la mitigación dentro de un plazo determinado. Algunos sistemas pueden tener un MTTR de cero, lo que significa que tienen componentes redundantes que pueden tomar el control en el instante en que falla el principal; consulte RAID, por ejemplo. Sin embargo, el dispositivo fallido involucrado en esta configuración redundante aún debe volver a ponerse en servicio y, por lo tanto, el dispositivo en sí tiene un MTTR distinto de cero incluso si el sistema en su conjunto (mediante redundancia) tiene un MTTR de cero. Pero, mientras se mantenga el servicio, este es un problema menor.