El tiempo medio entre fallos ( MTBF ) es el tiempo transcurrido previsto entre fallos inherentes de un sistema mecánico o electrónico durante el funcionamiento normal del sistema. El MTBF se puede calcular como la media aritmética (promedio) del tiempo entre fallos de un sistema. El término se utiliza para sistemas reparables, mientras que el tiempo medio hasta el fallo ( MTTF ) denota el tiempo esperado hasta el fallo de un sistema no reparable. [1]
La definición de MTBF depende de la definición de lo que se considera una falla. En el caso de sistemas complejos y reparables , se considera que las fallas son aquellas que se encuentran fuera de las condiciones de diseño y que dejan al sistema fuera de servicio y en estado de reparación. Las fallas que se producen y que pueden dejarse o mantenerse en una condición sin reparar, y que no dejan al sistema fuera de servicio, no se consideran fallas según esta definición. [2] Además, las unidades que se desmontan para realizar un mantenimiento programado de rutina o para controlar el inventario no se consideran dentro de la definición de falla. [3] Cuanto mayor sea el MTBF, más tiempo es probable que funcione un sistema antes de fallar.
El tiempo medio entre fallos (MTBF) describe el tiempo esperado entre dos fallos en un sistema reparable. Por ejemplo, tres sistemas idénticos que comienzan a funcionar correctamente en el momento 0 siguen funcionando hasta que todos fallan. El primer sistema falla después de 100 horas, el segundo después de 120 horas y el tercero después de 130 horas. El MTBF de los sistemas es el promedio de los tres tiempos de fallo, que es de 116,667 horas. Si los sistemas no fueran reparables, su MTTF sería de 116,667 horas.
En general, MTBF es el "tiempo de actividad" entre dos estados de falla de un sistema reparable durante la operación, como se describe aquí:
Para cada observación, el "tiempo de inactividad" es el tiempo instantáneo en el que se produjo la inactividad, que es posterior (es decir, mayor que) al momento en el que se produjo la inactividad, el "tiempo de actividad". La diferencia ("tiempo de inactividad" menos "tiempo de actividad") es la cantidad de tiempo que estuvo en funcionamiento entre estos dos eventos.
Haciendo referencia a la figura anterior, el MTBF de un componente es la suma de las longitudes de los períodos operativos dividida por el número de fallas observadas:
De manera similar, el tiempo medio de inactividad (MDT) se puede definir como
El MTBF es el valor esperado de la variable aleatoria que indica el tiempo hasta el fallo. Por lo tanto, se puede escribir como [4]
donde es la función de densidad de probabilidad de . De manera equivalente, el MTBF se puede expresar en términos de la función de confiabilidad como
El MTBF y tienen unidades de tiempo (por ejemplo, horas).
Cualquier cálculo prácticamente relevante del MTBF supone que el sistema está funcionando dentro de su "período de vida útil", que se caracteriza por una tasa de fallos relativamente constante (la parte media de la " curva de la bañera ") cuando solo se producen fallos aleatorios. [1] En otras palabras, se supone que el sistema ha sobrevivido a las tensiones de configuración inicial y aún no se ha acercado a su final de vida esperado, los cuales a menudo aumentan la tasa de fallos.
Suponiendo una tasa de fallos constante implica que tiene una distribución exponencial con parámetro . Dado que el MTBF es el valor esperado de , se obtiene por el recíproco de la tasa de fallos del sistema, [1] [4]
Una vez que se conoce el MTBF de un sistema, y suponiendo una tasa de fallas constante, la probabilidad de que un sistema en particular esté operativo durante un período determinado se puede inferir [1] a partir de la función de confiabilidad de la distribución exponencial , . En particular, la probabilidad de que un sistema en particular sobreviva hasta su MTBF es , o aproximadamente 37% (es decir, fallará antes con una probabilidad del 63%). [5]
El valor MTBF se puede utilizar como parámetro de fiabilidad del sistema o para comparar diferentes sistemas o diseños. Este valor sólo debe entenderse condicionalmente como la “vida útil media” (un valor promedio), y no como una identidad cuantitativa entre unidades en funcionamiento y unidades averiadas. [1]
Dado que el MTBF se puede expresar como “vida media (expectativa)”, muchos ingenieros suponen que el 50% de los elementos habrán fallado en el momento t = MTBF. Esta inexactitud puede conducir a malas decisiones de diseño. Además, la predicción probabilística de fallas basada en el MTBF implica la ausencia total de fallas sistemáticas (es decir, una tasa de fallas constante con solo fallas aleatorias intrínsecas), lo que no es fácil de verificar. [4] Suponiendo que no hay errores sistemáticos, la probabilidad de que el sistema sobreviva durante una duración, T, se calcula como exp^(-T/MTBF). Por lo tanto, la probabilidad de que un sistema falle durante una duración T, está dada por 1 - exp^(-T/MTBF).
La predicción del valor MTBF es un elemento importante en el desarrollo de productos. Los ingenieros de confiabilidad y los ingenieros de diseño a menudo utilizan software de confiabilidad para calcular el MTBF de un producto según varios métodos y estándares (MIL-HDBK-217F, Telcordia SR332, Siemens SN 29500, FIDES, UTE 80-810 (RDF2000), etc.). El manual de la calculadora de confiabilidad Mil-HDBK-217 en combinación con el software RelCalc (u otra herramienta comparable) permite predecir los índices de confiabilidad MTBF en función del diseño.
Un concepto que está estrechamente relacionado con el MTBF y que es importante en los cálculos que involucran el MTBF es el tiempo medio de inactividad (MDT). El MDT se puede definir como el tiempo medio en el que el sistema está inactivo después de la falla. Por lo general, el MDT se considera diferente del MTTR (tiempo medio de reparación); en particular, el MDT generalmente incluye factores organizativos y logísticos (como días hábiles o espera para que lleguen los componentes), mientras que el MTTR generalmente se entiende como algo más limitado y más técnico.
MTBF es una métrica crucial para gestionar la confiabilidad de la maquinaria y el equipo. Su aplicación es particularmente significativa en el contexto del mantenimiento productivo total (TPM), una estrategia de mantenimiento integral destinada a maximizar la efectividad del equipo . MTBF proporciona una medida cuantitativa del tiempo transcurrido entre fallas de un sistema durante el funcionamiento normal, lo que ofrece información sobre la confiabilidad y el rendimiento del equipo de fabricación. [6]
Al integrar el MTBF con los principios del TPM, los fabricantes pueden lograr un enfoque de mantenimiento más proactivo. Esta sinergia permite la identificación de patrones y fallas potenciales antes de que ocurran, lo que permite el mantenimiento preventivo y reduce el tiempo de inactividad no planificado. Como resultado, el MTBF se convierte en un indicador clave de desempeño (KPI) dentro del TPM, que guía las decisiones sobre los cronogramas de mantenimiento, el inventario de repuestos y, en última instancia, optimiza la vida útil y la eficiencia de la maquinaria. [7] Este uso estratégico del MTBF dentro de los marcos del TPM mejora la eficiencia general de la producción, reduce los costos asociados con las averías y contribuye a la mejora continua de los procesos de fabricación.
Dos componentes (por ejemplo, discos duros, servidores, etc.) pueden estar dispuestos en una red, en serie o en paralelo . La terminología se utiliza aquí por analogía cercana a los circuitos eléctricos, pero tiene un significado ligeramente diferente. Decimos que los dos componentes están en serie si el fallo de cualquiera de ellos causa el fallo de la red, y que están en paralelo si sólo el fallo de ambos causa el fallo de la red. El MTBF de la red resultante de dos componentes con componentes reparables se puede calcular de acuerdo con las siguientes fórmulas, suponiendo que se conoce el MTBF de ambos componentes individuales: [8] [9]
¿Dónde está la red en la que los componentes están dispuestos en serie?
Para la red que contiene componentes reparables en paralelo, para averiguar el MTBF de todo el sistema, además de los MTBF de los componentes, también es necesario conocer sus respectivos MDT. Entonces, suponiendo que los MDT son insignificantes en comparación con los MTBF (lo que suele suceder en la práctica), el MTBF para el sistema paralelo que consta de dos componentes reparables en paralelo se puede escribir de la siguiente manera: [8] [9]
donde es la red en la que los componentes están dispuestos en paralelo, y es la probabilidad de falla del componente durante la "ventana de vulnerabilidad" .
Intuitivamente, ambas fórmulas se pueden explicar desde el punto de vista de las probabilidades de fallo. En primer lugar, observemos que la probabilidad de que un sistema falle en un determinado período de tiempo es la inversa de su MTBF. Entonces, al considerar una serie de componentes, el fallo de cualquier componente conduce al fallo de todo el sistema, por lo que (suponiendo que las probabilidades de fallo son pequeñas, lo que suele ser el caso) la probabilidad de fallo de todo el sistema en un intervalo dado se puede aproximar como una suma de las probabilidades de fallo de los componentes. Con componentes paralelos la situación es un poco más complicada: todo el sistema fallará si y solo si después de que falle uno de los componentes, el otro componente falla mientras se repara el primero; aquí es donde entra en juego la MDT: cuanto más rápido se repare el primer componente, menor será la "ventana de vulnerabilidad" para que falle el otro componente.
Usando una lógica similar, el MDT para un sistema de dos componentes en serie se puede calcular como: [8]
y para un sistema de dos componentes paralelos la MDT se puede calcular como: [8]
Mediante la aplicación sucesiva de estas cuatro fórmulas, se pueden calcular el MTBF y el MDT de cualquier red de componentes reparables, siempre que se conozcan el MTBF y el MDT de cada componente. En un caso especial pero muy importante de varios componentes en serie, el cálculo del MTBF se puede generalizar fácilmente a
lo cual puede demostrarse por inducción, [10] y asimismo
ya que la fórmula para la mdt de dos componentes en paralelo es idéntica a la del mtbf para dos componentes en serie.
Existen muchas variaciones de MTBF, como el tiempo medio entre interrupciones del sistema (MTBSA), el tiempo medio entre fallas críticas (MTBCF) o el tiempo medio entre retiros no programados (MTBUR). Esta nomenclatura se utiliza cuando se desea diferenciar entre tipos de fallas, como fallas críticas y no críticas. Por ejemplo, en un automóvil, la falla de la radio FM no impide el funcionamiento principal del vehículo.
Se recomienda utilizar el tiempo medio hasta el fallo (MTTF) en lugar de MTBF en los casos en que se reemplaza un sistema después de un fallo ("sistema no reparable"), ya que MTBF denota el tiempo entre fallos en un sistema que se pueden reparar. [1]
MTTFd es una extensión de MTTF y solo se ocupa de las fallas que podrían generar una condición peligrosa. Se puede calcular de la siguiente manera:
donde B 10 es el número de operaciones que un dispositivo realizará antes de que el 10% de una muestra de esos dispositivos falle y n op es el número de operaciones. B 10d es el mismo cálculo, pero donde el 10% de la muestra fallaría por peligro. n op es el número de operaciones/ciclo en un año. [11]
De hecho, el MTBF que cuenta solo los fallos con al menos algunos sistemas que aún están en funcionamiento y que aún no han fallado subestima el MTBF al no incluir en los cálculos las vidas medias parciales de los sistemas que aún no han fallado. Con tales vidas medias, todo lo que sabemos es que el tiempo hasta el fallo excede el tiempo que han estado funcionando. Esto se llama censura . De hecho, con un modelo paramétrico de la vida media, la probabilidad de que ocurra la falla en un día determinado es la siguiente :
dónde
Para una distribución exponencial constante , el riesgo, , es constante. En este caso, el MBTF es
donde es la estimación de máxima verosimilitud de , maximizando la verosimilitud dada anteriormente y es el número de observaciones sin censura.
Vemos que la diferencia entre el MTBF que considera solo las fallas y el MTBF que incluye las observaciones censuradas es que los tiempos de censura se suman al numerador pero no al denominador al calcular el MTBF. [12]