Frecuencia con la que falla un sistema o componente diseñado
La tasa de fallas es la frecuencia con la que falla un sistema o componente diseñado, expresada en fallas por unidad de tiempo. Generalmente se denota con la letra griega λ (lambda) y se utiliza a menudo en ingeniería de confiabilidad .
La tasa de fallas de un sistema depende generalmente del tiempo y varía a lo largo de su ciclo de vida. Por ejemplo, la tasa de fallas de un automóvil en su quinto año de servicio puede ser mucho mayor que la tasa de fallas durante su primer año de servicio. No se espera que en un vehículo nuevo se reemplace un tubo de escape, se revisen los frenos o se tengan problemas importantes en la transmisión .
En la práctica, a menudo se informa el tiempo medio entre fallos (MTBF, 1/λ) en lugar de la tasa de fallos. Esto es válido y útil si se puede suponer que la tasa de fallos es constante (se utiliza a menudo para unidades/sistemas complejos, electrónica) y es un acuerdo general en algunas normas de fiabilidad (militares y aeroespaciales). En este caso, solo se relaciona con la región plana de la curva de la bañera , que también se denomina "periodo de vida útil". Debido a esto, es incorrecto extrapolar el MTBF para obtener una estimación de la vida útil de un componente, que normalmente será mucho menor que la sugerida por el MTBF debido a las tasas de fallos mucho más altas en la parte de "desgaste al final de la vida útil" de la "curva de la bañera".
La razón del uso preferido de números MTBF es que el uso de números positivos grandes (como 2000 horas) es más intuitivo y más fácil de recordar que números muy pequeños (como 0,0005 por hora).
El MTBF es un parámetro importante en sistemas en los que es necesario gestionar la tasa de fallos, en particular en los sistemas de seguridad. El MTBF aparece con frecuencia en los requisitos de diseño de ingeniería y regula la frecuencia de las inspecciones y el mantenimiento del sistema necesarios. En procesos especiales denominados procesos de renovación , en los que se puede despreciar el tiempo de recuperación de un fallo y la probabilidad de que se produzca un fallo permanece constante con respecto al tiempo, la tasa de fallos es simplemente el inverso multiplicativo del MTBF (1/λ).
Una relación similar utilizada en las industrias de transporte , especialmente en ferrocarriles y camiones, es la "distancia media entre fallos", una variación que intenta correlacionar las distancias reales cargadas con necesidades y prácticas de confiabilidad similares.
Las tasas de fallas son factores importantes en las industrias de seguros, finanzas, comercio y regulación y son fundamentales para el diseño de sistemas seguros en una amplia variedad de aplicaciones.
Datos de tasa de fallos
Los datos sobre la tasa de fallos se pueden obtener de varias formas. Los medios más habituales son:
Estimación
A partir de los informes de índices de fallas en el campo, se pueden utilizar técnicas de análisis estadístico para estimar los índices de fallas. Para obtener índices de fallas precisos, el analista debe tener un buen conocimiento del funcionamiento del equipo, los procedimientos para la recopilación de datos, las variables ambientales clave que afectan los índices de fallas, cómo se utiliza el equipo a nivel del sistema y cómo los diseñadores del sistema utilizarán los datos de fallas.
Datos históricos sobre el dispositivo o sistema en consideración
Muchas organizaciones mantienen bases de datos internas con información sobre fallas en los dispositivos o sistemas que producen, que se pueden utilizar para calcular las tasas de fallas de esos dispositivos o sistemas. En el caso de dispositivos o sistemas nuevos, los datos históricos de dispositivos o sistemas similares pueden servir como una estimación útil.
Datos sobre la tasa de fracaso comercial y gubernamental
Existen manuales con datos sobre la tasa de fallas de varios componentes disponibles en fuentes gubernamentales y comerciales. MIL-HDBK-217F, Predicción de confiabilidad de equipos electrónicos , es una norma militar que proporciona datos sobre la tasa de fallas de muchos componentes electrónicos militares. Existen varias fuentes de datos sobre la tasa de fallas disponibles comercialmente que se centran en componentes comerciales, incluidos algunos componentes no electrónicos.
Predicción
El desfase temporal es uno de los graves inconvenientes de todas las estimaciones de la tasa de fallos. A menudo, cuando se dispone de los datos de la tasa de fallos, los dispositivos en estudio ya han quedado obsoletos. Debido a este inconveniente, se han desarrollado métodos de predicción de la tasa de fallos. Estos métodos se pueden utilizar en dispositivos de nuevo diseño para predecir las tasas de fallos y los modos de fallo del dispositivo. Se han hecho muy conocidos dos enfoques: las pruebas de ciclo y el análisis de datos de fallas mecánicas y moleculares.
Prueba de vida
La fuente de datos más precisa es probar muestras de los dispositivos o sistemas reales para generar datos sobre fallas. Esto suele ser prohibitivamente costoso o poco práctico, por lo que a menudo se utilizan en su lugar las fuentes de datos anteriores.
Prueba de ciclo
El movimiento mecánico es el mecanismo de falla predominante que provoca el desgaste de los dispositivos mecánicos y electromecánicos. En muchos dispositivos, el punto de falla por desgaste se mide por la cantidad de ciclos realizados antes de que el dispositivo falle, y se puede descubrir mediante pruebas de ciclo. En las pruebas de ciclo, se somete a un dispositivo a un ciclo tan rápido como sea posible hasta que falle. Cuando se prueba un conjunto de estos dispositivos, la prueba se realizará hasta que el 10 % de las unidades fallen peligrosamente.
FMEDA
El análisis de modos de falla, efectos y diagnóstico (FMEDA) es una técnica de análisis sistemático para obtener índices de falla, modos de falla y resistencia de diseño a nivel de subsistema/producto. La técnica FMEDA considera:
Todos los componentes de un diseño,
La funcionalidad de cada componente,
Los modos de fallo de cada componente,
El efecto de cada modo de falla del componente en la funcionalidad del producto,
La capacidad de cualquier diagnóstico automático para detectar el fallo,
La resistencia de diseño (reducción de potencia, factores de seguridad) y
El perfil operacional (factores de estrés ambiental).
Dada una base de datos de componentes calibrada con datos de fallas de campo que sean razonablemente precisos [1]
, el método puede predecir la tasa de fallas a nivel de producto y los datos del modo de falla para una aplicación determinada. Se ha demostrado que las predicciones son más precisas [2] que el análisis de devolución de garantía de campo o incluso el análisis de fallas de campo típico, dado que estos métodos dependen de informes que normalmente no tienen suficiente información detallada en los registros de fallas. [3]
Tasa de fallos en sentido discreto
La tasa de fallos se puede definir de la siguiente manera:
El número total de fallas dentro de una población de elementos , dividido por el tiempo total empleado por esa población, durante un intervalo de medición particular bajo condiciones establecidas. (MacDiarmid, et al. )
Aunque la tasa de fallos, , se considera a menudo como la probabilidad de que se produzca un fallo en un intervalo especificado si no se produce ningún fallo antes del tiempo , en realidad no es una probabilidad porque puede superar 1. La expresión errónea de la tasa de fallos en % podría dar lugar a una percepción incorrecta de la medida, especialmente si se mide a partir de sistemas reparables y de múltiples sistemas con tasas de fallos no constantes o diferentes tiempos de funcionamiento. Se puede definir con la ayuda de la función de fiabilidad , también denominada función de supervivencia, , la probabilidad de que no se produzca ningún fallo antes del tiempo .
, donde es la distribución del tiempo hasta la (primera) falla (es decir, la función de densidad de fallas).
durante un intervalo de tiempo = desde (o ) hasta . Nótese que esta es una probabilidad condicional , donde la condición es que no haya ocurrido ningún fallo antes del tiempo . Por lo tanto, en el denominador.
La tasa de riesgo y la tasa de ocurrencia de fallas (ROCOF) a menudo se consideran incorrectamente como iguales a la tasa de fallas. [ Aclaración necesaria ] Para aclarar: cuanto más rápidamente se reparen los artículos, antes se romperán nuevamente, por lo que mayor será la ROCOF. Sin embargo, la tasa de riesgo es independiente del tiempo de reparación y del tiempo de demora logística.
Tasa de fallos en sentido continuo
Calcular la tasa de fallos para intervalos de tiempo cada vez más pequeños da como resultado:Función de riesgo (también llamadatasa de riesgo),que se convierte en lainstantáneao, como decimos, tasa de riesgo instantánea a medida quese acerca a cero:
Una tasa de fallos continua depende de la existencia de una distribución de fallos , , que es una función de distribución acumulativa que describe la probabilidad de fallo (al menos) hasta el tiempo t inclusive ,
donde es el tiempo de falla. La función de distribución de fallas es la integral de la función de densidad de fallas , f ( t ),
Una tasa de falla decreciente (DFR) describe un fenómeno en el que la probabilidad de un evento en un intervalo de tiempo fijo en el futuro disminuye con el tiempo. Una tasa de falla decreciente puede describir un período de "mortalidad infantil" en el que las fallas anteriores se eliminan o corrigen [4] y corresponde a la situación en la que λ( t ) es una función decreciente .
Para un proceso de renovación con función de renovación DFR, los tiempos entre renovaciones son cóncavos. [5] [6] Brown conjeturó lo contrario, que la DFR también es necesaria para que los tiempos entre renovaciones sean cóncavos, [7] sin embargo se ha demostrado que esta conjetura no se cumple ni en el caso discreto [6] ni en el caso continuo. [8]
Aplicaciones
El aumento de la tasa de fallos es un concepto intuitivo causado por el desgaste de los componentes. La disminución de la tasa de fallos describe un sistema que mejora con el tiempo. [9]
Se han encontrado tasas de fallos decrecientes en la vida útil de las naves espaciales, Baker y Baker comentaron que "las naves espaciales que duran, duran una y otra vez". [10] [11] Se encontró que la confiabilidad de los sistemas de aire acondicionado de las aeronaves tenía una distribución exponencial de manera individual y, por lo tanto, en la población agrupada, una DFR. [9]
Coeficiente de variación
Cuando la tasa de fallas disminuye, el coeficiente de variación es ⩾ 1, y cuando la tasa de fallas aumenta, el coeficiente de variación es ⩽ 1. [12] Nótese que este resultado solo es válido cuando la tasa de fallas se define para todo t ⩾ 0 [13] y que el resultado inverso (coeficiente de variación que determina la naturaleza de la tasa de fallas) no es válido.
Unidades
Las tasas de fallas se pueden expresar utilizando cualquier unidad de medida de tiempo, pero las horas son la unidad más común en la práctica. También se pueden utilizar otras unidades, como millas, revoluciones, etc., en lugar de unidades de "tiempo".
Las tasas de fallas a menudo se expresan en notación de ingeniería como fallas por millón, o 10 −6 , especialmente para componentes individuales, ya que sus tasas de fallas suelen ser muy bajas.
La tasa de fallas en el tiempo ( FIT ) de un dispositivo es la cantidad de fallas que se pueden esperar en mil millones (10 9 ) de horas-dispositivo de operación. [14]
(Por ejemplo, 1000 dispositivos durante 1 millón de horas, o 1 millón de dispositivos durante 1000 horas cada uno, o alguna otra combinación). Este término se utiliza particularmente en la industria de semiconductores .
La relación entre FIT y MTBF se puede expresar como: MTBF = 1.000.000.000 x 1/FIT.
Aditividad
Bajo ciertas suposiciones de ingeniería (por ejemplo, además de las suposiciones anteriores para una tasa de falla constante, la suposición de que el sistema considerado no tiene redundancias relevantes ), la tasa de falla para un sistema complejo es simplemente la suma de las tasas de falla individuales de sus componentes, siempre que las unidades sean consistentes, por ejemplo, fallas por millón de horas. Esto permite probar componentes o subsistemas individuales, cuyas tasas de falla luego se suman para obtener la tasa de falla total del sistema. [15] [16]
Añadir componentes "redundantes" para eliminar un único punto de falla mejora la tasa de fallas de la misión, pero empeora la tasa de fallas en serie (también llamada tasa de fallas logísticas): los componentes adicionales mejoran el tiempo medio entre fallas críticas (MTBCF), aunque el tiempo medio antes de que algo falle es peor. [17]
Ejemplo
Supongamos que se desea estimar la tasa de fallas de un determinado componente. Se puede realizar una prueba para estimar su tasa de fallas. Se prueban diez componentes idénticos hasta que fallan o alcanzan las 1000 horas, momento en el cual se da por finalizada la prueba para ese componente. (El nivel de confianza estadística no se considera en este ejemplo). Los resultados son los siguientes:
La tasa de falla estimada es
o 799,8 fallos por cada millón de horas de funcionamiento.
^ Manual de confiabilidad de componentes eléctricos y mecánicos. exida. 2006.
^ Goble, William M.; Iwan van Beurden (2014). Combinación de datos de fallas de campo con nuevos márgenes de diseño de instrumentos para predecir tasas de fallas para la verificación de SIS . Actas del Simposio Internacional 2014 - MÁS ALLÁ DEL CUMPLIMIENTO NORMATIVO, HACIENDO QUE LA SEGURIDAD SEA UNA SEGUNDA NATURALEZA, Hilton College Station-Conference Center, College Station, Texas.
^ WM Goble, "Datos sobre fallas de campo: lo bueno, lo malo y lo feo", exida, Sellersville, PA [1]
^ Finkelstein, Maxim (2008). "Introducción". Modelado de la tasa de fallas para confiabilidad y riesgo . Springer Series in Reliability Engineering. págs. 1–84. doi :10.1007/978-1-84800-986-8_1. ISBN978-1-84800-985-1.
^ ab Brown, M. (1980). "Límites, desigualdades y propiedades de monotonía para algunos procesos de renovación especializados". Anales de probabilidad . 8 (2): 227–240. doi : 10.1214/aop/1176994773 . JSTOR 2243267.
^ ab Shanthikumar, JG (1988). "Propiedad DFR de los tiempos de primer paso y su conservación bajo composición geométrica". Anales de probabilidad . 16 (1): 397–406. doi : 10.1214/aop/1176991910 . JSTOR 2243910.
^ Brown, M. (1981). "Propiedades de monotonía adicionales para procesos de renovación especializados". Anales de probabilidad . 9 (5): 891–895. doi : 10.1214/aop/1176994317 . JSTOR 2243747.
^ Yu, Y. (2011). "Las funciones de renovación cóncavas no implican tiempos de interrenovación DFR". Journal of Applied Probability . 48 (2): 583–588. arXiv : 1009.2463 . doi :10.1239/jap/1308662647. S2CID 26570923.
^ ab Proschan, F. (1963). "Explicación teórica de la tasa de fallos decreciente observada". Technometrics . 5 (3): 375–383. doi :10.1080/00401706.1963.10490105. JSTOR 1266340.
^ Baker, JC; Baker, GAS . (1980). "Impacto del entorno espacial en la vida útil de las naves espaciales". Journal of Spacecraft and Rockets . 17 (5): 479. Bibcode :1980JSpRo..17..479B. doi :10.2514/3.28040.
^ Saleh, Joseph Homer; Castet, Jean-François (2011). "Sobre el tiempo, la fiabilidad y las naves espaciales". Fiabilidad de las naves espaciales y fallos multiestado . p. 1. doi :10.1002/9781119994077.ch1. ISBN9781119994077.
^ Wierman, A. ; Bansal, N.; Harchol-Balter, M. (2004). "Una nota sobre la comparación de los tiempos de respuesta en las colas M/GI/1/FB y M/GI/1/PS" (PDF) . Operations Research Letters . 32 : 73–76. doi :10.1016/S0167-6377(03)00061-0.
^ Gautam, Natarajan (2012). Análisis de colas: métodos y aplicaciones . CRC Press. pág. 703. ISBN978-1439806586.
^
Xin Li; Michael C. Huang; Kai Shen; Lingkun Chu. "Una evaluación realista de los errores de hardware de memoria y la susceptibilidad del sistema de software". 2010. pág. 6.
^
"Conceptos básicos de confiabilidad". 2010.
^ Vita Faraci. "Cálculo de tasas de fallos en redes en serie y en paralelo". Archivado el 3 de marzo de 2016 en Wayback Machine . 2006.
^
"Confiabilidad de la misión y confiabilidad logística: una paradoja de diseño".
Lectura adicional
Goble, William M. (2018), Diseño de sistemas instrumentados de seguridad: técnicas y verificación del diseño , Research Triangle Park, NC: Sociedad Internacional de Automatización
Blanchard, Benjamin S. (1992). Ingeniería y gestión logística (cuarta edición). Englewood Cliffs, Nueva Jersey: Prentice-Hall. pp. 26–32. ISBN 0135241170.
Ebeling, Charles E. (1997). Introducción a la ingeniería de confiabilidad y mantenibilidad . Boston: McGraw-Hill. págs. 23–32. ISBN 0070188521.
Kapur, KC; Lamberson, LR (1977). Confiabilidad en el diseño de ingeniería . Nueva York: John Wiley & Sons. pp. 8–30. ISBN 0471511919.
Knowles, DI (1995). "¿Deberíamos alejarnos de la 'tasa de fallos aceptable'?". Communications in Reliability Maintenanceability and Supportability . 2 (1). International RMS Committee, EE. UU.: 23.
MacDiarmid, Preston; Morris, Seymour; et al. (nd). Reliability Toolkit (Commercial Practices ed.). Roma, Nueva York: Centro de Análisis de Confiabilidad y Laboratorio de Roma. págs. 35–39.
Mondro, Mitchell J. (junio de 2002). "Aproximación del tiempo medio entre fallos cuando un sistema tiene mantenimiento periódico" (PDF) . IEEE Transactions on Reliability . 51 (2): 166–167. doi :10.1109/TR.2002.1011521.
Rausand, M.; Hoyland, A. (2004). Teoría de la confiabilidad de sistemas; modelos, métodos estadísticos y aplicaciones . Nueva York: John Wiley & Sons. ISBN 047147133X.
Turner, T.; Hockley, C.; Burdaky, R. (1997). El cliente necesita un período de funcionamiento sin mantenimiento . Leatherhead, Surrey, Reino Unido: ERA Technology Ltd. {{cite book}}: |work=ignorado ( ayuda )
Departamento de Defensa de EE. UU., (1991) Manual militar, “Predicción de confiabilidad de equipos electrónicos, MIL-HDBK-217F, 2
Enlaces externos
Problemas con la curva de la bañera Archivado el 29 de noviembre de 2014 en Wayback Machine , ASQC
Computación tolerante a fallos en la automatización industrial Archivado el 26 de marzo de 2014 en Wayback Machine por Hubert Kirrmann, Centro de investigación de ABB, Suiza