stringtranslate.com

Análisis de causa raíz

En ciencia e ingeniería , el análisis de causa raíz (RCA) es un método de resolución de problemas utilizado para identificar las causas raíz de fallas o problemas. [1] Se usa ampliamente en operaciones de TI , fabricación , telecomunicaciones , control de procesos industriales , análisis de accidentes (por ejemplo, en aviación , [2] transporte ferroviario o plantas nucleares ), diagnóstico médico , la industria de la salud (por ejemplo, para epidemiología ), etc. El análisis de causa raíz es una forma de inferencia inductiva (primero crear una teoría, o raíz , basada en evidencia empírica, o causas ) e inferencia deductiva (probar la teoría, es decir, los mecanismos causales subyacentes, con datos empíricos).

El RCA se puede descomponer en cuatro pasos:

  1. Identificar y describir el problema claramente
  2. Establecer una línea de tiempo desde la situación normal hasta la ocurrencia del problema.
  3. Distinguir entre la causa raíz y otros factores causales (por ejemplo, a través de la correlación de eventos )
  4. Establecer un gráfico causal entre la causa raíz y el problema.

El RCA generalmente sirve como entrada para un proceso de remediación mediante el cual se toman acciones correctivas para evitar que el problema vuelva a ocurrir. El nombre de este proceso varía según el dominio de aplicación. Según la norma ISO/IEC 31010 , el RCA puede incluir estas técnicas: Cinco por qué , Análisis de modos de falla y efectos (FMEA), Análisis de árbol de fallas , Diagramas de Ishikawa y Análisis de Pareto .

Definiciones

Básicamente, existen dos maneras de reparar fallas y resolver problemas en ciencia e ingeniería.

Gestión reactiva

La gestión reactiva consiste en reaccionar rápidamente después de que se produce el problema, tratando los síntomas. Este tipo de gestión se implementa mediante sistemas reactivos, [3] [4] sistemas autoadaptativos, [5] sistemas autoorganizados y sistemas adaptativos complejos . El objetivo aquí es reaccionar rápidamente y aliviar los efectos del problema lo antes posible.

Gestión proactiva

La gestión proactiva, por el contrario, consiste en prevenir que los problemas se produzcan. Para ello se pueden utilizar numerosas técnicas, desde las buenas prácticas de diseño hasta el análisis detallado de los problemas que ya se han producido y la adopción de medidas para que no vuelvan a producirse. En este caso, no es tan importante la velocidad como la precisión y exactitud del diagnóstico. Lo importante es abordar la causa real del problema, no sus efectos.

El análisis de causa raíz se utiliza a menudo en la gestión proactiva para identificar la causa raíz de un problema, es decir, el factor que fue la causa principal. Es habitual referirse a la "causa raíz" en singular, pero uno o varios factores pueden constituir la (s) causa(s) raíz del problema en estudio.

Un factor se considera la "causa raíz" de un problema si su eliminación evita que el problema vuelva a ocurrir. Por el contrario, un "factor causal" es una acción que contribuye y que afecta el resultado de un incidente o evento, pero que no es la causa raíz. Si bien la eliminación de un factor causal puede beneficiar un resultado, no evita con certeza su recurrencia.

Una buena manera de analizar el panorama proactivo/reactivo es considerar el modelo Bowtie Risk Assessment. En el centro del modelo se encuentra el evento o accidente. A la izquierda, se encuentran los peligros previstos y la línea de defensas establecida para evitar que esos peligros provoquen eventos. La línea de defensa son los requisitos reglamentarios, los procedimientos aplicables, las barreras físicas y las barreras cibernéticas que se han establecido para gestionar las operaciones y prevenir eventos. Una buena manera de utilizar el análisis de causa raíz es evaluar de manera proactiva la eficacia de esas defensas comparando el desempeño real con los requisitos aplicables, identificando las brechas de desempeño y luego cerrando las brechas para fortalecer esas defensas. Si ocurre un evento, entonces estamos en el lado derecho del modelo, el lado reactivo donde el énfasis está en identificar las causas raíz y mitigar el daño.

Ejemplo

Imaginemos una investigación sobre una máquina que se paró porque estaba sobrecargada y se fundió el fusible. [6] La investigación muestra que la máquina estaba sobrecargada porque tenía un cojinete que no estaba suficientemente lubricado. La investigación continúa y descubre que el mecanismo de lubricación automática tenía una bomba que no bombeaba lo suficiente, de ahí la falta de lubricación. La investigación de la bomba muestra que tiene un eje desgastado. La investigación de por qué estaba desgastado el eje descubre que no hay un mecanismo adecuado para evitar que la chatarra de metal entre en la bomba. Esto permitió que la chatarra entrara en la bomba y la dañara.

La causa aparente del problema es que los desechos metálicos pueden contaminar el sistema de lubricación. La solución de este problema debería evitar que se repita toda la secuencia de eventos. La causa real podría ser un problema de diseño si no hay un filtro que impida que los desechos metálicos entren en el sistema. O si tiene un filtro que se bloqueó debido a la falta de inspección de rutina, entonces la causa real podría ser un problema de mantenimiento.

Comparemos esto con una investigación que no encuentra la causa raíz: reemplazar el fusible, el cojinete o la bomba de lubricación probablemente permitirá que la máquina vuelva a funcionar por un tiempo. Sin embargo, existe el riesgo de que el problema simplemente vuelva a aparecer hasta que se solucione la causa raíz.

Lo anterior no incluye un análisis de costo/beneficio : ¿el costo de reemplazar una o más máquinas supera el costo del tiempo de inactividad hasta que se reemplaza el fusible? Esta situación a veces se conoce como “ el remedio es peor que la enfermedad” . [7] [8]

Como ejemplo no relacionado de las conclusiones que se pueden extraer en ausencia del análisis de costos y beneficios, consideremos la disyuntiva entre algunos supuestos beneficios de la disminución de la población: en el corto plazo habrá menos contribuyentes a los sistemas de pensiones y jubilaciones, mientras que para detener la población se requerirán impuestos más altos para cubrir el costo de construir más escuelas. Esto puede ayudar a explicar el problema de que el remedio sea peor que la enfermedad. [9]

Los costos que se deben tener en cuenta van más allá de los financieros cuando se considera al personal que opera la maquinaria. En última instancia, el objetivo es prevenir el tiempo de inactividad, pero más aún, prevenir lesiones catastróficas. La prevención comienza con ser proactivo.

Principios generales

Ejemplo de un método de análisis de causa raíz

A pesar de los diferentes enfoques entre las distintas escuelas de análisis de causa raíz y las particularidades de cada dominio de aplicación, el RCA generalmente sigue los mismos cuatro pasos:

  1. Identificación y descripción: Los enunciados de problemas y descripciones de eventos eficaces (como fallas, por ejemplo) son útiles y generalmente necesarios para garantizar la ejecución de análisis de causa raíz adecuados. Los enunciados de problemas son la estrella del norte del análisis de causa raíz, ya que mantienen al equipo concentrado en lo que están investigando y evitan que se desvíen del camino.
  2. Recopilación, organización y análisis de la información: la mayoría de los análisis de causa raíz comienzan con una sesión de investigación para recopilar la información disponible, como las declaraciones de los testigos, la cronología de los acontecimientos y los requisitos aplicables a las evoluciones que se estaban produciendo en el momento del acontecimiento. La información se puede utilizar para establecer una secuencia de acontecimientos o una línea de tiempo para el acontecimiento, y para identificar la línea de defensas que debería haber evitado el acontecimiento (es decir, los requisitos administrativos y las barreras físicas y cibernéticas). También se deben consultar y analizar las bases de datos disponibles (como las bases de datos del programa de acciones correctivas y del programa de seguridad), y las herramientas de análisis de datos, como los diagramas de Pareto, los mapas de procesos, los árboles de fallos y otras herramientas que nos proporcionan información sobre las brechas de rendimiento. Se puede utilizar cualquier cantidad de herramientas de análisis de datos, incluidas las herramientas de análisis de datos de Lean Six Sigma, las herramientas de análisis estadístico y otras como la agrupación jerárquica y las soluciones de minería de datos (como la minería de datos basada en la teoría de grafos ). Otra consiste en comparar la situación bajo investigación con situaciones pasadas almacenadas en bibliotecas de casos, utilizando herramientas de razonamiento basadas en casos y puede incluir análisis de cambios, análisis de línea de tiempo comparativo y análisis de tareas.
  3. Análisis de las defensas: después de identificar las defensas que deberían haber evitado el evento o accidente, se recomienda encarecidamente realizar un análisis de las defensas (tradicionalmente llamado análisis de barreras ) en todos los casos, incluidas las investigaciones que no son de RCA. Un método es enumerar las defensas en un gráfico o una pizarra virtual. Luego, para cada defensa, observe la información y los datos que se recopilaron para obtener evidencia de la efectividad de esa defensa. En realidad, buscamos deficiencias o brechas en el desempeño donde no se cumplieron los requisitos administrativos o donde se pasaron por alto las barreras físicas o cibernéticas. Estas brechas iniciales en el desempeño son simplemente síntomas de causas más profundas. Usamos estas brechas de desempeño sintomáticas para desarrollar líneas de preguntas de investigación como se describe a continuación, para rastrear los síntomas hasta sus puntos de origen (es decir, las causas fundamentales) utilizando el análisis de causa y efecto.
  4. Generar líneas de preguntas de investigación enfocadas e imparciales: después de recopilar la información disponible, organizarla en gráficos con líneas de tiempo y otros datos, después de analizar los datos disponibles y después de realizar un análisis de nuestras defensas, usamos esos conocimientos para generar grandes preguntas. Estas preguntas se convertirán en nuestras líneas de investigación para el análisis de causa y efecto. Las preguntas deben ser imparciales y, para evitar que cualquier sesgo del equipo de RCA contamine la investigación, las preguntas deben estar vinculadas a una defensa específica o a una idea específica de nuestro análisis de datos (por ejemplo, diagramas de Pareto , mapas de procesos , árboles de fallas , gráficos de control ) y otras herramientas que nos brinden información sobre las brechas de desempeño. No debe haber preguntas de curiosidad, preguntas que reflejen un "sesgo de confirmación" (es decir, hacer una pregunta capciosa para que respondan lo que el equipo de RCA cree que son las causas) o preguntas que sean de naturaleza acusatoria que harán que quienes ayudan a la investigación cierren y se retiren.
  5. Análisis de causa y efecto: Una vez que hemos desarrollado un conjunto sólido de preguntas de investigación a partir de la evidencia fáctica recopilada, los requisitos aplicables y un análisis de los datos disponibles, podemos llevar esas preguntas a los expertos en la materia de la organización. Esto comienza el proceso de análisis de causa y efecto. Una vez que planteamos una pregunta a la organización afectada, utilizamos su respuesta para plantear preguntas socráticas de seguimiento . Las preguntas socráticas mantienen la investigación fluyendo hacia los siguientes factores causales más profundos hasta que la organización se queda sin respuestas o el último factor causal está fuera del control de la organización. Hay muchas habilidades involucradas en la realización de un análisis de causa y efecto eficaz, incluidas las habilidades de facilitación, las habilidades de comunicación y el cuestionamiento socrático. Cuando se realiza correctamente, esto llevará el RCA a las causas raíz más profundas. Una advertencia: Ishikawa o el diagrama de espina de pescado, y los métodos de los 5 por qué , no son lo suficientemente rigurosos para realizar un análisis de causa raíz. El método Fishbone es de la década de 1940 y el de los 5 por qué de la década de 1930, y hay métodos mucho más avanzados disponibles. Busque métodos que se desarrollaron en este siglo (año 2000 y posteriores), ya que es más probable que tengan en cuenta la nueva dinámica de los entornos de trabajo sociotécnicos modernos.
  6. Representación gráfica de los resultados de la RCA: la mejor manera de representar gráficamente los resultados de una investigación de RCA es comenzar a llenar el gráfico final desde el principio. Este proceso se ha vuelto mucho más fácil con la llegada de las pizarras virtuales. En una sola pizarra virtual, podemos mostrar las líneas de tiempo, las líneas de defensa, el análisis de datos, las preguntas de las líneas de investigación, el análisis de causa y efecto, las causas fundamentales y el plan de acción correctiva.
  7. Acciones correctivas para prevenir la recurrencia: desde una perspectiva de gestión, el esfuerzo de RCA no está completo sin un plan de acción correctiva integral para abordar las causas fundamentales, los factores contribuyentes y el "alcance de las causas". El plan de acción correctiva debe ser desarrollado por los propietarios del problema y no requiere la participación del equipo de RCA, aunque el equipo es una excelente fuente de orientación para los propietarios del problema. Las revisiones del alcance de la causa se llevan a cabo para determinar el alcance del daño o el impacto que las causas fundamentales y los factores contribuyentes tuvieron en los seres humanos, el equipo o las instalaciones. Las revisiones del alcance de la causa son un talón de Aquiles en la gran mayoría de las organizaciones y una razón principal por la que las RCA y los planes de acción correctiva no logran prevenir la recurrencia. Además, se debe tener cuidado para evitar planes de acción correctiva que simplemente agreguen más requisitos administrativos y más capacitación a la organización. Para evitar esto, utilice la Jerarquía de controles de peligros y la Prueba de errores Lean como pautas para desarrollar acciones correctivas efectivas que tengan una probabilidad mucho mayor de prevenir la recurrencia.
  8. Revisiones de efectividad: Después de un período predeterminado después de la implementación del plan de acción correctiva, se programa una revisión de efectividad para evaluar la efectividad de esas acciones correctivas. Esto requiere especificar un conjunto de métricas o indicadores que se monitorearán antes y después de que se implementen las acciones correctivas, de modo que podamos medir su impacto. Si no se logran los resultados deseados, que en la mayoría de los casos es una reducción significativa en la magnitud o frecuencia del evento o problema, entonces se debe reabrir el RCA por no ser efectivo.

Para que el análisis de las causas raíz sea eficaz, debe realizarse de forma sistemática. El proceso permite no pasar por alto ningún otro detalle importante. Normalmente se requiere un trabajo en equipo y, lo ideal, es que todas las personas implicadas lleguen a la misma conclusión. En los análisis de accidentes de aviación, por ejemplo, las conclusiones de la investigación y las causas raíz que se identifiquen deben estar respaldadas por pruebas documentadas. [10]

Transición a acciones correctivas

El objetivo de la RCA es identificar la causa raíz del problema con la intención de evitar que vuelva a aparecer o empeore. El siguiente paso es poner en marcha acciones correctivas a largo plazo para abordar la causa raíz identificada durante la RCA y asegurarse de que el problema no vuelva a aparecer. Sin embargo, la corrección de un problema no forma parte formal de la RCA; son pasos diferentes en un proceso de resolución de problemas conocido como gestión de fallas en TI y telecomunicaciones, reparación en ingeniería, remediación en aviación, remediación ambiental en ecología , terapia en medicina , etc.

Dominios de aplicación

El análisis de causa raíz se utiliza en muchos ámbitos de aplicación. El RCA se menciona específicamente en el Código de Regulaciones Federales de los Estados Unidos en muchos de los títulos. Por ejemplo:

  1. TÍTULO 10 - ENERGÍA >>> 10CFR Parte 50, Apéndice B, Criterio XVI, “Acciones correctivas” (también adoptado por NQA-1)
    • “Se deberán establecer medidas para asegurar que las condiciones adversas a la calidad tales como fallas, mal funcionamiento, deficiencias, materiales y equipos defectuosos y no conformidades se identifiquen y corrijan rápidamente.
    • “En el caso de condiciones significativas adversas a la calidad, las medidas deberán asegurar que se determine la causa de la condición y se tomen medidas correctivas para evitar su recurrencia”.
  2. TÍTULO 14 - AERONÁUTICA Y ESPACIO >>> 14 CFR Capítulo III, Subcapítulo C, Parte 437, Subparte C, §437.73 Registro de anomalías, informe e implementación de acciones correctivas.
    1. El titular del permiso debe registrar cada anomalía que afecte a un sistema, subsistema, proceso, instalación o equipo de soporte crítico para la seguridad.
    2. El titular del permiso debe identificar todas las causas fundamentales de cada anomalía e implementar todas las acciones correctivas para cada anomalía.
  3. TÍTULO 21 - ALIMENTOS Y MEDICAMENTOS >>> 21 CFR Subparte J: 21CFR820.100(a) – Acción correctiva/preventiva: (A) Cada fabricante deberá establecer y mantener procedimientos para implementar acciones correctivas y preventivas. Los procedimientos deberán incluir requisitos para:
    1. Investigar la causa de las no conformidades relacionadas con el producto, los procesos y el sistema de calidad;
    2. Identificar las acciones necesarias para corregir y prevenir la recurrencia de productos no conformes y otros problemas de calidad;
    3. Verificar o validar la acción correctiva y preventiva para garantizar que dicha acción sea efectiva y no afecte negativamente al dispositivo terminado;
  4. TÍTULO 42 - SALUD PÚBLICA >>> 42 CFR PARTE 488, PROCEDIMIENTOS DE ENCUESTA, CERTIFICACIÓN Y CUMPLIMIENTO > Subparte E: Encuesta y certificación de centros de atención a largo plazo
    1. §488.61 Procedimientos especiales para la aprobación y nueva aprobación de programas de trasplante de órganos.
    2. ...Análisis de causa raíz de muertes de pacientes y fallas de injertos, incluidos los factores que el programa ha identificado como probables factores causales o contribuyentes de muertes de pacientes y fallas de injertos;

Control de procesos industriales y de fabricación

El ejemplo anterior ilustra cómo se puede utilizar el RCA en la fabricación . El RCA también se utiliza rutinariamente en el control de procesos industriales , por ejemplo, para controlar la producción de productos químicos ( control de calidad ).

El RCA también se utiliza para el análisis de fallos en ingeniería y mantenimiento .

Informática y telecomunicaciones

El análisis de causa raíz se utiliza con frecuencia en TI y telecomunicaciones para detectar las causas raíz de problemas graves. Por ejemplo, en el marco de gestión de servicios ITIL , el objetivo de la gestión de incidentes es reanudar un servicio de TI defectuoso lo antes posible (gestión reactiva), mientras que la gestión de problemas se ocupa de resolver los problemas recurrentes para siempre abordando sus causas raíz (gestión proactiva).

Otro ejemplo es el proceso de gestión de incidentes de seguridad informática , donde el análisis de causa raíz se utiliza a menudo para investigar violaciones de seguridad. [11]

RCA también se utiliza junto con la monitorización de la actividad empresarial y el procesamiento de eventos complejos para analizar fallas en los procesos empresariales .

Su uso en la industria de TI no siempre se puede comparar con su uso en industrias críticas para la seguridad, ya que normalmente el uso de RCA en la industria de TI no está respaldado por árboles de fallas preexistentes u otras especificaciones de diseño. En cambio, una combinación de depuración, detección basada en eventos y sistemas de monitoreo (donde los servicios se modelan individualmente) normalmente respalda el análisis. No existen herramientas de capacitación y soporte como simulación o diferentes manuales de ejecución detallados para todos los escenarios esperados, en cambio, se crean después del hecho en función de los problemas que se consideran "valiosos". Como resultado, el análisis a menudo se limita a aquellas cosas que tienen interfaces de monitoreo/observación y no la función planificada/prevista real con enfoque en la verificación de entradas y salidas. Por lo tanto, el dicho "no hay causa raíz" se ha vuelto común en la industria de TI.

Salud y seguridad

En los ámbitos de la salud y la seguridad , el RCA se utiliza rutinariamente en medicina (diagnóstico) y epidemiología (por ejemplo, para identificar la fuente de una enfermedad infecciosa), donde los métodos de inferencia causal a menudo requieren experiencia tanto clínica como estadística para dar sentido a las complejidades de los procesos. [12]

El RCA se utiliza en ciencias ambientales (por ejemplo, para analizar desastres ambientales), análisis de accidentes (industria de aviación y ferrocarril) y seguridad y salud ocupacional . [13] En la fabricación de dispositivos médicos, [14] productos farmacéuticos, [15] alimentos, [16] y suplementos dietéticos, [17] el análisis de causa raíz es un requisito reglamentario.

Análisis de sistemas

El RCA también se utiliza en la gestión de cambios , la gestión de riesgos y el análisis de sistemas .

Desafíos

Sin entrar en las idiosincrasias de problemas específicos, varias condiciones generales pueden hacer que la RCA sea más difícil de lo que parece a primera vista.

En primer lugar, a menudo falta información importante porque, en la práctica, no suele ser posible supervisar todo y almacenar todos los datos de supervisión durante mucho tiempo.

En segundo lugar, la recopilación de datos y pruebas, y su clasificación a lo largo de una línea de tiempo de eventos hasta llegar al problema final, puede ser algo no trivial. En telecomunicaciones, por ejemplo, los sistemas de monitoreo distribuidos suelen gestionar entre un millón y mil millones de eventos por día. Encontrar unos pocos eventos relevantes en una masa tan grande de eventos irrelevantes es como buscar una aguja en un pajar.

En tercer lugar, puede haber más de una causa raíz para un problema determinado, y esta multiplicidad puede hacer que sea muy difícil establecer el gráfico causal.

En cuarto lugar, los gráficos causales suelen tener muchos niveles, y el análisis de la causa raíz termina en un nivel que es "raíz" a los ojos del investigador. Si volvemos a examinar el ejemplo anterior sobre el control de procesos industriales, una investigación más profunda podría revelar que los procedimientos de mantenimiento de la planta incluían una inspección periódica del subsistema de lubricación cada dos años, mientras que el producto del proveedor actual del subsistema de lubricación especificaba un período de seis meses. El cambio de proveedor puede haberse debido al deseo de la dirección de ahorrar dinero y a la falta de consulta con el personal de ingeniería sobre las implicaciones del cambio en los procedimientos de mantenimiento. Por lo tanto, si bien la "causa raíz" que se muestra arriba puede haber evitado la recurrencia citada, no habría evitado otras fallas, tal vez más graves, que afectaran a otras máquinas.

Véase también

Notas

  1. ^ Véase Wilson, Dell y Anderson 1993, págs. 8-17.
  2. ^ Ver IATA 2016 y Sofema 2017.
  3. ^ Véase Manna y Pnueli 1995.
  4. ^ Véase Lewerentz y Lindner 1995.
  5. ^ Véase Babaoglu et al. 2005.
  6. ^ Véase Ohno 1988.
  7. ^ "El remedio es peor que la enfermedad". The New York Times . 5 de noviembre de 1927.
  8. ^ Andrew C. Revkin (7 de diciembre de 2000). "El dragado de los PCB de los ríos podría ser una cura peor que la enfermedad, insiste GE". The New York Times .
  9. ^ Phillip Longman (9 de junio de 2004). "La crisis mundial de bebés". The New York Times .
  10. ^ Véase IATA 2016.
  11. ^ Véase Abubakar et al. 2016
  12. ^ Landsittel, Douglas; Srivastava, Avantika; Kropf, Kristin (2020). "Una revisión narrativa de métodos para la inferencia causal y recursos educativos asociados". Gestión de la calidad en la atención sanitaria . 29 (4): 260–269. doi :10.1097/QMH.0000000000000276. ISSN  1063-8628. PMID  32991545. S2CID  222146291.
  13. ^ Ver OSHA 2019.
  14. ^ Oficina de Asuntos Regulatorios (26 de diciembre de 2019). "Acciones correctivas y preventivas (CAPA)". FDA .
  15. ^ US-FDA. "BUENAS PRÁCTICAS DE FABRICACIÓN ACTUALES PARA PRODUCTOS FARMACÉUTICOS TERMINADOS". Código Electrónico de Reglamentos Federales (eCFR) . Consultado el 28 de diciembre de 2020 .
  16. ^ US-FDA. "BUENAS PRÁCTICAS DE FABRICACIÓN ACTUALES, ANÁLISIS DE RIESGOS Y CONTROLES PREVENTIVOS BASADOS EN RIESGOS PARA ALIMENTOS PARA USO HUMANO". Código Electrónico de Reglamentos Federales (eCFR) . Consultado el 28 de diciembre de 2020 .
  17. ^ US-FDA. "BUENAS PRÁCTICAS DE FABRICACIÓN ACTUALES EN OPERACIONES DE FABRICACIÓN, ENVASADO, ETIQUETADO O CONSERVACIÓN DE SUPLEMENTOS DIETARIOS". Código Electrónico de Reglamentos Federales (eCFR) . Consultado el 28 de diciembre de 2020 .

Referencias

Enlaces externos