stringtranslate.com

Análisis de raíz de la causa

En ciencia e ingeniería , el análisis de causa raíz ( RCA ) es un método de resolución de problemas que se utiliza para identificar las causas fundamentales de fallas o problemas. [1] Se utiliza ampliamente en operaciones de TI , fabricación, telecomunicaciones , control de procesos industriales , análisis de accidentes (por ejemplo, en aviación , [2] transporte ferroviario o plantas nucleares ), medicina (para diagnóstico médico ), industria de la salud (por ejemplo, para epidemiología ), etc. El análisis de causa raíz es una forma de inferencia inductiva (primero crear una teoría [raíz] basada en evidencia empírica [causas]) y deductiva (probar la teoría [mecanismos causales subyacentes] con datos empíricos).

RCA se puede descomponer en cuatro pasos:

El RCA generalmente sirve como insumo para un proceso de remediación mediante el cual se toman acciones correctivas para evitar que el problema vuelva a ocurrir. El nombre de este proceso varía de un dominio de aplicación a otro. Según ISO/IEC 31010 , RCA puede incluir las técnicas Cinco porqués , Análisis modal de fallas y efectos (FMEA), Análisis de árbol de fallas , Diagrama de Ishikawa y Análisis de Pareto .

Definiciones

Básicamente, existen dos formas de reparar fallas y resolver problemas en ciencia e ingeniería.

Gestión reactiva

El manejo reactivo consiste en reaccionar rápidamente después de que ocurre el problema, tratando los síntomas. Este tipo de gestión se implementa mediante sistemas reactivos, [3] [4] sistemas autoadaptativos, [5] sistemas autoorganizados y sistemas adaptativos complejos . El objetivo aquí es reaccionar rápidamente y paliar los efectos del problema lo antes posible.

Gestión proactiva

La gestión proactiva , por el contrario, consiste en evitar que se produzcan problemas. Se pueden utilizar muchas técnicas para este propósito, que van desde buenas prácticas en diseño hasta analizar en detalle problemas que ya han ocurrido y tomar acciones para asegurarse de que nunca vuelvan a ocurrir. La velocidad no es tan importante aquí como la exactitud y precisión del diagnóstico. La atención se centra en abordar la causa real del problema más que sus efectos.

El análisis de causa raíz se utiliza a menudo en la gestión proactiva para identificar la causa raíz de un problema, es decir, el factor que fue la causa principal. Es habitual referirse a la "causa raíz" en forma singular, pero uno o varios factores pueden constituir la (s) causa(s) raíz del problema en estudio.

Un factor se considera la "causa raíz" de un problema si su eliminación evita que el problema vuelva a ocurrir. Por el contrario, un "factor causal" es una acción contribuyente que afecta el resultado de un incidente/evento pero no es la causa raíz. Aunque eliminar un factor causal puede beneficiar un resultado, no previene con certeza su recurrencia.

Una excelente manera de observar el panorama proactivo/reactivo es considerar el modelo de evaluación de riesgos Bowtie. En el centro del modelo está el evento o accidente. A la izquierda, están los peligros anticipados y la línea de defensas establecidas para evitar que esos peligros causen eventos. La línea de defensas son los requisitos regulatorios, los procedimientos aplicables, las barreras físicas y las barreras cibernéticas que existen para gestionar las operaciones y prevenir eventos. Una excelente manera de utilizar el análisis de causa raíz es evaluar de manera proactiva la efectividad de esas defensas comparando el desempeño real con los requisitos aplicables, identificar brechas de desempeño y luego cerrar las brechas para fortalecer esas defensas. Si ocurre un evento, entonces estamos en el lado derecho del modelo, el lado reactivo donde el énfasis está en identificar las causas fundamentales y mitigar el daño.

Ejemplo

Imaginemos una investigación sobre una máquina que se detuvo porque estaba sobrecargada y se fundió el fusible. [6] La investigación muestra que la máquina estaba sobrecargada porque tenía un cojinete que no estaba suficientemente lubricado. La investigación continúa y encuentra que el mecanismo de lubricación automática tenía una bomba que no bombeaba lo suficiente, de ahí la falta de lubricación. La investigación de la bomba muestra que tiene un eje desgastado. La investigación de por qué se desgastó el eje descubre que no existe un mecanismo adecuado para evitar que entre chatarra de metal en la bomba. Esto permitió que la chatarra entrara en la bomba y la dañara.

La aparente causa fundamental del problema es que la chatarra de metal puede contaminar el sistema de lubricación. Solucionar este problema debería evitar que se repita toda la secuencia de eventos. La verdadera causa raíz podría ser un problema de diseño si no hay un filtro para evitar que la chatarra entre en el sistema. O si tiene un filtro que se bloqueó debido a la falta de una inspección de rutina, entonces la verdadera causa es un problema de mantenimiento.

Compare esto con una investigación que no encuentra la causa raíz: reemplazar el fusible, el cojinete o la bomba de lubricación probablemente permitirá que la máquina vuelva a funcionar por un tiempo. Pero existe el riesgo de que el problema simplemente se repita, hasta que se resuelva la causa raíz.

Lo anterior no incluye el análisis costo/beneficio : ¿el costo de reemplazar una o más máquinas excede el costo del tiempo de inactividad hasta que se reemplaza el fusible? A veces se hace referencia a esta situación como si el remedio fuera peor que la enfermedad . [7] [8]

Como ejemplo no relacionado de las conclusiones que pueden extraerse en ausencia del análisis costo/beneficio, consideremos la compensación entre algunos de los supuestos beneficios de la disminución de la población: en el corto plazo habrá menos contribuyentes en los sistemas de pensiones/jubilación; mientras que detener la población requerirá impuestos más altos para cubrir el costo de construir más escuelas. Esto puede ayudar a explicar el problema de que la cura es peor que la enfermedad. [9]

Los costos a considerar van más allá de lo financiero al considerar el personal que opera la maquinaria. En última instancia, el objetivo es evitar el tiempo de inactividad; pero sobre todo prevenir lesiones catastróficas. La prevención comienza con ser proactivo.

Principios generales

Ejemplo de un método de análisis de causa raíz

A pesar de los diferentes enfoques entre las distintas escuelas de análisis de causa raíz y las características específicas de cada dominio de aplicación, RCA generalmente sigue los mismos cuatro pasos:

  1. Identificación y descripción: las declaraciones efectivas de problemas y descripciones de eventos (como fallas, por ejemplo) son útiles y generalmente necesarias para garantizar la ejecución de análisis de causa raíz adecuados. Las declaraciones de problemas son la estrella polar de la RCA, ya que mantienen al equipo concentrado en lo que están investigando y evitan que se extravíen.
  2. Recopilación, organización y análisis de información: La mayoría de los RCA comienzan con una sesión de investigación para recopilar información disponible como declaraciones de testigos, la cronología de los hechos y requisitos aplicables a las evoluciones que se estaban produciendo en el momento del hecho. La información se puede utilizar para establecer una secuencia de eventos o un cronograma para el evento, y para identificar la línea de defensas que deberían haber evitado el evento (es decir, los requisitos administrativos y las barreras físicas y cibernéticas). También se deben consultar y analizar las bases de datos disponibles (como las bases de datos de programas de acciones correctivas y programas de seguridad) y herramientas de análisis de datos como diagramas de Pareto, mapas de procesos, árboles de fallas y otras herramientas que nos brinden información sobre las brechas de desempeño. Se puede utilizar cualquier cantidad de herramientas de análisis de datos, incluidas herramientas de análisis de datos de Lean Six Sigma, herramientas de análisis estadístico y otras, como agrupación jerárquica y soluciones de minería de datos (como la minería de datos basada en la teoría de grafos ). Otro consiste en comparar la situación que se investiga con situaciones pasadas almacenadas en bibliotecas de casos, utilizando herramientas de razonamiento basado en casos y puede incluir análisis de cambios, análisis comparativo de cronogramas y análisis de tareas.
  3. Análisis de defensas: Después de identificar las defensas existentes que deberían haber evitado el evento o accidente, se recomienda encarecidamente realizar un análisis de defensas (tradicionalmente llamado Análisis de barreras ) en todos los casos, incluidas las investigaciones no RCA. Un método es enumerar las defensas en un gráfico o en una pizarra virtual. Luego, para cada defensa, observe la información y los datos que se recopilaron como evidencia de la efectividad de esa defensa. En realidad, estamos buscando deficiencias o brechas en el desempeño donde no se cumplieron los requisitos administrativos o donde se sortearon las barreras físicas o cibernéticas. Estas brechas iniciales en el desempeño son meros síntomas de causas más profundas. Utilizamos estas brechas de desempeño sintomáticas para desarrollar líneas de preguntas de investigación como se describe a continuación, para rastrear los síntomas hasta sus puntos de origen (es decir, las causas fundamentales) mediante el análisis de causa y efecto.
  4. Generar líneas de investigación enfocadas e imparciales: después de recopilar la información disponible, organizarla en gráficos con líneas de tiempo y otros datos, después de analizar los datos disponibles y después de realizar un análisis de nuestras defensas, utilizamos esos conocimientos para generar grandes preguntas. Estas preguntas se convertirán en nuestras líneas de investigación para el análisis de causa y efecto. Las preguntas deben ser imparciales y, para evitar que cualquier sesgo del equipo de RCA contamine la investigación, las preguntas deben estar vinculadas a una defensa específica o a una idea específica de nuestro análisis de datos (por ejemplo, diagramas de Pareto , mapas de procesos , árboles de fallas , etc.). gráficos de control ) y otras herramientas que nos brindan información sobre las brechas de desempeño. No debe haber preguntas de curiosidad, preguntas que reflejen un "sesgo de confirmación" (es decir, hacer una pregunta capciosa para responder a lo que el equipo de RCA cree que son las causas), o preguntas que sean de naturaleza acusatoria que hagan que quienes ayudan a cerrar la investigación. abajo y retirarse.
  5. Análisis de causa y efecto: una vez que hayamos desarrollado un conjunto sólido de líneas de preguntas de investigación a partir de la evidencia fáctica recopilada, los requisitos aplicables y un análisis de los datos disponibles, podemos llevar esas preguntas a los expertos en la materia de la organización. Esto inicia el proceso de análisis de causa y efecto. Una vez que planteamos una pregunta a la organización afectada, utilizamos su respuesta para plantear preguntas socráticas de seguimiento . Las preguntas socráticas mantienen la investigación fluyendo hacia los siguientes factores causales más profundos hasta que la organización se queda sin respuestas, o el último factor causal está fuera del control de la organización. Hay muchas habilidades involucradas en la realización de un análisis de causa y efecto eficaz, incluidas habilidades de facilitación, habilidades de comunicación y cuestionamiento socrático. Cuando se lleva a cabo correctamente, esto llevará al RCA a las causas fundamentales más profundas. Una advertencia: Ishikawa o el diagrama de espina de pescado y los métodos de los cinco porqués no son lo suficientemente rigurosos para realizar un análisis de la causa raíz. El Fishbone es de la década de 1940 y el 5-Whys es de la década de 1930, y hay métodos mucho más avanzados disponibles. Busque métodos que se desarrollaron en este siglo (el año 2000 y posteriores), ya que es más probable que den cuenta de la nueva dinámica de los entornos de trabajo sociotécnicos modernos.
  6. Trazar los resultados de la RCA: la mejor manera de trazar los resultados de una investigación de la RCA es comenzar a completar el gráfico final desde el principio. Este proceso se ha vuelto mucho más fácil con la llegada de las pizarras virtuales. En una única pizarra virtual podemos mostrar los cronogramas, las líneas de defensa, el análisis de datos, las líneas de investigación, el análisis de causa y efecto, las causas raíz y el plan de acción correctiva.
  7. Acciones correctivas para prevenir la recurrencia: Desde una perspectiva de gestión, el esfuerzo de RCA no está completo sin un plan integral de acciones correctivas para abordar las causas fundamentales, los factores contribuyentes y el "alcance de las causas". El plan de acción correctiva debe ser desarrollado por los propietarios del problema y no requiere la participación del equipo de RCA, aunque el equipo es una excelente fuente de orientación para los propietarios del problema. Las revisiones de la extensión de la causa se llevan a cabo para determinar el alcance del daño o el impacto que las causas fundamentales y los factores contribuyentes tuvieron en los seres humanos, los equipos o las instalaciones. Las revisiones de la extensión de la causa son un talón de Aquiles en la gran mayoría de las organizaciones y una razón principal por la cual los RCA y los planes de acción correctiva no logran prevenir la recurrencia. Además, se debe tener cuidado para evitar planes de acciones correctivas que simplemente agreguen más requisitos administrativos y más capacitación a la organización. Para evitar esto, utilice la Jerarquía de controles de peligros y la Prueba de errores Lean como pautas para desarrollar acciones correctivas efectivas que tengan una probabilidad mucho mayor de prevenir la recurrencia.
  8. Revisiones de efectividad: Después de un período predeterminado después de la implementación del plan de acción correctiva, se programa una revisión de efectividad para evaluar la efectividad de esas acciones correctivas. Esto requiere especificar un conjunto de métricas o indicadores que serán monitoreados antes y después de que se implementen las acciones correctivas, para que podamos medir su impacto. Si no se logran los resultados deseados, que en la mayoría de los casos es una reducción significativa en la magnitud o frecuencia del evento o problema, entonces se debe reabrir el RCA por no haber sido efectivo.

Para que sea eficaz, el análisis de la causa raíz debe realizarse de forma sistemática. El proceso brinda la oportunidad de no perderse ningún otro detalle importante. Generalmente se requiere un esfuerzo de equipo e idealmente todas las personas involucradas deberían llegar a la misma conclusión. En los análisis de accidentes aéreos, por ejemplo, las conclusiones de la investigación y las causas profundas identificadas deben estar respaldadas por pruebas documentadas. [10]

Transición a acciones correctivas

El objetivo de RCA es identificar la causa raíz del problema con la intención de evitar que se repita o empeore. El siguiente paso es implementar acciones correctivas a largo plazo para abordar la causa raíz identificada durante el RCA y asegurarse de que el problema no vuelva a surgir. Sin embargo, corregir un problema no es formalmente parte de RCA; Estos son diferentes pasos en un proceso de resolución de problemas conocido como gestión de fallas en TI y telecomunicaciones, reparación en ingeniería, remediación en aviación, remediación ambiental en ecología , terapia en medicina , etc.

Dominios de aplicación

El análisis de causa raíz se utiliza en muchos dominios de aplicaciones. RCA se menciona específicamente en el Código de Regulaciones Federales de los Estados Unidos en muchos de los títulos. Por ejemplo:

  1. TÍTULO 10 - ENERGÍA >>> 10CFR Parte 50, Apéndice B, Criterio XVI, “Acciones Correctivas” (también adoptado por NQA-1)
    • “Se deben establecer medidas para asegurar que las condiciones adversas a la calidad, tales como fallas, mal funcionamiento, deficiencias, material y equipo defectuoso y no conformidades, se identifiquen y corrijan prontamente.
    • En el caso de condiciones significativas adversas a la calidad, las medidas deberán garantizar que se determine la causa de la condición y se tomen medidas correctivas para evitar que se repita."
  2. TÍTULO 14 - AERONÁUTICA Y ESPACIO >>> 14 CFR Capítulo III, Subcapítulo C, Parte 437, Subparte C, §437.73 Registro de anomalías, reporte e implementación de acciones correctivas.
    1. Un titular de permiso debe registrar cada anomalía que afecte un sistema, subsistema, proceso, instalación o equipo de soporte crítico para la seguridad.
    2. Un titular del permiso debe identificar todas las causas fundamentales de cada anomalía e implementar todas las acciones correctivas para cada anomalía.
  3. TÍTULO 21 - ALIMENTOS Y MEDICAMENTOS >>> 21 CFR Subparte J: 21CFR820.100(a) – Acción correctiva/preventiva: (A) Cada fabricante deberá establecer y mantener procedimientos para implementar acciones correctivas y preventivas. Los procedimientos incluirán requisitos para:
    1. Investigar la causa de las no conformidades relacionadas con el producto, los procesos y el sistema de calidad;
    2. Identificar las acciones necesarias para corregir y prevenir la recurrencia de productos no conformes y otros problemas de calidad;
    3. Verificar o validar la acción correctiva y preventiva para garantizar que dicha acción sea efectiva y no afecte negativamente al dispositivo terminado;
  4. TÍTULO 42 - SALUD PÚBLICA >>> 42 CFR PARTE 488, PROCEDIMIENTOS DE ENCUESTA, CERTIFICACIÓN Y CUMPLIMIENTO > Subparte E—Inspección y certificación de centros de atención a largo plazo
    1. §488.61 Procedimientos especiales para la aprobación y reaprobación de programas de trasplante de órganos.
    2. ...Análisis de causa raíz para muertes de pacientes y fallas de injertos, incluidos los factores que el programa ha identificado como probables factores causales o contribuyentes a las muertes de pacientes y fallas de injertos;

Control de procesos industriales y de fabricación.

El ejemplo anterior ilustra cómo se puede utilizar RCA en la fabricación . El RCA también se utiliza habitualmente en el control de procesos industriales , por ejemplo, para controlar la producción de productos químicos ( control de calidad ).

RCA también se utiliza para análisis de fallas en ingeniería y mantenimiento .

TI y telecomunicaciones

El análisis de causa raíz se utiliza con frecuencia en TI y telecomunicaciones para detectar las causas fundamentales de problemas graves. Por ejemplo, en el marco de gestión de servicios ITIL , el objetivo de la gestión de incidentes es reanudar un servicio de TI defectuoso lo antes posible (gestión reactiva), mientras que la gestión de problemas se ocupa de resolver problemas recurrentes para siempre abordando sus causas fundamentales (gestión proactiva). .

Otro ejemplo es el proceso de gestión de incidentes de seguridad informática , donde a menudo se utiliza el análisis de la causa raíz para investigar violaciones de seguridad. [11]

RCA también se utiliza junto con el monitoreo de actividades comerciales y el procesamiento de eventos complejos para analizar fallas en los procesos comerciales .

Su uso en la industria de TI no siempre se puede comparar con su uso en industrias críticas para la seguridad, ya que normalmente el uso de RCA en la industria de TI no está respaldado por árboles de fallas preexistentes u otras especificaciones de diseño. En lugar de ello, el análisis normalmente se apoya en una combinación de sistemas de depuración, detección basada en eventos y monitoreo (donde los servicios se modelan individualmente). No existen herramientas de capacitación y soporte como simulación o diferentes runbooks detallados para todos los escenarios esperados, sino que se crean a posteriori en función de problemas que se consideran "valiosos". Como resultado, el análisis a menudo se limita a aquellas cosas que tienen interfaces de monitoreo/observación y no a la función real planificada/vista, centrándose en la verificación de entradas y salidas. De ahí que el dicho "no existe una causa raíz" se haya vuelto común en la industria de TI.

Salud y seguridad

En los ámbitos de la salud y la seguridad , el RCA se utiliza habitualmente en medicina (diagnóstico) y epidemiología (por ejemplo, para identificar el origen de una enfermedad infecciosa), donde los métodos de inferencia causal a menudo requieren experiencia tanto clínica como estadística para dar sentido a las complejidades de los procesos. [12]

El RCA se utiliza en ciencias ambientales (p. ej., para analizar desastres ambientales), análisis de accidentes (industria de aviación y ferrocarriles) y seguridad y salud ocupacional . [13] En la fabricación de dispositivos médicos, [14] productos farmacéuticos, [15] alimentos, [16] y suplementos dietéticos, [17] el análisis de la causa raíz es un requisito reglamentario.

Análisis de sistemas

RCA también se utiliza en gestión de cambios , gestión de riesgos y análisis de sistemas .

Desafíos

Sin profundizar en las idiosincrasias de problemas específicos, varias condiciones generales pueden hacer que el RCA sea más difícil de lo que parece a primera vista.

En primer lugar, a menudo falta información importante porque, en la práctica, generalmente no es posible monitorear todo y almacenar todos los datos de monitoreo durante mucho tiempo.

En segundo lugar, reunir datos y evidencia y clasificarlos a lo largo de una línea de tiempo desde eventos hasta el problema final puede no ser trivial. En telecomunicaciones, por ejemplo, los sistemas de monitorización distribuidos suelen gestionar entre un millón y mil millones de eventos al día. Encontrar unos pocos acontecimientos relevantes en una masa tan grande de acontecimientos irrelevantes es pedir encontrar la proverbial aguja en un pajar.

En tercer lugar, puede haber más de una causa raíz para un problema determinado, y esta multiplicidad puede hacer que el gráfico causal sea muy difícil de establecer.

En cuarto lugar, los gráficos causales suelen tener muchos niveles, y el análisis de la causa raíz termina en un nivel que es "raíz" a los ojos del investigador. Mirando nuevamente el ejemplo anterior en el control de procesos industriales, una investigación más profunda podría revelar que los procedimientos de mantenimiento en la planta incluían inspecciones periódicas del subsistema de lubricación cada dos años, mientras que el producto del proveedor actual del subsistema de lubricación especificaba un período de 6 meses. El cambio de proveedor puede haberse debido al deseo de la gerencia de ahorrar dinero y a no haber consultado con el personal de ingeniería sobre las implicaciones del cambio en los procedimientos de mantenimiento. Por lo tanto, si bien la "causa raíz" que se muestra arriba puede haber evitado la recurrencia citada, no habría evitado otras fallas, tal vez más graves, que afectaron a otras máquinas.

Ver también

Notas

  1. ^ Véase Wilson, Dell y Anderson 1993, págs. 8-17.
  2. ^ Ver IATA 2016 y Sofema 2017.
  3. ^ Véase Maná y Pnueli 1995.
  4. ^ Véase Lewerentz y Lindner 1995.
  5. ^ Véase Babaoglu et al. 2005.
  6. ^ Véase Ohno 1988.
  7. ^ "La cura peor que la enfermedad". Los New York Times . 5 de noviembre de 1927.
  8. ^ Andrew C. Revkin (7 de diciembre de 2000). "Dragar los PCB de River podría ser una cura peor que la enfermedad, insiste GE". Los New York Times .
  9. ^ Phillip Longman (9 de junio de 2004). "La crisis mundial de bebés". Los New York Times .
  10. ^ Ver IATA 2016.
  11. ^ Véase Abubakar et al. 2016
  12. ^ Landsittel, Douglas; Srivastava, Avantika; Kropf, Kristin (2020). "Una revisión narrativa de métodos de inferencia causal y recursos educativos asociados". Gestión de la Calidad en la Atención de la Salud . 29 (4): 260–269. doi :10.1097/QMH.0000000000000276. ISSN  1063-8628. PMID  32991545. S2CID  222146291.
  13. ^ Ver OSHA 2019.
  14. ^ Oficina de Asuntos Regulatorios (26 de diciembre de 2019). "Acciones Correctivas y Preventivas (CAPA)". FDA .
  15. ^ FDA de EE. UU. "BUENAS PRÁCTICAS DE FABRICACIÓN ACTUAL DE PRODUCTOS FARMACÉUTICOS TERMINADOS". Código Electrónico de Regulaciones Federales (eCFR) . Consultado el 28 de diciembre de 2020 .
  16. ^ FDA de EE. UU. "BUENAS PRÁCTICAS ACTUALES DE FABRICACIÓN, ANÁLISIS DE RIESGOS Y CONTROLES PREVENTIVOS BASADOS EN RIESGOS PARA LA ALIMENTACIÓN HUMANA". Código Electrónico de Regulaciones Federales (eCFR) . Consultado el 28 de diciembre de 2020 .
  17. ^ FDA de EE. UU. “BUENAS PRÁCTICAS DE FABRICACIÓN ACTUAL EN OPERACIONES DE FABRICACIÓN, ENVASADO, ETIQUETADO O CONSERVACIÓN DE COMPLEMENTOS DIETÉTICOS”. Código Electrónico de Regulaciones Federales (eCFR) . Consultado el 28 de diciembre de 2020 .

Referencias

enlaces externos