Un fallo en cascada es un fallo en un sistema de partes interconectadas en el que el fallo de una o pocas partes conduce al fallo de otras partes, creciendo progresivamente como resultado de la retroalimentación positiva . Esto puede ocurrir cuando falla una sola parte, lo que aumenta la probabilidad de que fallen otras partes del sistema. [1] [2] Este tipo de fallo puede ocurrir en muchos tipos de sistemas, incluidos la transmisión de energía, las redes informáticas, las finanzas, los sistemas de transporte, los organismos, el cuerpo humano y los ecosistemas.
Los fallos en cascada pueden ocurrir cuando falla una parte del sistema. Cuando esto sucede, otras partes deben compensar el componente que falló. Esto, a su vez, sobrecarga estos nodos, lo que hace que fallen también, lo que provoca que otros nodos fallen uno tras otro.
Los fallos en cascada son comunes en las redes eléctricas cuando uno de los elementos falla (total o parcialmente) y desplaza su carga a los elementos cercanos del sistema. Estos elementos cercanos son entonces empujados más allá de su capacidad, por lo que se sobrecargan y desplazan su carga a otros elementos. Los fallos en cascada son un efecto común que se observa en los sistemas de alta tensión , donde un único punto de fallo (SPF) en un sistema totalmente cargado o ligeramente sobrecargado da como resultado un pico repentino en todos los nodos del sistema. Esta sobrecorriente puede inducir el fallo de los nodos ya sobrecargados, lo que desencadena más sobrecargas y, por lo tanto, hace que todo el sistema se caiga en muy poco tiempo.
Este proceso de falla se propaga en cascada a través de los elementos del sistema como una onda en un estanque y continúa hasta que prácticamente todos los elementos del sistema se ven afectados y/o el sistema se desconecta funcionalmente de la fuente de su carga. Por ejemplo, bajo ciertas condiciones, una gran red eléctrica puede colapsar después de la falla de un solo transformador.
El monitoreo del funcionamiento de un sistema en tiempo real y la desconexión juiciosa de partes pueden ayudar a detener una cascada. Otra técnica común es calcular un margen de seguridad para el sistema mediante una simulación por computadora de posibles fallas, para establecer niveles de operación seguros por debajo de los cuales no se predice que ninguno de los escenarios calculados cause una falla en cascada, e identificar las partes de la red que tienen más probabilidades de causar fallas en cascada. [3]
Uno de los principales problemas para prevenir fallas en la red eléctrica es que la velocidad de la señal de control no es mayor que la velocidad de la sobrecarga de potencia que se propaga, es decir, como tanto la señal de control como la potencia eléctrica se mueven a la misma velocidad, no es posible aislar la falla enviando un aviso con anticipación para aislar el elemento.
Una falla en cascada provocó los siguientes cortes de energía :
Los fallos en cascada también pueden ocurrir en redes informáticas (como Internet ) en las que el tráfico de red se ve gravemente afectado o detenido hacia o entre secciones más grandes de la red, debido a hardware o software defectuosos o desconectados. En este contexto, el fallo en cascada se conoce con el término fallo en cascada . Un fallo en cascada puede afectar a grandes grupos de personas y sistemas.
La causa de un fallo en cascada suele ser la sobrecarga de un único enrutador o nodo crucial, lo que provoca que el nodo deje de funcionar, aunque sea brevemente. También puede deberse a que se desactive un nodo para realizar tareas de mantenimiento o actualizaciones. En cualquier caso, el tráfico se enruta hacia o a través de otra ruta (alternativa). Como resultado, esta ruta alternativa se sobrecarga, lo que provoca que se caiga, y así sucesivamente. También afectará a los sistemas que dependen del nodo para su funcionamiento habitual.
Los síntomas de una falla en cascada incluyen: pérdida de paquetes y alta latencia de red , no solo en sistemas individuales, sino en secciones completas de una red o Internet. La alta latencia y la pérdida de paquetes son causadas por los nodos que no funcionan debido al colapso de la congestión , lo que hace que sigan presentes en la red pero sin mucha o ninguna comunicación útil que pase a través de ellos. Como resultado, las rutas aún pueden considerarse válidas, sin que realmente proporcionen comunicación.
Si se interrumpen suficientes rutas debido a un fallo en cascada, una sección completa de la red o de Internet puede volverse inaccesible. Aunque no es deseable, esto puede ayudar a acelerar la recuperación de esta falla, ya que las conexiones se agotarán y otros nodos dejarán de intentar establecer conexiones con las secciones que se cortaron, lo que reducirá la carga en los nodos involucrados.
Una situación común durante una falla en cascada es una falla de desplazamiento , en la que las secciones se caen, lo que hace que la siguiente sección falle, después de lo cual la primera sección vuelve a subir. Esta onda puede realizar varias pasadas a través de las mismas secciones o nodos de conexión antes de que se restablezca la estabilidad.
Los fallos en cascada son un fenómeno relativamente reciente, debido al aumento masivo del tráfico y la alta interconectividad entre sistemas y redes. El término fue aplicado por primera vez en este contexto a fines de la década de 1990 por un profesional de TI holandés y poco a poco se ha convertido en un término relativamente común para este tipo de fallo a gran escala. [ cita requerida ]
Los fallos de red suelen comenzar cuando falla un único nodo de red. Inicialmente, el tráfico que normalmente pasaría por el nodo se detiene. Los sistemas y los usuarios reciben errores sobre la imposibilidad de llegar a los hosts. Por lo general, los sistemas redundantes de un ISP responden muy rápidamente y eligen otra ruta a través de una red troncal diferente. La ruta de enrutamiento a través de esta ruta alternativa es más larga, con más saltos y, posteriormente, pasa por más sistemas que normalmente no procesan la cantidad de tráfico que se ofrece de repente.
Esto puede provocar que uno o más sistemas a lo largo de la ruta alternativa dejen de funcionar, creando así problemas similares.
En este caso, también se ven afectados los sistemas relacionados. Por ejemplo, la resolución de DNS puede fallar y lo que normalmente provocaría que los sistemas se interconectaran, puede interrumpir conexiones que ni siquiera están directamente relacionadas con los sistemas que dejaron de funcionar. Esto, a su vez, puede provocar que nodos aparentemente no relacionados desarrollen problemas, lo que puede provocar otro fallo en cascada por sí solo.
En diciembre de 2012, se produjo una pérdida parcial (40%) del servicio Gmail a nivel mundial durante 18 minutos. Esta pérdida de servicio fue causada por una actualización rutinaria del software de equilibrio de carga que contenía una lógica defectuosa; en este caso, el error fue causado por una lógica que utilizaba un "todos" inadecuado en lugar del "algunos" más apropiado. [4] El error en cascada se solucionó actualizando completamente un solo nodo de la red en lugar de actualizar parcialmente todos los nodos a la vez.
Ciertas estructuras portantes con componentes estructurales discretos pueden estar sujetas al "efecto cremallera", en el que la falla de un solo miembro estructural aumenta la carga sobre los miembros adyacentes. En el caso del colapso de la pasarela del Hyatt Regency , una pasarela suspendida (que ya estaba sobrecargada debido a un error en la construcción) falló cuando falló una sola varilla de suspensión vertical, sobrecargando las varillas vecinas que fallaron secuencialmente (es decir, como una cremallera ). Un puente que puede tener una falla de este tipo se llama crítico por fractura, y numerosos colapsos de puentes han sido causados por la falla de una sola parte. Las estructuras diseñadas correctamente utilizan un factor de seguridad adecuado y/o rutas de carga alternativas para prevenir este tipo de falla mecánica en cascada. [5]
La cascada de fracturas es un fenómeno en el contexto de la geología y describe el desencadenamiento de una reacción en cadena de fracturas posteriores por una única fractura. [6] La fractura inicial conduce a la propagación de fracturas adicionales, lo que provoca un efecto en cascada en todo el material.
Las cascadas de fracturas pueden ocurrir en diversos materiales, incluidas rocas, hielo, metales y cerámicas. [7] Un ejemplo común es la flexión de espaguetis secos , que en la mayoría de los casos se rompen en más de 2 pedazos, como observó por primera vez Richard Feynman . [7]
En el contexto de la osteoporosis , una cascada de fracturas es el aumento del riesgo de fracturas óseas posteriores a una inicial. [8]
En biología existen cascadas bioquímicas , en las que una pequeña reacción puede tener consecuencias para todo el sistema. Un ejemplo negativo es la cascada isquémica , en la que un pequeño ataque isquémico libera toxinas que matan muchas más células que el daño inicial, lo que da como resultado la liberación de más toxinas. La investigación actual tiene como objetivo encontrar una forma de bloquear esta cascada en pacientes con accidente cerebrovascular para minimizar el daño.
En el estudio de la extinción, a veces la extinción de una especie provoca la extinción de muchas otras. A estas especies se las conoce como especies clave .
Otro ejemplo es el generador Cockcroft-Walton , que también puede experimentar fallas en cascada en las que un diodo defectuoso puede provocar que todos los diodos fallen en una fracción de segundo.
Otro ejemplo de este efecto en un experimento científico fue la implosión en 2001 de varios miles de frágiles tubos fotomultiplicadores de vidrio utilizados en el experimento Super-Kamiokande , donde la onda de choque causada por el fallo de un solo detector parece haber desencadenado la implosión de los demás detectores en una reacción en cadena.
En el ámbito financiero , el riesgo de quiebras en cascada de instituciones financieras se denomina riesgo sistémico : la quiebra de una institución financiera puede provocar la quiebra de otras instituciones financieras (sus contrapartes ), con un efecto dominó en todo el sistema. Las instituciones que se cree que plantean un riesgo sistémico se consideran " demasiado grandes para quebrar " (TBTF, por sus siglas en inglés) o "demasiado interconectadas para quebrar" (TICTF, por sus siglas en inglés), según el motivo por el que parezcan representar una amenaza.
Sin embargo, cabe señalar que el riesgo sistémico no se debe a instituciones individuales en sí, sino a las interconexiones. En la literatura científica se han desarrollado marcos para estudiar y predecir los efectos de las fallas en cascada. [9] [10] [11]
Un tipo relacionado (aunque distinto) de falla en cascada en las finanzas ocurre en el mercado de valores, ejemplificado por el Flash Crash de 2010. [11]
Diversas infraestructuras como el suministro de agua , el transporte , el combustible y las centrales eléctricas están acopladas entre sí y dependen unas de otras para su funcionamiento, véase la figura 1. Debido a este acoplamiento, las redes interdependientes son extremadamente sensibles a fallos aleatorios, y en particular a ataques dirigidos , de modo que un fallo de una pequeña fracción de nodos en una red puede desencadenar una cascada iterativa de fallos en varias redes interdependientes. [12] [13] Los apagones eléctricos con frecuencia resultan de una cascada de fallos entre redes interdependientes, y el problema ha sido ejemplificado dramáticamente por los varios apagones a gran escala que han ocurrido en los últimos años. Los apagones son una demostración fascinante del importante papel que desempeñan las dependencias entre redes. Por ejemplo, el apagón de Italia de 2003 resultó en un fallo generalizado de la red ferroviaria , los sistemas de atención sanitaria y los servicios financieros y, además, influyó gravemente en las redes de telecomunicaciones . El fallo parcial del sistema de comunicación a su vez perjudicó aún más el sistema de gestión de la red eléctrica , produciendo así una retroalimentación positiva en la red eléctrica. [14] Este ejemplo enfatiza cómo la interdependencia puede magnificar significativamente el daño en un sistema de red en interacción.
Un modelo para fallas en cascada debido a la propagación de sobrecarga es el modelo Motter-Lai. [15]
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )