La catástrofe de error se refiere a la pérdida acumulada de información genética en un linaje de organismos debido a altas tasas de mutación. La tasa de mutación por encima de la cual se produce la catástrofe de error se denomina umbral de error . Ambos términos fueron acuñados por Manfred Eigen en su teoría matemática evolutiva de las cuasiespecies . [1]
El término se utiliza más ampliamente para referirse a la acumulación de mutaciones hasta el punto de inviabilidad del organismo o virus, donde no puede producir suficiente descendencia viable para mantener una población. Este uso del término de Eigen fue adoptado por Lawrence Loeb y colegas para describir la estrategia de mutagénesis letal para curar el VIH mediante el uso de análogos de ribonucleósidos mutagénicos. [2] [3]
Hubo un uso anterior del término introducido en 1963 por Leslie Orgel en una teoría sobre el envejecimiento celular, en la que los errores en la traducción de las proteínas involucradas en la traducción de proteínas amplificarían los errores hasta que la célula se volviera inviable. [4] Esta teoría no ha recibido apoyo empírico. [5]
La catástrofe de error se predice en ciertos modelos matemáticos de evolución y también se ha observado empíricamente. [6]
Como cualquier organismo, los virus "cometen errores" (o mutan ) durante la replicación. Las mutaciones resultantes aumentan la biodiversidad en la población y pueden conferir ventajas como ayudar a subvertir la capacidad del sistema inmunológico de un huésped para reconocerlo en una infección posterior. Cuantas más mutaciones realice el virus durante la replicación, más probabilidades tendrá de evitar ser reconocido por el sistema inmunológico y más diversa será su población (véase el artículo sobre biodiversidad para una explicación de las ventajas selectivas de esto). Sin embargo, las mutaciones no son, por regla general, beneficiosas y, si acumula demasiadas mutaciones dañinas, puede perder algunas de sus características biológicas que han evolucionado para su beneficio, incluida su capacidad de reproducirse.
Surge la pregunta: ¿cuántas mutaciones pueden ocurrir durante cada replicación antes de que la población de virus comience a perder la capacidad de sobrevivir?
Consideremos un virus que tiene una identidad genética modelada por una cadena de unos y ceros (por ejemplo, 11010001011101...). Supongamos que la cadena tiene una longitud fija L y que durante la replicación el virus copia cada dígito uno por uno, cometiendo un error con probabilidad q independientemente de todos los demás dígitos.
Debido a las mutaciones resultantes de la replicación errónea, existen hasta 2 L cepas distintas derivadas del virus original. Sea x i la concentración de la cepa i ; sea a i la velocidad a la que se reproduce la cepa i ; y sea Q ij la probabilidad de que un virus de la cepa i mute a la cepa j .
Entonces la tasa de cambio de concentración x j está dada por
En este punto, hacemos una idealización matemática: escogemos la cepa más apta (la que tiene la mayor tasa de reproducción a j ) y asumimos que es única (es decir, que la a j elegida satisface a j > a i para todo i ≠ j ); y luego agrupamos las cepas restantes en un solo grupo. Sean x , y las concentraciones de los dos grupos con tasas de reproducción a > b , respectivamente; sea Q la probabilidad de que un virus del primer grupo ( x ) mute a un miembro del segundo grupo ( y ) y sea R la probabilidad de que un miembro del segundo grupo regrese al primero (a través de una mutación improbable y muy específica). Las ecuaciones que gobiernan el desarrollo de las poblaciones son:
Nos interesa especialmente el caso en que L es muy grande, por lo que podemos descuidar con seguridad R y, en su lugar, considerar:
Luego, estableciendo z = x/y tenemos
Suponiendo que z alcanza una concentración constante a lo largo del tiempo, z se estabiliza para satisfacer
(que se deduce fijando la derivada de z con respecto al tiempo en cero).
Por lo tanto, la pregunta importante es ¿bajo qué valores de parámetros persiste (sigue existiendo) la población original? La población persiste si y solo si el valor de estado estable de z es estrictamente positivo, es decir, si y solo si:
Este resultado se expresa más popularmente en términos de la relación de a:b y la tasa de error q de los dígitos individuales: establezca b/a = (1-s) , entonces la condición se convierte en
Tomando un logaritmo en ambos lados y aproximando para q y s pequeños se obtiene
reduciendo la condición a:
Los virus de ARN que se replican cerca del umbral de error tienen un tamaño de genoma del orden de 10 4 (10000) pares de bases . El ADN humano tiene una longitud de aproximadamente 3.300 millones (10 9 ) de unidades de bases. Esto significa que el mecanismo de replicación del ADN humano debe ser órdenes de magnitud más preciso que el del ARN de los virus de ARN.
Para evitar una catástrofe de errores, la cantidad de información perdida a través de la mutación debe ser menor que la cantidad ganada a través de la selección natural. Este hecho puede utilizarse para llegar a ecuaciones esencialmente iguales a las de la presentación diferencial más común. [7]
La información perdida se puede cuantificar como la longitud del genoma L multiplicada por la tasa de error de replicación q . La probabilidad de supervivencia, S , determina la cantidad de información aportada por la selección natural, y la información es el logaritmo negativo de la probabilidad. Por lo tanto, un genoma solo puede sobrevivir sin cambios cuando
Por ejemplo, el genoma muy simple donde L = 1 y q = 1 es un genoma con un bit que siempre muta. Como Lq es entonces 1, se deduce que S tiene que ser 1/2 o menos. Esto corresponde a la mitad de la descendencia que sobrevive; es decir, la mitad con el genoma correcto.
Algunos virus, como el de la polio o el de la hepatitis C, operan muy cerca de la tasa crítica de mutación (es decir, la q máxima que L permitirá). Se han creado medicamentos para aumentar la tasa de mutación de los virus con el fin de empujarlos más allá del límite crítico para que pierdan su identidad propia. Sin embargo, dadas las críticas al supuesto básico del modelo matemático, este enfoque es problemático. [8]
El resultado presenta un misterio para los biólogos: la paradoja de Eigen : en general, se requieren genomas grandes para una replicación precisa (se logran altas tasas de replicación con la ayuda de enzimas ), pero un genoma grande requiere una alta tasa de precisión q para persistir. ¿Qué ocurre primero y cómo sucede? Una ilustración de la dificultad involucrada es que L solo puede ser 100 si q' es 0,99, una longitud de cadena muy pequeña en términos de genes. [ cita requerida ]