stringtranslate.com

Umbral de error (evolución)

En biología evolutiva y genética de poblaciones , el umbral de error (o tasa de mutación crítica ) es un límite en el número de pares de bases que una molécula autorreplicante puede tener antes de que la mutación destruya la información en las generaciones posteriores de la molécula. El umbral de error es crucial para comprender la "paradoja de Eigen".

El umbral de error es un concepto en los orígenes de la vida ( abiogénesis ), en particular de la vida muy temprana, antes de la llegada del ADN . Se postula que las primeras moléculas autorreplicantes podrían haber sido pequeñas moléculas de ARN similares a ribozimas . Estas moléculas constan de cadenas de pares de bases o "dígitos" y su orden es un código que dirige cómo la molécula interactúa con su entorno. Toda replicación está sujeta a errores de mutación. Durante el proceso de replicación, cada dígito tiene una cierta probabilidad de ser reemplazado por algún otro dígito, lo que cambia la forma en que la molécula interactúa con su entorno y puede aumentar o disminuir su aptitud o capacidad de reproducirse en ese entorno.

Paisaje de fitness

Manfred Eigen señaló en su artículo de 1971 (Eigen 1971) que este proceso de mutación impone un límite al número de dígitos que puede tener una molécula. Si una molécula excede este tamaño crítico, el efecto de las mutaciones se vuelve abrumador y un proceso de mutación desbocado destruirá la información en las generaciones posteriores de la molécula. El umbral de error también está controlado por el "panorama de aptitud" de las moléculas. El panorama del fitness se caracteriza por los dos conceptos de altura (=fitness) y distancia (=número de mutaciones). Las moléculas similares están "cerca" unas de otras, y las moléculas que son más aptas que otras y tienen más probabilidades de reproducirse, están "más arriba" en el paisaje.

Si una secuencia particular y sus vecinos tienen una alta aptitud, formarán una cuasiespecie y podrán soportar longitudes de secuencia más largas que una secuencia ajustada con pocos vecinos aptos, o una vecindad de secuencias menos ajustadas. Además, Wilke (Wilke 2005) señaló que el concepto de umbral de error no se aplica en partes del paisaje donde hay mutaciones letales, en las que la mutación inducida produce una aptitud nula y prohíbe que la molécula se reproduzca.

La paradoja de Eigen

La paradoja de Eigen es uno de los enigmas más difíciles de resolver en el estudio de los orígenes de la vida. Se cree que el concepto de umbral de error descrito anteriormente limita el tamaño de las moléculas autorreplicantes a unos pocos cientos de dígitos, pero casi toda la vida en la Tierra requiere moléculas mucho más largas para codificar su información genética. Este problema se maneja en las células vivas mediante enzimas que reparan mutaciones, permitiendo que las moléculas codificantes alcancen tamaños del orden de millones de pares de bases. Estas grandes moléculas deben, por supuesto, codificar las mismas enzimas que las reparan, y aquí radica la paradoja de Eigen, expuesta por primera vez por Manfred Eigen en su artículo de 1971 (Eigen 1971). [1] En pocas palabras, la paradoja de Eigen equivale a lo siguiente:

Esta es una especie de paradoja del huevo o la gallina , con una solución aún más difícil. ¿Qué fue primero, el genoma grande o las enzimas correctoras de errores? Se han propuesto varias soluciones a esta paradoja:

Un modelo matemático simple

Considere una molécula de 3 dígitos [A,B,C] donde A, B y C pueden tomar los valores 0 y 1. Hay ocho secuencias de este tipo ([000], [001], [010], [011] , [100], [101], [110] y [111]). Digamos que la molécula [000] es la más apta; en cada replicación produce un promedio de copias, donde . Esta molécula se llama "secuencia maestra". Las otras siete secuencias son menos aptas; cada uno de ellos produce sólo 1 copia por replicación. La replicación de cada uno de los tres dígitos se realiza con una tasa de mutación de μ. En otras palabras, en cada replicación de un dígito de una secuencia, existe la probabilidad de que sea erróneo; 0 será reemplazado por 1 o viceversa. Ignoremos las mutaciones dobles y la muerte de las moléculas (la población crecerá infinitamente) y dividamos las ocho moléculas en tres clases dependiendo de su distancia de Hamming de la secuencia maestra:

Tenga en cuenta que el número de secuencias para la distancia d es solo el coeficiente binomial para L=3, y que cada secuencia se puede visualizar como el vértice de un cubo tridimensional L=3, donde cada arista del cubo especifica una ruta de mutación en la que cambiar la distancia de Hamming es cero o ±1. Se puede observar que, por ejemplo, un tercio de las mutaciones de las moléculas [001] producirán moléculas [000], mientras que los otros dos tercios producirán las moléculas de clase 2 [011] y [101]. Ahora podemos escribir la expresión para las poblaciones hijas de la clase i en términos de las poblaciones padres .

donde la matriz ' w ' que incorpora la selección natural y la mutación, según modelo de cuasiespecies , viene dada por:

¿Dónde está la probabilidad de que una molécula completa se replique con éxito? Los vectores propios de la matriz w producirán los números de población de equilibrio para cada clase. Por ejemplo, si la tasa de mutación μ es cero, tendremos Q=1 y las concentraciones de equilibrio serán . La secuencia maestra, siendo el más apto será el único que sobreviva. Si tenemos una fidelidad de replicación de Q=0,95 y una ventaja genética de a=1,05, entonces las concentraciones de equilibrio serán aproximadamente . Se puede observar que la secuencia maestra no es tan dominante; sin embargo, las secuencias con baja distancia de Hamming son mayoritarias. Si tenemos una fidelidad de replicación de Q cercana a 0, entonces las concentraciones de equilibrio serán aproximadamente . Esta es una población con el mismo número de cada una de las 8 secuencias. (Si tuviéramos una población perfectamente igual de todas las secuencias, tendríamos poblaciones de [1,3,3,1]/8).

Si ahora vamos al caso donde el número de pares de bases es grande, digamos L=100, obtenemos un comportamiento que se asemeja a una transición de fase . El gráfico siguiente a la izquierda muestra una serie de concentraciones de equilibrio divididas por el coeficiente binomial . (Esta multiplicación mostrará la población de una secuencia individual a esa distancia y producirá una línea plana para una distribución igual). La ventaja selectiva de la secuencia maestra se establece en a=1,05. El eje horizontal es la distancia de Hamming d  . Las distintas curvas corresponden a distintas tasas de mutación totales . Se ve que para valores bajos de la tasa de mutación total, la población consiste en una cuasiespecie reunida en las proximidades de la secuencia maestra. Por encima de una tasa de mutación total de aproximadamente 1-Q=0,05, la distribución se extiende rápidamente para poblar todas las secuencias por igual. El gráfico siguiente a la derecha muestra la población fraccionaria de la secuencia maestra en función de la tasa de mutación total. Nuevamente se ve que por debajo de una tasa de mutación crítica de aproximadamente 1-Q=0,05, la secuencia maestra contiene a la mayor parte de la población, mientras que por encima de esta tasa, contiene sólo alrededor de la población total.

Números de población en función de la distancia d de Hamming y la tasa de mutación (1-Q). El eje horizontal d   es la distancia de Hamming de las secuencias moleculares de la secuencia maestra. El eje vertical es el logaritmo de la población para cualquier secuencia a esa distancia dividido por la población total (de ahí la división de n d por el coeficiente binomial). El número total de dígitos por secuencia es L=100 y la secuencia maestra tiene una ventaja selectiva de a=1,05.
La población de la secuencia maestra como fracción de la población total ( n ) en función de la tasa de mutación general (1-Q). El número total de dígitos por secuencia es L=100 y la secuencia maestra tiene una ventaja selectiva de a=1,05. Se ve que la "transición de fase" ocurre aproximadamente en 1-Q=0,05.

Se puede observar que hay una transición brusca en un valor de 1-Q   un poco mayor que 0,05. Para tasas de mutación superiores a este valor, la población de la secuencia maestra cae prácticamente a cero. Por encima de este valor, domina.

En el límite, cuando L se acerca al infinito, el sistema de hecho tiene una transición de fase en un valor crítico de Q :. Se podría pensar en la tasa de mutación general (1-Q) como una especie de "temperatura" que "derrite" la fidelidad de las secuencias moleculares por encima de la "temperatura" crítica de . Para que se produzca una replicación fiel, la información debe estar "congelada" en el genoma.

Ver también

Referencias

  1. ^ Holmes, Edward C. (2009). La evolución y aparición de los virus de ARN. Prensa de la Universidad de Oxford. págs.22, 23, 48. ISBN 9780199211128. Consultado el 1 de febrero de 2019 .