El reloj molecular es un término figurado para una técnica que utiliza la tasa de mutación de biomoléculas para deducir el momento en la prehistoria en el que dos o más formas de vida divergieron . Los datos biomoleculares utilizados para tales cálculos suelen ser secuencias de nucleótidos de ADN , ARN o secuencias de aminoácidos de proteínas . Los puntos de referencia para determinar la tasa de mutación suelen ser fechas fósiles o arqueológicas. El reloj molecular se probó por primera vez en 1962 en las variantes de la proteína hemoglobina de varios animales y se usa comúnmente en la evolución molecular para estimar los tiempos de especiación o radiación . A veces se le llama reloj genético o reloj evolutivo .
La noción de la existencia del llamado "reloj molecular" se atribuyó por primera vez a Émile Zuckerkandl y Linus Pauling quienes, en 1962, observaron que el número de diferencias de aminoácidos en la hemoglobina entre diferentes linajes cambia aproximadamente de forma lineal con el tiempo, según se estima a partir de Evidencia fósil. [1] Generalizaron esta observación para afirmar que la tasa de cambio evolutivo de cualquier proteína específica era aproximadamente constante a lo largo del tiempo y en diferentes linajes (conocida como la hipótesis del reloj molecular ).
El fenómeno de la equidistancia genética fue observado por primera vez en 1963 por Emanuel Margoliash , quien escribió: "Parece que el número de diferencias de residuos entre el citocromo c de dos especies cualesquiera está condicionado principalmente por el tiempo transcurrido desde que las líneas de evolución que condujeron a estas dos especies originalmente divergido. Si esto es correcto, el citocromo c de todos los mamíferos debería ser igualmente diferente del citocromo c de todas las aves. Dado que los peces divergen del tallo principal de la evolución de los vertebrados antes que las aves o los mamíferos, el citocromo c tanto de los mamíferos como de las aves debería ser igualmente diferente del citocromo c del pez. De manera similar, todo el citocromo c de los vertebrados debería ser igualmente diferente de la proteína de la levadura". [2] Por ejemplo, la diferencia entre el citocromo c de una carpa y una rana, tortuga, pollo, conejo y caballo es muy constante entre 13% y 14%. De manera similar, la diferencia entre el citocromo c de una bacteria y la levadura, el trigo, la polilla, el atún, la paloma y el caballo oscila entre el 64% y el 69%. Junto con el trabajo de Emile Zuckerkandl y Linus Pauling, el resultado de la equidistancia genética condujo directamente a la postulación formal de la hipótesis del reloj molecular a principios de los años sesenta. [3]
De manera similar, Vincent Sarich y Allan Wilson demostraron en 1967 que las diferencias moleculares entre los primates modernos en las proteínas albúminas mostraban que se habían producido tasas de cambio aproximadamente constantes en todos los linajes que evaluaron. [4] La lógica básica de su análisis implicó reconocer que si el linaje de una especie había evolucionado más rápidamente que el linaje de una especie hermana desde su ancestro común, entonces las diferencias moleculares entre una especie exogrupo (relacionada más lejanamente) y la especie de evolución más rápida deberían ser mayor (ya que se habrían acumulado más cambios moleculares en ese linaje) que las diferencias moleculares entre las especies del exogrupo y las especies de evolución más lenta. Este método se conoce como prueba de tasa relativa . El artículo de Sarich y Wilson informó, por ejemplo, que las reacciones inmunológicas cruzadas con la albúmina humana ( Homo sapiens ) y chimpancé ( Pan troglodytes ) sugerían que eran casi igualmente diferentes de las especies Ceboidea (Mono del Nuevo Mundo) (dentro del error experimental). Esto significaba que ambos habían acumulado cambios aproximadamente iguales en albúmina desde su ancestro común compartido. Este patrón también se encontró en todas las comparaciones de primates que probaron. Cuando se calibró con los pocos puntos de ramificación fósiles bien documentados (como ningún fósil de primate de aspecto moderno encontrado antes del límite KT ), esto llevó a Sarich y Wilson a argumentar que la divergencia entre humanos y chimpancés probablemente ocurrió hace sólo ~4 a 6 millones de años. . [5]
La observación de una velocidad de cambio molecular similar a un reloj fue originalmente puramente fenomenológica . Posteriormente, el trabajo de Motoo Kimura [6] desarrolló la teoría neutral de la evolución molecular , que predijo un reloj molecular. Supongamos que hay N individuos y, para simplificar este cálculo, supongamos que los individuos sean haploides (es decir, que tengan una copia de cada gen). Sea la tasa de mutaciones neutras (es decir, mutaciones sin efecto sobre la aptitud física ) en un nuevo individuo . La probabilidad de que esta nueva mutación quede fija en la población es entonces 1/N, ya que cada copia del gen es tan buena como cualquier otra. Cada generación, cada individuo puede tener nuevas mutaciones, por lo que hay N nuevas mutaciones neutras en la población en su conjunto. Eso significa que en cada generación se fijarán nuevas mutaciones neutrales. Si la mayoría de los cambios observados durante la evolución molecular son neutrales, entonces las fijaciones en una población se acumularán a un ritmo igual al de mutaciones neutras en un individuo.
Para utilizar relojes moleculares para estimar los tiempos de divergencia, es necesario "calibrar" los relojes moleculares. Esto se debe a que los datos moleculares por sí solos no contienen información sobre tiempos absolutos. Para la filogenética viral y los estudios de ADN antiguo (dos áreas de la biología evolutiva donde es posible tomar muestras de secuencias en una escala de tiempo evolutiva), las fechas de las muestras intermedias se pueden utilizar para calibrar el reloj molecular. Sin embargo, la mayoría de las filogenias requieren que el reloj molecular se calibre utilizando evidencia independiente sobre fechas, como el registro fósil . [7] Hay dos métodos generales para calibrar el reloj molecular utilizando fósiles: calibración de nodos y calibración de puntas. [8]
A veces denominada datación de nodos, la calibración de nodos es un método para escalar el tiempo de árboles filogenéticos especificando restricciones de tiempo para uno o más nodos del árbol. Los primeros métodos de calibración de relojes solo utilizaban una única restricción de fósil (por ejemplo, suavizado de velocidad no paramétrico), [9] pero los métodos más nuevos (BEAST [10] y r8s [11] ) permiten el uso de múltiples fósiles para calibrar relojes moleculares. El fósil más antiguo de un clado se utiliza para limitar la edad mínima posible del nodo que representa el ancestro común más reciente del clado. Sin embargo, debido a una preservación incompleta de los fósiles y otros factores, los clados suelen ser más antiguos que sus fósiles más antiguos. [8] Para tener en cuenta esto, se permite que los nodos sean más antiguos que la restricción mínima en los análisis de calibración de nodos. Sin embargo, determinar qué tan antiguo puede ser el nodo es un desafío. Existen varias estrategias para derivar el límite máximo de la edad de un clado, incluidas aquellas basadas en modelos de nacimiento-muerte, análisis de distribución estratigráfica de fósiles o controles tafonómicos . [12] Alternativamente, en lugar de un máximo y un mínimo, se puede utilizar una densidad de probabilidad para representar la incertidumbre sobre la edad del clado. Estas densidades de calibración pueden tomar la forma de densidades de probabilidad estándar (por ejemplo, normal , lognormal , exponencial , gamma ) que pueden usarse para expresar la incertidumbre asociada con las estimaciones del tiempo de divergencia. [10] Determinar la forma y los parámetros de la distribución de probabilidad no es trivial, pero existen métodos que utilizan no sólo el fósil más antiguo sino una muestra más grande del registro fósil de clados para estimar empíricamente las densidades de calibración. [13] Los estudios han demostrado que aumentar el número de restricciones fósiles aumenta la precisión de la estimación del tiempo de divergencia. [14]
A veces denominada datación de puntas , la calibración de puntas es un método de calibración de relojes moleculares en el que los fósiles se tratan como taxones y se colocan en las puntas del árbol. Esto se logra mediante la creación de una matriz que incluye un conjunto de datos moleculares para los taxones existentes junto con un conjunto de datos morfológicos para los taxones extintos y existentes. [12] A diferencia de la calibración de nodos, este método reconstruye la topología del árbol y coloca los fósiles simultáneamente. Los modelos moleculares y morfológicos funcionan juntos simultáneamente, lo que permite que la morfología informe la ubicación de los fósiles. [8] La calibración de puntas utiliza todos los taxones fósiles relevantes durante la calibración del reloj, en lugar de depender únicamente del fósil más antiguo de cada clado. Este método no se basa en la interpretación de evidencia negativa para inferir edades máximas de clado. [12]
Los cambios demográficos en las poblaciones pueden detectarse como fluctuaciones en el tamaño efectivo histórico de la población coalescente a partir de una muestra de variación genética existente en la población utilizando la teoría coalescente. [15] [16] [17] Las expansiones de población antiguas que están bien documentadas y fechadas en el registro geológico se pueden utilizar para calibrar una tasa de evolución molecular de una manera similar a la calibración de nodos. Sin embargo, en lugar de calibrar a partir de la edad conocida de un nodo, la calibración de expansión utiliza un modelo de dos épocas de tamaño de población constante seguido de crecimiento de la población, siendo el tiempo de transición entre épocas el parámetro de interés para la calibración. [18] [19] La calibración de expansión funciona en escalas de tiempo intraespecíficas más cortas en comparación con la calibración de nodos, porque las expansiones solo se pueden detectar después del ancestro común más reciente de la especie en cuestión. La datación por expansión se ha utilizado para mostrar que las velocidades del reloj molecular pueden inflarse en escalas de tiempo cortas [18] (< 1 MY) debido a una fijación incompleta de los alelos, como se analiza a continuación [20] [21]
Este enfoque para la calibración de puntas va un paso más allá al estimar simultáneamente la ubicación, la topología y la escala de tiempo evolutiva de los fósiles. En este método, la edad de un fósil puede informar su posición filogenética además de su morfología. Al permitir que todos los aspectos de la reconstrucción del árbol ocurran simultáneamente, se reduce el riesgo de resultados sesgados. [8] Este enfoque se ha mejorado al combinarlo con diferentes modelos. Un método actual de calibración del reloj molecular es la datación con evidencia total combinada con el modelo de nacimiento-muerte fosilizado (FBD) y un modelo de evolución morfológica. [22] El modelo FBD es novedoso porque permite "ancestros muestreados", que son taxones fósiles que son el ancestro directo de un taxón o linaje vivo . Esto permite colocar fósiles en una rama encima de un organismo existente, en lugar de limitarlos a las puntas. [23]
Los métodos bayesianos pueden proporcionar estimaciones más apropiadas de los tiempos de divergencia, especialmente si se emplean grandes conjuntos de datos, como los generados por la filogenómica . [24]
A veces, a partir de los fósiles sólo se puede estimar una fecha de divergencia, de la que se pueden inferir todas las demás fechas. Otros conjuntos de especies tienen abundantes fósiles disponibles, lo que permite probar la hipótesis de tasas de divergencia constantes. Las secuencias de ADN que experimentaron niveles bajos de selección negativa mostraron tasas de divergencia de 0,7 a 0,8% por Myr en bacterias, mamíferos, invertebrados y plantas. [25] En el mismo estudio, las regiones genómicas que experimentaron una selección purificadora o negativa muy alta (que codifican ARNr) fueron considerablemente más lentas (1% por 50 Myr).
Además de dicha variación en la tasa con la posición genómica, desde principios de la década de 1990 la variación entre taxones también ha demostrado ser un terreno fértil para la investigación, [26] incluso durante períodos de tiempo evolutivo comparativamente cortos (por ejemplo, los sinsontes [27] ). Las aves marinas de nariz tubular tienen relojes moleculares que, en promedio, funcionan a la mitad de la velocidad de muchas otras aves, [28] posiblemente debido a los largos tiempos generacionales , y muchas tortugas tienen un reloj molecular que funciona a un octavo de la velocidad que tienen los pequeños mamíferos, o aún más lento. [29] También es probable que los efectos del tamaño pequeño de la población confundan los análisis del reloj molecular. Investigadores como Francisco J. Ayala han cuestionado de manera más fundamental la hipótesis del reloj molecular. [30] [31] [32] Según el estudio de Ayala de 1999, cinco factores se combinan para limitar la aplicación de modelos de reloj molecular:
Los usuarios de relojes moleculares han desarrollado soluciones alternativas utilizando una serie de enfoques estadísticos que incluyen técnicas de máxima verosimilitud y, posteriormente , modelos bayesianos . En particular, se han propuesto modelos que tienen en cuenta la variación de tasas entre linajes para obtener mejores estimaciones de los tiempos de divergencia. Estos modelos se denominan relojes moleculares relajados [33] porque representan una posición intermedia entre la hipótesis del reloj molecular "estricto" y el modelo de muchas velocidades de Joseph Felsenstein [34] y son posibles gracias a técnicas MCMC que exploran un rango ponderado de valores de árbol. topologías y simultáneamente estimar parámetros del modelo de sustitución elegido. Hay que recordar que las fechas de divergencia inferidas mediante un reloj molecular se basan en inferencia estadística y no en evidencia directa .
El reloj molecular se enfrenta a desafíos particulares en escalas de tiempo muy cortas y muy largas. En escalas de tiempo largas, el problema es la saturación . Cuando ha pasado suficiente tiempo, muchos sitios han sufrido más de un cambio, pero es imposible detectar más de uno. Esto significa que el número observado de cambios ya no es lineal con el tiempo, sino que se aplana. Incluso a distancias genéticas intermedias, con datos filogenéticos todavía suficientes para estimar la topología, la señal para la escala general del árbol puede ser débil bajo modelos de probabilidad complejos, lo que lleva a estimaciones del reloj molecular altamente inciertas. [35]
En escalas de tiempo muy cortas, muchas diferencias entre muestras no representan la fijación de diferentes secuencias en las diferentes poblaciones. En cambio, representan alelos alternativos que estaban presentes como parte de un polimorfismo en el ancestro común. La inclusión de diferencias que aún no se han solucionado conduce a una inflación potencialmente dramática de la velocidad aparente del reloj molecular en escalas de tiempo muy cortas. [21] [36]
La técnica del reloj molecular es una herramienta importante en sistemática molecular , macroevolución y métodos comparativos filogenéticos . La estimación de las fechas de eventos filogenéticos , incluidos aquellos no documentados por fósiles , como las divergencias entre taxones vivos , ha permitido el estudio de procesos macroevolutivos en organismos que tenían registros fósiles limitados. Los métodos comparativos filogenéticos dependen en gran medida de filogenias calibradas.