El reloj molecular es un término figurativo que designa una técnica que utiliza la tasa de mutación de biomoléculas para deducir el momento en que dos o más formas de vida divergieron en la prehistoria . Los datos biomoleculares utilizados para dichos cálculos suelen ser secuencias de nucleótidos en el caso del ADN y el ARN , o secuencias de aminoácidos en el caso de las proteínas .
La noción de la existencia de un llamado "reloj molecular" fue atribuida por primera vez a Émile Zuckerkandl y Linus Pauling , quienes, en 1962, notaron que el número de diferencias de aminoácidos en la hemoglobina entre diferentes linajes cambia aproximadamente de manera lineal con el tiempo, como se estimó a partir de evidencia fósil. [1] Generalizaron esta observación para afirmar que la tasa de cambio evolutivo de cualquier proteína específica era aproximadamente constante a lo largo del tiempo y en diferentes linajes (conocida como la hipótesis del reloj molecular ).
El fenómeno de la equidistancia genética fue observado por primera vez en 1963 por Emanuel Margoliash , quien escribió: "Parece que el número de diferencias de residuos entre el citocromo c de dos especies cualesquiera está condicionado principalmente por el tiempo transcurrido desde que las líneas de evolución que conducen a estas dos especies divergieron originalmente. Si esto es correcto, el citocromo c de todos los mamíferos debería ser igualmente diferente del citocromo c de todas las aves. Dado que los peces divergen del tronco principal de la evolución de los vertebrados antes que las aves o los mamíferos, el citocromo c de los mamíferos y las aves debería ser igualmente diferente del citocromo c de los peces. De manera similar, todos los citocromos c de los vertebrados deberían ser igualmente diferentes de la proteína de la levadura". [2] Por ejemplo, la diferencia entre el citocromo c de una carpa y una rana, una tortuga, un pollo, un conejo y un caballo es un 13% a 14% muy constante. De manera similar, la diferencia entre el citocromo c de una bacteria y el de la levadura, el trigo, la polilla, el atún, la paloma y el caballo oscila entre el 64% y el 69%. Junto con el trabajo de Emile Zuckerkandl y Linus Pauling, el resultado de la equidistancia genética condujo directamente a la postulación formal de la hipótesis del reloj molecular a principios de la década de 1960. [3]
De manera similar, Vincent Sarich y Allan Wilson demostraron en 1967 que las diferencias moleculares entre los primates modernos en las proteínas de albúmina mostraban que se habían producido tasas de cambio aproximadamente constantes en todos los linajes que evaluaron. [4] La lógica básica de su análisis implicaba reconocer que si el linaje de una especie había evolucionado más rápidamente que el linaje de una especie hermana desde su ancestro común, entonces las diferencias moleculares entre una especie de grupo externo (relacionada más distantemente) y la especie de evolución más rápida deberían ser mayores (ya que se habrían acumulado más cambios moleculares en ese linaje) que las diferencias moleculares entre la especie de grupo externo y la especie de evolución más lenta. Este método se conoce como la prueba de velocidad relativa . El artículo de Sarich y Wilson informó, por ejemplo, que las reacciones cruzadas inmunológicas de la albúmina humana ( Homo sapiens ) y del chimpancé ( Pan troglodytes ) sugerían que eran aproximadamente igualmente diferentes de las especies Ceboidea (mono del nuevo mundo) (dentro del error experimental). Esto significaba que ambos habían acumulado cambios aproximadamente iguales en la albúmina desde su ancestro común compartido. Este patrón también se encontró en todas las comparaciones de primates que probaron. Cuando se calibraron con los pocos puntos de ramificación fósiles bien documentados (como el hecho de que no se encontraron fósiles de primates de aspecto moderno antes del límite KT ), esto llevó a Sarich y Wilson a argumentar que la divergencia entre humanos y chimpancés probablemente ocurrió solo hace unos 4 a 6 millones de años. [5]
La observación de una tasa de cambio molecular similar a un reloj fue originalmente puramente fenomenológica . Más tarde, el trabajo de Motoo Kimura [6] desarrolló la teoría neutral de la evolución molecular , que predijo un reloj molecular. Sea N individuos, y para mantener este cálculo simple, sea que los individuos sean haploides (es decir, tengan una copia de cada gen). Sea la tasa de mutaciones neutrales (es decir, mutaciones sin efecto sobre la aptitud ) en un nuevo individuo . La probabilidad de que esta nueva mutación se fije en la población es entonces 1/N, ya que cada copia del gen es tan buena como cualquier otra. Cada generación, cada individuo puede tener nuevas mutaciones, por lo que hay N nuevas mutaciones neutrales en la población en su conjunto. Eso significa que cada generación, nuevas mutaciones neutrales se fijarán. Si la mayoría de los cambios observados durante la evolución molecular son neutrales, entonces las fijaciones en una población se acumularán a una tasa de reloj que es igual a la tasa de mutaciones neutrales en un individuo.
Para utilizar relojes moleculares para estimar los tiempos de divergencia, es necesario "calibrarlos". Esto se debe a que los datos moleculares por sí solos no contienen información sobre tiempos absolutos. En el caso de la filogenia viral y los estudios de ADN antiguo (dos áreas de la biología evolutiva en las que es posible muestrear secuencias a lo largo de una escala de tiempo evolutiva), las fechas de las muestras intermedias se pueden utilizar para calibrar el reloj molecular. Sin embargo, la mayoría de las filogenias requieren que el reloj molecular se calibre utilizando evidencia independiente sobre las fechas, como el registro fósil . [7] Existen dos métodos generales para calibrar el reloj molecular utilizando fósiles: calibración de nodos y calibración de puntas. [8]
A veces denominada datación de nodos, la calibración de nodos es un método para escalar en el tiempo los árboles filogenéticos especificando restricciones de tiempo para uno o más nodos en el árbol. Los primeros métodos de calibración de relojes solo usaban una única restricción fósil (por ejemplo, suavizado de velocidad no paramétrico), [9] pero los métodos más nuevos (BEAST [10] y r8s [11] ) permiten el uso de múltiples fósiles para calibrar relojes moleculares. El fósil más antiguo de un clado se usa para restringir la edad mínima posible para el nodo que representa el ancestro común más reciente del clado. Sin embargo, debido a la preservación incompleta de los fósiles y otros factores, los clados suelen ser más antiguos que sus fósiles más antiguos. [8] Para tener esto en cuenta, se permite que los nodos sean más antiguos que la restricción mínima en los análisis de calibración de nodos. Sin embargo, determinar cuánto más antiguo se permite que sea el nodo es un desafío. Existen varias estrategias para derivar el límite máximo para la edad de un clado, incluidas aquellas basadas en modelos de nacimiento-muerte, análisis de distribución estratigráfica fósil o controles tafonómicos . [12] Alternativamente, en lugar de un máximo y un mínimo, se puede utilizar una densidad de probabilidad para representar la incertidumbre sobre la edad del clado. Estas densidades de calibración pueden tomar la forma de densidades de probabilidad estándar (por ejemplo, normal , lognormal , exponencial , gamma ) que se pueden utilizar para expresar la incertidumbre asociada con las estimaciones del tiempo de divergencia. [10] Determinar la forma y los parámetros de la distribución de probabilidad no es trivial, pero existen métodos que utilizan no solo el fósil más antiguo sino una muestra más grande del registro fósil de clados para estimar las densidades de calibración empíricamente. [13] Los estudios han demostrado que aumentar el número de restricciones fósiles aumenta la precisión de la estimación del tiempo de divergencia. [14]
A veces denominada datación de punta , la calibración de punta es un método de calibración del reloj molecular en el que los fósiles se tratan como taxones y se colocan en las puntas del árbol. Esto se logra creando una matriz que incluye un conjunto de datos moleculares para los taxones existentes junto con un conjunto de datos morfológicos tanto para los taxones extintos como para los existentes. [12] A diferencia de la calibración de nodos, este método reconstruye la topología del árbol y coloca los fósiles simultáneamente. Los modelos moleculares y morfológicos trabajan juntos simultáneamente, lo que permite que la morfología informe la ubicación de los fósiles. [8] La calibración de punta hace uso de todos los taxones fósiles relevantes durante la calibración del reloj, en lugar de depender solo del fósil más antiguo de cada clado. Este método no se basa en la interpretación de evidencia negativa para inferir las edades máximas de los clados. [12]
Los cambios demográficos en las poblaciones pueden detectarse como fluctuaciones en el tamaño efectivo histórico de la población coalescente a partir de una muestra de variación genética existente en la población utilizando la teoría coalescente. [15] [16] [17] Las expansiones de poblaciones antiguas que están bien documentadas y datadas en el registro geológico pueden utilizarse para calibrar una tasa de evolución molecular de una manera similar a la calibración de nodos. Sin embargo, en lugar de calibrar a partir de la edad conocida de un nodo, la calibración de expansión utiliza un modelo de dos épocas de tamaño de población constante seguido de crecimiento de la población, siendo el tiempo de transición entre épocas el parámetro de interés para la calibración. [18] [19] La calibración de expansión funciona en escalas de tiempo intraespecíficas más cortas en comparación con la calibración de nodos, porque las expansiones solo pueden detectarse después del ancestro común más reciente de la especie en cuestión. La datación por expansión se ha utilizado para demostrar que las frecuencias del reloj molecular pueden inflarse en escalas de tiempo cortas [18] (< 1 MA) debido a la fijación incompleta de los alelos, como se analiza a continuación [20] [21]
Este enfoque de calibración de puntas va un paso más allá al estimar simultáneamente la ubicación de los fósiles, la topología y la escala de tiempo evolutiva. En este método, la edad de un fósil puede informar su posición filogenética además de la morfología. Al permitir que todos los aspectos de la reconstrucción del árbol ocurran simultáneamente, se reduce el riesgo de resultados sesgados. [8] Este enfoque se ha mejorado al emparejarlo con diferentes modelos. Un método actual de calibración del reloj molecular es la datación de evidencia total emparejada con el modelo de nacimiento-muerte fosilizado (FBD) y un modelo de evolución morfológica. [22] El modelo FBD es novedoso porque permite "ancestros muestreados", que son taxones fósiles que son el ancestro directo de un taxón o linaje vivo . Esto permite colocar los fósiles en una rama por encima de un organismo existente, en lugar de estar confinados a las puntas. [23]
Los métodos bayesianos pueden proporcionar estimaciones más apropiadas de los tiempos de divergencia, especialmente si se emplean conjuntos de datos grandes, como los producidos por la filogenómica . [24]
A veces, sólo se puede estimar una única fecha de divergencia a partir de los fósiles, y todas las demás fechas se infieren a partir de ella. Otros conjuntos de especies tienen abundantes fósiles disponibles, lo que permite probar la hipótesis de tasas de divergencia constantes. Las secuencias de ADN que experimentaron niveles bajos de selección negativa mostraron tasas de divergencia de 0,7-0,8% por Myr en bacterias, mamíferos, invertebrados y plantas. [25] En el mismo estudio, las regiones genómicas que experimentaron una selección negativa o purificadora muy alta (que codifican ARNr) fueron considerablemente más lentas (1% por 50 Myr).
Además de esta variación en la tasa con la posición genómica, desde principios de los años 1990 la variación entre taxones ha demostrado ser un terreno fértil para la investigación también, [26] incluso en períodos comparativamente cortos de tiempo evolutivo (por ejemplo, los sinsontes [27] ). Las aves marinas de nariz tubular tienen relojes moleculares que en promedio funcionan a la mitad de la velocidad de muchas otras aves, [28] posiblemente debido a largos tiempos generacionales , y muchas tortugas tienen un reloj molecular que funciona a un octavo de la velocidad que lo hace en los mamíferos pequeños, o incluso más lento. [29] Los efectos del pequeño tamaño de la población también pueden confundir los análisis del reloj molecular. Investigadores como Francisco J. Ayala han desafiado más fundamentalmente la hipótesis del reloj molecular. [30] [31] [32] Según el estudio de Ayala de 1999, cinco factores se combinan para limitar la aplicación de los modelos de reloj molecular:
Los usuarios de relojes moleculares han desarrollado soluciones alternativas utilizando una serie de enfoques estadísticos que incluyen técnicas de máxima verosimilitud y, posteriormente, modelos bayesianos . En particular, se han propuesto modelos que tienen en cuenta la variación de la tasa entre linajes para obtener mejores estimaciones de los tiempos de divergencia. Estos modelos se denominan relojes moleculares relajados [33] porque representan una posición intermedia entre la hipótesis del reloj molecular "estricto" y el modelo de múltiples tasas de Joseph Felsenstein [34] y son posibles gracias a las técnicas MCMC que exploran un rango ponderado de topologías de árboles y estiman simultáneamente los parámetros del modelo de sustitución elegido. Debe recordarse que las fechas de divergencia inferidas utilizando un reloj molecular se basan en inferencia estadística y no en evidencia directa .
El reloj molecular se enfrenta a desafíos particulares en escalas de tiempo muy cortas y muy largas. En escalas de tiempo largas, el problema es la saturación . Cuando ha pasado suficiente tiempo, muchos sitios han experimentado más de un cambio, pero es imposible detectar más de uno. Esto significa que el número observado de cambios ya no es lineal con el tiempo, sino que se estabiliza. Incluso a distancias genéticas intermedias, con datos filogenéticos aún suficientes para estimar la topología, la señal para la escala general del árbol puede ser débil bajo modelos de probabilidad complejos, lo que lleva a estimaciones del reloj molecular altamente inciertas. [35]
En escalas de tiempo muy cortas, muchas diferencias entre muestras no representan la fijación de secuencias diferentes en las distintas poblaciones, sino que representan alelos alternativos que estaban presentes como parte de un polimorfismo en el ancestro común. La inclusión de diferencias que aún no se han fijado conduce a una inflación potencialmente dramática de la velocidad aparente del reloj molecular en escalas de tiempo muy cortas. [21] [36]
La técnica del reloj molecular es una herramienta importante en la sistemática molecular , la macroevolución y los métodos comparativos filogenéticos . La estimación de las fechas de los eventos filogenéticos , incluidos aquellos no documentados por fósiles , como las divergencias entre taxones vivos , ha permitido el estudio de los procesos macroevolutivos en organismos que tenían registros fósiles limitados. Los métodos comparativos filogenéticos se basan en gran medida en filogenias calibradas.