stringtranslate.com

Reloj molecular mitocondrial humano

El reloj molecular mitocondrial humano es el ritmo al que se han ido acumulando mutaciones en el genoma mitocondrial de los homínidos durante el curso de la evolución humana . El registro arqueológico de la actividad humana desde los primeros períodos de la prehistoria humana es relativamente limitado y su interpretación ha sido controvertida. Debido a las incertidumbres del registro arqueológico, los científicos han recurrido a técnicas de datación molecular para refinar la línea de tiempo de la evolución humana. Un objetivo importante de los científicos en este campo es desarrollar un reloj molecular mitocondrial de homínidos preciso que luego pueda usarse para fechar con confianza eventos que ocurrieron durante el curso de la evolución humana.

Las estimaciones de la tasa de mutación del ADN mitocondrial humano (ADNmt) varían mucho según los datos disponibles y el método utilizado para la estimación. Los dos métodos principales de estimación, los métodos basados ​​en la filogenia y los métodos basados ​​en el pedigrí, han producido tasas de mutación que difieren en casi un orden de magnitud. Las investigaciones actuales se han centrado en resolver la alta variabilidad obtenida a partir de diferentes estimaciones de tasas.

Variabilidad de tarifas

Una suposición importante de la teoría del reloj molecular es que las mutaciones dentro de un sistema genético particular ocurren a un ritmo estadísticamente uniforme y este ritmo uniforme puede usarse para fechar eventos genéticos. En la práctica, el supuesto de un tipo uniforme único es una simplificación excesiva. Aunque a menudo se aplica una única tasa de mutación, a menudo es una combinación o un promedio de varias tasas de mutación diferentes. [1] Muchos factores influyen en las tasas de mutación observadas y estos factores incluyen el tipo de muestras, la región del genoma estudiada y el período de tiempo cubierto.

Tasas reales versus observadas

Se cree que la tasa a la que ocurren las mutaciones durante la reproducción, la tasa de mutación de la línea germinal , es más alta que todas las tasas de mutación observadas, porque no todas las mutaciones se transmiten con éxito a las generaciones posteriores. [2] El ADNmt solo se transmite a lo largo de la línea matrilineal y, por lo tanto, las mutaciones transmitidas a los hijos se pierden. La deriva genética aleatoria también puede provocar la pérdida de mutaciones. Por estas razones, la tasa de mutación real no será equivalente a la tasa de mutación observada en una muestra de población. [2]

Tamaño de la poblacion

Se cree que la dinámica poblacional influye en las tasas de mutación observadas. Cuando una población se expande, se conservan más mutaciones de la línea germinal en la población. Como resultado, las tasas de mutación observadas tienden a aumentar en una población en expansión. Cuando las poblaciones se contraen, como ocurre en un cuello de botella poblacional , se pierden más mutaciones de la línea germinal. Por tanto, los cuellos de botella demográficos tienden a ralentizar las tasas de mutación observadas. Desde la aparición de la especie homo sapiens hace unos 200.000 años, la población humana se ha expandido de unos pocos miles de individuos que viven en África a más de 8 mil millones en todo el mundo. Sin embargo, la expansión no ha sido uniforme, por lo que la historia de las poblaciones humanas puede consistir tanto en cuellos de botella como en expansiones. [3]

Variabilidad estructural

La tasa de mutación en todo el genoma mitocondrial no se distribuye uniformemente. Se sabe que ciertas regiones del genoma mutan más rápidamente que otras. Se sabe que las regiones hipervariables son altamente polimórficas en relación con otras partes del genoma.

La velocidad a la que se acumulan las mutaciones en las regiones codificantes y no codificantes del genoma también difiere ya que las mutaciones en la región codificante están sujetas a una selección purificadora . Por esta razón, algunos estudios evitan regiones codificantes o mutaciones no sinónimas al calibrar el reloj molecular. Loogvali et al. (2009) solo consideran mutaciones sinónimas, han recalibrado el reloj molecular del ADNmt humano en 7990 años por mutación sinónima en el genoma mitocondrial. [1] Soares et al. (2009) consideran las mutaciones de las regiones codificantes y no codificantes para llegar a una tasa de mutación única, pero aplican un factor de corrección para tener en cuenta la selección en la región codificante.

variabilidad temporal

Se ha observado que la tasa de mutación varía con el tiempo. Las tasas de mutación dentro de la especie humana son más rápidas que las observadas a lo largo del linaje humano-simio. También se cree que la tasa de mutación es más rápida en los últimos tiempos, desde el comienzo del Holoceno hace 11.000 años. [1] [3] [4]

Mutaciones paralelas y saturación.

La mutación paralela (a veces denominada homoplasia) o evolución convergente se produce cuando linajes separados tienen la misma mutación de forma independiente en el mismo sitio del genoma. La saturación ocurre cuando un solo sitio experimenta múltiples mutaciones. Las mutaciones paralelas y la saturación dan como resultado una subestimación de la tasa de mutación porque es probable que se pasen por alto. [2]

heteroplasmia

Los individuos afectados por heteroplasmia tienen una mezcla de tipos de ADNmt, algunos con nuevas mutaciones y otros sin ellas. Las nuevas mutaciones pueden transmitirse o no a generaciones posteriores. Por tanto, la presencia de individuos heteroplasmáticos en una muestra puede complicar el cálculo de las tasas de mutación. [2] [5]

Métodos

Basado en pedigrí

Los métodos de pedigrí estiman la tasa de mutación comparando las secuencias de ADNmt de una muestra de pares de padres e hijos o analizando secuencias de ADNmt de individuos de una genealogía profundamente arraigada. El número de nuevas mutaciones en la muestra se cuenta y se divide por el número total de eventos de transmisión de ADN de padres a hijos para llegar a una tasa de mutación. [3] [5]

basado en la filogenia

Los métodos basados ​​en la filogenia se estiman reconstruyendo primero el haplotipo del ancestro común más reciente (MRCA) de una muestra de dos o más linajes genéticos. Un requisito es que la fecha del ancestro común más reciente ( TMRCA ) de la muestra de linajes ya debe conocerse a partir de otras fuentes independientes, generalmente el registro arqueológico. Luego se calcula el número promedio de mutaciones que se han acumulado desde el MRCA y se divide por el TMRCA para llegar a la tasa de mutación. La tasa de mutación humana generalmente se estima comparando las secuencias de humanos modernos y chimpancés y luego reconstruyendo el haplotipo ancestral del ancestro común chimpancé-humano. Según los registros paleontológicos, el último ancestro común de los humanos pudo haber vivido hace unos 6 millones de años. [3]

Comparación de pedigrí versus filogenia

Las tasas obtenidas mediante métodos genealógicos son aproximadamente 10 veces más rápidas que las obtenidas mediante métodos filogenéticos. Varios factores actuando juntos pueden ser responsables de esta diferencia. Como los métodos de pedigrí registran mutaciones en sujetos vivos, las tasas de mutación de los estudios de pedigrí se acercan más a la tasa de mutación de la línea germinal. Los estudios genealógicos utilizan genealogías que tienen solo unas pocas generaciones de profundidad, mientras que los métodos basados ​​en la filogenia utilizan escalas de tiempo que tienen miles o millones de años de profundidad. Según Henn et al. 2009, los métodos basados ​​en la filogenia tienen en cuenta eventos que ocurren en escalas de tiempo largas y, por lo tanto, se ven menos afectados por las fluctuaciones estocásticas. Howell et al. 2003 sugiere que la selección, la saturación, las mutaciones paralelas y la deriva genética son responsables de las diferencias observadas entre los métodos basados ​​en pedigrí y los métodos basados ​​en filogenia.

Estimación basada en arqueología AMH

Los humanos anatómicamente modernos (AMH) se extendieron desde África a una gran área de Eurasia y dejaron artefactos a lo largo de la costa norte del suroeste, sur, sudeste y este de Asia. Cann, Stoneking y Wilson (1987) no se basaron en una T CHLCA prevista para estimar las tasas de polimorfismo de un solo nucleótido (SNP). En cambio, utilizaron evidencia de colonización en el sudeste asiático y Oceanía para estimar las tasas de mutación. Además utilizaron la tecnología RFLP ( polimorfismo de longitud de fragmentos de restricción ) para examinar las diferencias entre el ADN. Utilizando estas técnicas, este grupo llegó a un T MRCA de 140.000 a 290.000 años. Cann et al. (1987) estimaron que el TMRCA de los humanos es de aproximadamente 210 ky y las estimaciones más recientes de Soares et al. 2009 (utilizando el ADNmt humano de chimpancé de 7 millones de años MRCA) difieren solo en un 9%, lo cual es relativamente cercano considerando el amplio rango de confianza tanto para las estimaciones como para las solicitudes de T CHLCA más antiguo .

Endicott y Ho (2008) han reevaluado las migraciones previstas a nivel mundial y las han comparado con la evidencia real. Este grupo utilizó las regiones codificantes de secuencias. Postulan que el reloj molecular basado en comparaciones entre chimpancés y humanos no es confiable, particularmente para predecir migraciones recientes, como las migraciones fundacionales a Europa, Australia y Estados Unidos. Con esta técnica, este grupo obtuvo un T MRCA de 82.000 a 134.000 años.

Estimación basada en CHLCA

Debido a que los chimpancés y los humanos comparten un ancestro matrilineal, establecer la edad geológica de ese último ancestro permite estimar la tasa de mutación. El último ancestro común chimpancé-humano (CHLCA) se aplica con frecuencia como ancla para los estudios de mt-T MRCA con rangos de entre 4 y 13 millones de años citados en la literatura. [6] Esta es una fuente de variación en las estimaciones de tiempo. La otra debilidad es la acumulación de SNP sin reloj, lo que tendería a hacer que las ramas más recientes parezcan más antiguas de lo que realmente son. [7]

Estas dos fuentes pueden equilibrarse entre sí o amplificarse entre sí dependiendo de la dirección del error T CHLCA . Hay dos razones principales por las que este método se emplea ampliamente. En primer lugar, las tasas basadas en pedigrí no son apropiadas para estimaciones para períodos de tiempo muy largos. En segundo lugar, si bien las tasas arqueológicas ancladas representan el rango intermedio, la evidencia arqueológica de la colonización humana a menudo ocurre mucho después de la colonización. Por ejemplo, se cree que la colonización de Eurasia de oeste a este se produjo a lo largo del Océano Índico. Sin embargo, los sitios arqueológicos más antiguos que también demuestran humanos anatómicamente modernos (AMH) se encuentran en China y Australia, con más de 42.000 años de antigüedad. Sin embargo, el sitio indio más antiguo con restos de AMH tiene 34.000 años, y otro sitio con arqueología compatible con AMH tiene más de 76.000 años. [7] Por lo tanto, la aplicación del ancla es una interpretación subjetiva de cuándo los humanos estuvieron presentes por primera vez.

Se puede determinar una medida sencilla de la divergencia de secuencia entre humanos y chimpancés mediante la observación de los SNP. Dado que el mitogenoma tiene aproximadamente 16553 pares de bases de longitud (cada par de bases que puede alinearse con referencias conocidas se llama sitio), [8] la fórmula es:

El '2' en el denominador se deriva de los dos linajes, humano y chimpancé, que se separaron de la CHLCA. Idealmente representa la acumulación de mutaciones en ambos linajes pero en diferentes posiciones (SNP). Siempre que el número de SNP observados se aproxime al número de mutaciones, esta fórmula funciona bien. Sin embargo, en los sitios que evolucionan rápidamente las mutaciones quedan oscurecidas por los efectos de saturación. Clasificar las posiciones dentro del mitogenoma por velocidad y compensar la saturación son enfoques alternativos. [9]

Debido a que el T CHLCA está sujeto a cambios con más información paleontológica, la ecuación descrita anteriormente permite la comparación de TMRCA de diferentes estudios.

Métodos tempranos, HVR, basados ​​en secuencias

Para superar los efectos de la saturación , el análisis HVR se basó en la distancia transversional entre humanos y chimpancés. [10] Se aplicó una relación de transición a transversión a esta distancia para estimar la divergencia de secuencia en el HVR entre chimpancés y humanos, y se dividió por una T CHLCA supuesta de 4 a 6 millones de años. [11] Con base en 26,4 sustituciones entre chimpancés y humanos y una proporción de 15:1, las 396 transiciones estimadas en 610 pares de bases demostraron una divergencia de secuencia del 69,2 % (tasa * T CHLCA de 0,369), lo que produce tasas de divergencia de aproximadamente 11,5 % a 17,3 % por millón de años .

HVR es excepcionalmente propenso a la saturación, lo que lleva a la subestimación de la tasa de SNP cuando se comparan linajes muy distantes

Vigilante y col. (1991) también estimaron la tasa de divergencia de secuencia para los sitios en las regiones HVR I y HVR II de rápida evolución. Como se observa en la tabla anterior, la tasa de evolución es tan alta que la saturación del sitio ocurre en comparaciones directas entre chimpancés y humanos. En consecuencia, este estudio utilizó transversiones, que evolucionan a un ritmo más lento que los polimorfismos de transición más comunes. Al comparar los mitogenomas de chimpancés y humanos, observaron 26,4 transversiones en las regiones HVR, pero no hicieron ninguna corrección por saturación. A medida que se obtuvo más secuencia HVR después de este estudio, se observó que el sitio de dinucleótido CRS:16181-16182 experimentó numerosas transversiones en el análisis de parsimonia, muchas de las cuales se consideraron errores de secuenciación. Sin embargo, la secuenciación de Feldhofer I Neanderthal reveló que también hubo una transversión entre humanos y neandertales en este sitio. [12] Además, Soares et al. (2009) observaron tres sitios en los que se habían producido transversiones recurrentes en linajes humanos, dos de los cuales están en HVR I, 16265 (12 ocurrencias) y 16318 (8 ocurrencias). [nota 1] Por lo tanto, 26,4 transversiones fue una subestimación del número probable de eventos de transversión. El estudio del año 1991 también utilizó una relación de transición a transversión del estudio de monos del viejo mundo de 15:1. [ cita necesaria ] Sin embargo, el examen de HVR de chimpancés y gorilas revela una tasa más baja, y el examen de humanos sitúa la tasa en 34:1. [6] Por lo tanto, este estudio subestimó ese nivel de divergencia de secuencia entre chimpancés y humanos. La divergencia de secuencia estimada de 0,738/sitio (incluye transversiones) es significativamente menor que ~2,5 por sitio sugerido por Soares et al. (2009). Estos dos errores darían como resultado una sobreestimación del TMRCA mitocondrial humano. Sin embargo, no pudieron detectar el linaje L0 basal en el análisis y tampoco pudieron detectar transiciones recurrentes en muchos linajes, lo que también subestima el TMRCA. Además, Vigilant et al. (1991) utilizaron un ancla CHLCA más reciente de 4 a 6 millones de años.

Métodos basados ​​en secuencia de región codificante.

La secuencia parcial de la región codificante originalmente complementó los estudios HVR porque la secuencia completa de la región codificante era poco común. Existían sospechas de que los estudios HVR habían pasado por alto ramas importantes basándose en algunos estudios anteriores de RFLP y regiones codificantes. Ingman et al. (2000) fue el primer estudio que comparó secuencias genómicas para el análisis de coalescencia. La secuencia de la región codificante discriminó los haplogrupos M y N y los macrohaplogrupos L0 y L1 . Debido a que la secuenciación del ADN genómico resolvió las dos ramas más profundas, mejoró algunos aspectos de la estimación de TMRCA con respecto a la secuencia HVR sola. Excluyendo el bucle D y utilizando un T CHLCA de 5 millones de años , Ingman et al. (2000) estimaron que la tasa de mutación era 1,70 × 10 −8 por sitio por año (tasa * T CHLCA = 0,085, 15 435 sitios).

Sin embargo, la región codificante del ADN ha sido cuestionada porque las secuencias codificantes están bajo selección purificadora para mantener la estructura y función, o bajo selección regional para desarrollar nuevas capacidades. [13] El problema con las mutaciones en la región codificante se ha descrito como tal: las mutaciones que ocurren en la región codificante que no son letales para las mitocondrias pueden persistir pero son negativamente selectivas para el huésped; durante unas pocas generaciones estos persistirán, pero durante miles de generaciones serán eliminados lentamente de la población, dejando SNP. [6] Sin embargo, a lo largo de miles de generaciones, las mutaciones regionalmente selectivas pueden no discriminarse de estas mutaciones transitorias de la región codificante. El problema con las mutaciones raras en los mitogenomas humanos es lo suficientemente importante como para impulsar media docena de estudios recientes sobre el tema.

Ingman et al. (2000) estimaron la evolución de la región del bucle no D en 1,7 × 10 −8 por año por sitio basándose en 53 secuencias genómicas no idénticas que representan en exceso a África en una muestra global. A pesar de esta sobrerrepresentación, faltaba la resolución de las subramas L0 y se encontró otra rama L1 profunda. A pesar de estas limitaciones, el muestreo fue adecuado para el estudio distintivo. Hoy en día, L0 está restringido a las poblaciones africanas, mientras que L1 es el haplogrupo ancestral de todos los no africanos, así como de la mayoría de los africanos. La secuencia de Eva mitocondrial se puede aproximar comparando una secuencia de L0 con una secuencia de L1. Conciliando las mutaciones en L0 y L1. Las secuencias de ADNmt de las poblaciones humanas contemporáneas generalmente diferirán de la secuencia de la Eva mitocondrial en aproximadamente 50 mutaciones. [14] [15] Las tasas de mutación no se clasificaron según el sitio (aparte de excluir las regiones HVR). El T CHLCA utilizado en el estudio del año 2000 de 5 Ma también fue inferior a los valores utilizados en los estudios más recientes.

Estimaciones a partir de ADN antiguo.

Dado que ha sido posible secuenciar un gran número de mitogenomas antiguos, varios estudios han estimado la tasa de mutación mitocondrial midiendo cuántas mutaciones más se han acumulado en promedio en los genomas modernos (o posteriores) en comparación con los antiguos (o anteriores) que descienden del mismo nodo filogenético. Estos estudios han obtenido resultados similares: estimaciones centrales para todo el cromosoma, en sustituciones por sitio por año: 2,47 × 10 −8 ; [16] 2,14 × 10 −8 ; [17] 2,53 × 10 −8 ; [18] y 2,74 × 10 −8 . [19]

Comparación de tasas y estudios

El reloj molecular del ADN mitocondrial ha sido criticado debido a su reloj molecular inconsistente. [20] [21] [22] Un análisis retrospectivo de cualquier proceso pionero revelará deficiencias. En el caso de las mitocondrias, las insuficiencias son el argumento del desconocimiento de la variación de la tasa y del exceso de confianza en el T CHLCA de 5 Ma. La falta de perspectiva histórica podría explicar la segunda cuestión: el problema de la variación de la tasa es algo que sólo podría resolverse mediante el estudio masivo de las mitocondrias que siguió. El número de secuencias HVR que se han acumulado desde 1987 hasta 2000 aumentó en magnitudes. Soares et al. (2009) utilizaron 2196 secuencias mitogenómicas y descubrieron 10,683 eventos de sustitución dentro de estas secuencias. Once de 16560 sitios en el mitogenoma produjeron más del 11% de todas las sustituciones con una variación de tasa estadísticamente significativa dentro de los 11 sitios. [nota 2] Argumentan que existe una tasa de mutación en el sitio neutro que es una magnitud más lenta que la tasa observada para el sitio más rápido, CRS 16519. En consecuencia, dejando de lado la selección purificadora, la tasa de mutación en sí varía entre sitios, con unos pocos sitios Es mucho más probable que sufran nuevas mutaciones en comparación con otros. [23] Soares et al. (2009) observaron dos tramos de ADN, CRS 2651-2700 y 3028-3082, que no tenían SNP dentro de las 2196 secuencias mitogenómicas.

Notas

  1. ^ Soares et al excluyeron 16182 y 16183 de su análisis
  2. ^ (sitios CRS 16519, 152, 16311, 145, 195, 16189, 16129, 16083, 16362, 160, 709, 16129, 16083, 16362, 150 y 709)

Notas a pie de página

  1. ^ a b C Loogvali et al. (2009)
  2. ^ abcd Howell, N; Smejkal, CB; MacKey, DA; Chinnery, PF; Turnbull, DM; Herrnstadt, C (2003), "La tasa genealógica de divergencia de secuencias en el genoma mitocondrial humano: existe una diferencia entre las tasas filogenéticas y genealógicas", American Journal of Human Genetics , 72 (3): 659–70, doi :10.1086/ 368264, PMC  1180241 , PMID  12571803.
  3. ^ abcd Henn y col. (2009)
  4. ^ Ho SY, Phillips MJ, Cooper A, Drummond AJ (2005), "Dependencia temporal de las estimaciones de tasas moleculares y sobreestimación sistemática de los tiempos de divergencia recientes", Biología molecular y evolución , 22 (7): 1561–8, doi : 10.1093/ molbev/msi145 , PMID  15814826, archivado desde el original el 15 de abril de 2013.
  5. ^ ab Sigurðardóttir et al. (2000)
  6. ^ abcSoares et al. (2009)
  7. ^ ab ver: Endicott et al. (2009)
  8. ^ Ingman y col. (2000)
  9. ^ Ver: Gonder et al. (2007),Soares et al. (2009)
  10. ^ Vigilante y col. (1989)
  11. ^ Vigilante y col. (1991)
  12. ^ Krings y col. (1997)
  13. ^ ver: Suissa et al. (2009), Balloux et al. (2009)
  14. ^ Gonder y col. (2007)
  15. ^ BeharDM; Villems R; Hola, H; Blue-Smith J; Pereira L; Metspalu E; Scozzari R; La Meca H; Tzur S; comas D, D; Bertranpetit J; Quintana-Murci L; Tyler-Smith C; Pozos RS; Rosset S; Consorcio Genográfico (mayo de 2008). "El amanecer de la diversidad matrilineal humana". Revista Estadounidense de Genética Humana . 82 (5): 1130–40. doi :10.1016/j.ajhg.2008.04.002. PMC 2427203 . PMID  18439549. 
  16. ^ Fu Q, Mittnick A y col. (Abril de 2013), "Una escala de tiempo revisada para la evolución humana basada en genomas mitocondriales antiguos", Curr. Biol. , 23 (7): 553–559, Bibcode :2013CBio...23..553F, doi :10.1016/j.cub.2013.02.044, hdl :11858/00-001M-0000-000E-F4B9-2, PMC 5036973 , PMID  23523248. 
  17. ^ Rieux A, Eriksson A y col. (Agosto de 2014), "Calibración mejorada del reloj mitocondrial humano utilizando genomas antiguos", Mol. Biol. Evolución. , 31 (10): 2780–2792, doi : 10.1093/molbev/msu222, PMC 4166928 , PMID  25100861. 
  18. ^ Fu Q, Li H y col. (Octubre de 2014), "Secuencia del genoma de un humano moderno de 45.000 años de Siberia occidental", Nature , 514 (7523): 445–449, Bibcode :2014Natur.514..445F, doi :10.1038/nature13810, hdl : 10550/42071, PMC 4753769 , PMID  25341783. 
  19. ^ Posth C, Renaud G, et al. (Marzo de 2016), "Los genomas mitocondriales del Pleistoceno sugieren una única dispersión importante de no africanos y un recambio de población del Glaciar Tardío en Europa", Curr. Biol. , 26 (6): 827–833, Bibcode : 2016CBio...26..827P, doi : 10.1016/j.cub.2016.01.037, hdl : 2440/114930 , PMID  26853362, S2CID  140098861.
  20. ^ Ho SY, Larson G (febrero de 2006), "Relojes moleculares: cuando los tiempos cambian", Trends Genet. , 22 (2): 79–83, doi :10.1016/j.tig.2005.11.006, PMID  16356585.
  21. ^ Gibbons A (enero de 1998), "Calibración del reloj mitocondrial", Science , 279 (5347): 28–9, Bibcode :1998Sci...279...28G, doi :10.1126/science.279.5347.28, PMID  9441404 , S2CID  29855766.
  22. ^ Santos C, Sierra B, Alvarez L, Ramos A, Fernández E, Nogués R, Aluja MP (2008), "Frecuencia y patrón de heteroplasmia en la región de control del ADN mitocondrial humano", J Mol Evol , 67 (2): 191–200, Bibcode :2008JMolE..67..191S, doi :10.1007/s00239-008-9138-9, PMID  18618067, S2CID  1143395.
  23. ^ Excoffier L, Yang Z (octubre de 1999), "Variación de la tasa de sustitución entre sitios en la región hipervariable mitocondrial I de humanos y chimpancés", Mol. Biol. Evolución. , 16 (10): 1357–68, doi : 10.1093/oxfordjournals.molbev.a026046 , PMID  10563016.

Referencias