stringtranslate.com

Filoestratigrafía genómica

La filoestratigrafía genómica es un método estadístico genético novedoso desarrollado para datar el origen de genes específicos observando sus homólogos en todas las especies . Fue desarrollado por primera vez por el Instituto Ruđer Bošković en Zagreb , Croacia . [1] El sistema vincula genes con su gen fundador , lo que nos permite luego determinar su edad. Esto podría ayudarnos a comprender mejor muchos procesos evolutivos, como los patrones de nacimiento de genes a lo largo de la evolución o la relación entre la edad de un transcriptoma a lo largo del desarrollo embrionario. Se han desarrollado herramientas bioinformáticas como GenEra para calcular edades relativas de genes basadas en la filoestratigrafía genómica. [2]

Método

Un ejemplo de árbol filogenético con sus diferentes filoestratos. Considerando las grandes barras grises como la filogenia de los taxones y las finas líneas de colores como los distintos linajes de genes dentro de ellos, podemos deducir la presencia de dos genes fundadores 1 y 2 presentes en sus respectivos filoestratos 1 y 2. Los filoestratos entonces serán Generalmente se le da el nombre del clado determinable más pequeño que incluye todos los taxones presentes. [1]

Esta técnica se basa en el supuesto de que la diversidad del genoma no se debe sólo a la duplicación de genes sino también a los continuos y frecuentes nacimientos de genes de novo. Estos genes (llamados "genes fundadores") se formarían a partir de secuencias de ADN no genéticas , así como de cambios en el marco de lectura (u otras formas de surgir dentro de genes existentes), o incluso de una evolución muy rápida de la proteína que modificaría la secuencia más allá del reconocimiento. [3] Estos nuevos genes tendrían en un principio altas tasas evolutivas que luego se ralentizarían con el tiempo, permitiéndonos reconocer su linaje en sus descendientes. [1] Los genes fundadores pueden luego colocarse en un filoestrato específico . El filoestrato se representa como el clado que incluye todos los genes que derivan del mismo gen fundador, lo que significa que este gen se formó en el ancestro común de este clado (p. ej. Arthropoda, Mammalia, Metazoa, etc.). Colocar estos genes fundadores y sus descendientes en diferentes filoestratos puede permitirnos envejecerlos. Esto luego puede usarse para analizar el origen de ciertas funciones de las proteínas y procesos de desarrollo a escala macroevolutiva, observando también las conexiones entre ciertos genes.

El método original para la filoestratigrafía genómica implica el uso de una búsqueda de similitud de secuencia BLAST con un valor de corte E de 10 −3 . Se reúnen los genes que se consideran suficientemente similares en secuencia y se determina el clado que engloba todos los taxones representados por esos genes. Este clado luego se convierte en el filoestrato de estos genes. Las implementaciones modernas reemplazan BLAST por DIAMOND ya que es mucho más rápido [4] y han refinado este proceso para tener en cuenta la contaminación de secuencia, la transferencia horizontal de genes y los eventos de falla en la detección de homología. [2] Al determinar el ancestro común de este clado, podemos dar una edad al gen fundador y a todos sus descendientes. La aplicación del proceso a escala de todo el genoma puede permitirnos detectar patrones de nacimientos de genes fundadores e inferir el papel de ciertos genes involucrados en procesos de desarrollo y vías fisiológicas específicos de cada clado, y el origen de esos rasgos. Los desarrolladores del método dieron en el artículo original [1] un ejemplo de cómo explotar este sistema en la práctica utilizando Drosophila . Reunieron 13.000 genes de los que determinaron los genes fundadores, reagrupándolos en sus respectivos filoestratos. También segregaron las familias de genes en función de si se expresaban principalmente en alguna de las tres capas germinales ( endodermo , mesodermo , ectodermo ). Al estudiar las frecuencias de expresión de genes en esos diferentes filoestratos, pudieron identificar hipotéticamente la posible formación original de esas capas germinales en períodos específicos y organismos ancestrales en la historia evolutiva.

Otros estudios han descubierto que los estallidos de eventos fundadores de genes están relacionados con importantes innovaciones evolutivas, como la aparición de la simetría bilateral en los animales, la aparición de la multicelularidad en las algas estreptofitas, la colonización de la tierra por plantas o la aparición de plantas con flores . [2]

Desde su invención, este equipo de investigación [5], así como otros, ha utilizado regularmente la filoestratigrafía genómica, [6] en particular en un intento de determinar el origen de los genes del cáncer , mostrando aparentemente un fuerte vínculo entre un pico en la formación del cáncer genes y la transición a organismos multicelulares , una conexión que se había planteado previamente como hipótesis y, por lo tanto, está respaldada por la filoestratigrafía. A medida que su uso ha ido creciendo, el método ha sido evaluado y mejorado en múltiples ocasiones, y se han desarrollado programas que lo ejecutan de forma automática y más eficiente. [2] [3]

Uno de los usos más destacados de la filoestratigrafía genómica ha sido inferir la correlación entre la filogenia y los procesos de desarrollo (a menudo llamada correlación filogenia-ontogenia). Utilizando la filoestratigrafía genómica, hasta el día de hoy los científicos han encontrado una correlación filogenia-ontogenia significativa en animales, [7] plantas, [8] hongos, [9] [10] e incluso biopelículas bacterianas. [11]

Crítica

Aunque ahora la comunidad científica la utiliza con frecuencia, la filoestratigrafía genómica también ha recibido algunas críticas por ser demasiado inexacta para que sus mediciones sean confiables. En primer lugar, según algunos autores, los supuestos carecen de precisión. [12] [13] Es erróneo suponer, por ejemplo, que todas las especies más allá del organismo de interés comparten la misma tasa evolutiva de proteínas, lo cual no es cierto ya que varía dependiendo de la velocidad del ciclo celular , lo que genera problemas al establecer los límites de Error BLAST al englobar todas las proteínas originadas a partir del mismo gen fundador. Otro punto es que la búsqueda BLAST supone que las tasas de evolución de las proteínas son constantes en todos sus sitios, lo cual también es falso. Por último, se podría decir que el modelo no tiene en cuenta correctamente las duplicaciones de genes, así como las pérdidas de genes: los cambios en las tasas evolutivas causadas por duplicaciones de genes debido a nuevos cambios funcionales aumentarían las tasas de error BLAST y la pérdida de genes en taxones distantes a el estudiado podría conducir a grandes subestimaciones en la edad calculada del gen y el filoestrato de los genes fundadores en comparación con sus valores reales. Sin embargo, en lugar de exigir simplemente abandonar el método, los críticos han intentado trabajar para refinarlo desde su estado original, introduciendo otras posibles fórmulas matemáticas o herramientas de búsqueda de secuencias, [14] aunque el Instituto Ruđer Bošković ha respondido a tales críticas afirmando su enfoque original era válido y no necesitaba una revisión exhaustiva. [15] Este debate también se incluye como parte de una discusión más amplia sobre la importancia de los nacimientos de genes de novo en la creación de diversidad genética, en la que la filoestratigrafía genómica respalda que tienen un fuerte efecto. También se ha propuesto que los eventos fundadores de genes no solo representan eventos de nacimiento de genes de novo , sino también cambios significativos en la secuencia de proteínas que los modifican más allá del reconocimiento con otros genes relacionados y, por lo tanto, adquieren nuevas actividades biológicas. [16] No obstante, la filoestratigrafía genómica supone que la detección de tales "eventos fundadores" implica una novedad evolutiva. Sin embargo, estudios recientes sugieren que la detección de genes que están restringidos a ciertos grupos taxonómicos (llamados genes taxonómicamente restringidos) puede explicarse por una falla en la detección de homología, es decir, la incapacidad de las herramientas bioinformáticas (BLAST o cualquier otra herramienta para detectar homología de secuencia) para rastrear la homología cuando las secuencias de proteínas son pequeñas y evolucionan a un ritmo rápido, lo que lleva a la imposibilidad de rastrear genes. [17]Por lo tanto, muchos de los "eventos fundadores" propuestos que fueron detectados originalmente mediante filoestratigrafía genómica podrían reinterpretarse como un artefacto metodológico debido a las limitaciones tecnológicas para detectar homólogos relacionados más lejanamente. Afortunadamente, el fallo en la detección de homología se puede probar explícitamente. [17] La ​​herramienta GenEra desarrollada recientemente es capaz de separar el fallo en la detección de homología de posibles eventos fundadores de genes mediante pruebas explícitas de imposibilidad de seguimiento de genes. [2]

Referencias

  1. ^ abcd Domazet-Loso T, Brajković J, Tautz D (noviembre de 2007). "Un enfoque de filoestratigrafía para descubrir la historia genómica de las principales adaptaciones en linajes de metazoos". Tendencias en Genética . 23 (11): 533–539. doi :10.1016/j.tig.2007.08.014. PMID  18029048.
  2. ^ abcde Barrera-Redondo, Josué; Lotharukpong, Jaruwatana Sodai; Drost, Hajk-Georg; Coelho, Susana M. (24 de marzo de 2023). "Descubriendo eventos fundadores de familias de genes durante las principales transiciones evolutivas en animales, plantas y hongos utilizando GenEra". Biología del genoma . 24 (1): 1552-1554. doi : 10.1186/s13059-023-02895-z . PMC 10037820 . PMID  10037820. 
  3. ^ ab Arendsee Z, Li J, Singh U, Seetharam A, Dorman K, Wurtele ES (octubre de 2019). "phylostratr: un marco para la filoestratigrafía". Bioinformática . 35 (19): 3617–3627. bioRxiv 10.1101/360164 . doi : 10.1093/bioinformática/btz171 . PMID  30873536. 
  4. ^ Buchfink, Benjamín; Reuters, Klaus; Drost, Hajk-Georg (abril de 2021). "Alineaciones de proteínas sensibles a escala del árbol de la vida utilizando DIAMOND". Métodos de la naturaleza . 18 (4): 366–368. doi :10.1038/s41592-021-01101-x. PMC 8026399 . PMID  33828273. 
  5. ^ Domazet-Loso T, Tautz D (mayo de 2010). "El seguimiento filoestratigráfico de los genes del cáncer sugiere un vínculo con la aparición de multicelularidad en los metazoos". Biología BMC . 8 (1): 66. doi : 10.1186/1741-7007-8-66 . PMC 2880965 . PMID  20492640. 
  6. ^ Zhang L, Tan Y, Fan S, Zhang X, Zhang Z (febrero de 2019). "El análisis filoestratigráfico de la red de coexpresión genética revela la evolución de módulos funcionales para el cáncer de ovario". Informes científicos . 9 (1): 2623. Código bibliográfico : 2019NatSR...9.2623Z. doi :10.1038/s41598-019-40023-9. PMC 6384884 . PMID  30796309. 
  7. ^ Domazet-Lošo T, Tautz D (diciembre de 2010). "Un índice de edad del transcriptoma de base filogenética refleja patrones de divergencia ontogenética". Naturaleza . 468 (7325): 815–818. Código Bib :2010Natur.468..815D. doi : 10.1038/naturaleza09632. PMID  21150997. S2CID  1417664.
  8. ^ Quint M, Drost HG, Gabel A, Ullrich KK, Bönn M, Grosse I (octubre de 2012). "Un reloj de arena transcriptómico en embriogénesis vegetal". Naturaleza . 490 (7418): 98-101. Código Bib :2012Natur.490...98Q. doi : 10.1038/naturaleza11394. PMID  22951968. S2CID  4404460.
  9. ^ Cheng X, Hui JH, Lee YY, Wan Law PT, Kwan HS (junio de 2015). "Un" reloj de arena del desarrollo "en los hongos". Biología Molecular y Evolución . 32 (6): 1556-1566. doi : 10.1093/molbev/msv047 . PMID  25725429.
  10. ^ Xie Y, Kwan HS, Chan PL, Wu W, Chiou J, Chang J (16 de julio de 2022). "El patrón filotranscriptómico de reloj de arena en hongos: un modelo actualizado". bioRxiv : 2022.07.14.500038. doi :10.1101/2022.07.14.500038. S2CID  250646039.
  11. ^ Futo M, Opašić L, Koska S, Čorak N, Široki T, Ravikumar V, et al. (enero de 2021). "Características similares a las de un embrión en el desarrollo de biopelículas de Bacillus subtilis". Biología Molecular y Evolución . 38 (1): 31–47. doi :10.1093/molbev/msaa217. PMC 7783165 . PMID  32871001. 
  12. ^ Moyers BA, Zhang J (enero de 2015). "El sesgo filoestratigráfico crea patrones falsos de evolución del genoma". Biología Molecular y Evolución . 32 (1): 258–267. doi :10.1093/molbev/msu286. PMC 4271527 . PMID  25312911. 
  13. ^ Casola C (noviembre de 2018). "De De Novo a" De Nono ": la mayoría de los nuevos genes codificadores de proteínas identificados con filoestratigrafía son genes antiguos o duplicados recientes". Biología y evolución del genoma . 10 (11): 2906–2918. doi : 10.1093/gbe/evy231. PMC 6239577 . PMID  30346517. 
  14. ^ Moyers BA, Zhang J (agosto de 2018). Martín B (ed.). "Hacia la reducción de errores y sesgos filoestratigráficos". Biología y evolución del genoma . 10 (8): 2037-2048. doi : 10.1093/gbe/evy161. PMC 6105108 . PMID  30060201. 
  15. ^ Domazet-Lošo T, Carvunis AR, Albà MM, Šestak MS, Bakaric R, Neme R, Tautz D (abril de 2017). "No hay evidencia de que el sesgo filoestratigráfico afecte las inferencias sobre los patrones de aparición y evolución genética". Biología Molecular y Evolución . 34 (4): 843–856. doi :10.1093/molbev/msw284. PMC 5400388 . PMID  28087778. 
  16. ^ Tautz, Diethard; Domazet-Lošo, Tomislav (octubre de 2011). "El origen evolutivo de los genes huérfanos". Naturaleza Reseñas Genética . 12 (10): 692–702. doi :10.1038/nrg3053.
  17. ^ ab Weisman, Caroline M.; Murray, Andrew W.; Eddy, Sean R. (2 de noviembre de 2020). "Muchos, pero no todos, genes específicos de linaje pueden explicarse por una falla en la detección de homología". Más biología . 18 (11): e3000862. doi : 10.1371/journal.pbio.3000862 . PMC 7660931 . PMID  33137085.