La filoestratigrafía genómica es un método estadístico genético novedoso desarrollado para datar el origen de genes específicos observando sus homólogos en todas las especies . Fue desarrollado por primera vez por el Instituto Ruđer Bošković en Zagreb , Croacia . [1] El sistema vincula genes con su gen fundador , lo que nos permite luego determinar su edad. Esto podría ayudarnos a comprender mejor muchos procesos evolutivos, como los patrones de nacimiento de genes a lo largo de la evolución o la relación entre la edad de un transcriptoma a lo largo del desarrollo embrionario. Se han desarrollado herramientas bioinformáticas como GenEra para calcular edades relativas de genes basadas en la filoestratigrafía genómica. [2]
Esta técnica se basa en el supuesto de que la diversidad del genoma no se debe sólo a la duplicación de genes sino también a los continuos y frecuentes nacimientos de genes de novo. Estos genes (llamados "genes fundadores") se formarían a partir de secuencias de ADN no genéticas , así como de cambios en el marco de lectura (u otras formas de surgir dentro de genes existentes), o incluso de una evolución muy rápida de la proteína que modificaría la secuencia más allá del reconocimiento. [3] Estos nuevos genes tendrían en un principio altas tasas evolutivas que luego se ralentizarían con el tiempo, permitiéndonos reconocer su linaje en sus descendientes. [1] Los genes fundadores pueden luego colocarse en un filoestrato específico . El filoestrato se representa como el clado que incluye todos los genes que derivan del mismo gen fundador, lo que significa que este gen se formó en el ancestro común de este clado (p. ej. Arthropoda, Mammalia, Metazoa, etc.). Colocar estos genes fundadores y sus descendientes en diferentes filoestratos puede permitirnos envejecerlos. Esto luego puede usarse para analizar el origen de ciertas funciones de las proteínas y procesos de desarrollo a escala macroevolutiva, observando también las conexiones entre ciertos genes.
El método original para la filoestratigrafía genómica implica el uso de una búsqueda de similitud de secuencia BLAST con un valor de corte E de 10 −3 . Se reúnen los genes que se consideran suficientemente similares en secuencia y se determina el clado que engloba todos los taxones representados por esos genes. Este clado luego se convierte en el filoestrato de estos genes. Las implementaciones modernas reemplazan BLAST por DIAMOND ya que es mucho más rápido [4] y han refinado este proceso para tener en cuenta la contaminación de secuencia, la transferencia horizontal de genes y los eventos de falla en la detección de homología. [2] Al determinar el ancestro común de este clado, podemos dar una edad al gen fundador y a todos sus descendientes. La aplicación del proceso a escala de todo el genoma puede permitirnos detectar patrones de nacimientos de genes fundadores e inferir el papel de ciertos genes involucrados en procesos de desarrollo y vías fisiológicas específicos de cada clado, y el origen de esos rasgos. Los desarrolladores del método dieron en el artículo original [1] un ejemplo de cómo explotar este sistema en la práctica utilizando Drosophila . Reunieron 13.000 genes de los que determinaron los genes fundadores, reagrupándolos en sus respectivos filoestratos. También segregaron las familias de genes en función de si se expresaban principalmente en alguna de las tres capas germinales ( endodermo , mesodermo , ectodermo ). Al estudiar las frecuencias de expresión de genes en esos diferentes filoestratos, pudieron identificar hipotéticamente la posible formación original de esas capas germinales en períodos específicos y organismos ancestrales en la historia evolutiva.
Otros estudios han descubierto que los estallidos de eventos fundadores de genes están relacionados con importantes innovaciones evolutivas, como la aparición de la simetría bilateral en los animales, la aparición de la multicelularidad en las algas estreptofitas, la colonización de la tierra por plantas o la aparición de plantas con flores . [2]
Desde su invención, este equipo de investigación [5], así como otros, ha utilizado regularmente la filoestratigrafía genómica, [6] en particular en un intento de determinar el origen de los genes del cáncer , mostrando aparentemente un fuerte vínculo entre un pico en la formación del cáncer genes y la transición a organismos multicelulares , una conexión que se había planteado previamente como hipótesis y, por lo tanto, está respaldada por la filoestratigrafía. A medida que su uso ha ido creciendo, el método ha sido evaluado y mejorado en múltiples ocasiones, y se han desarrollado programas que lo ejecutan de forma automática y más eficiente. [2] [3]
Uno de los usos más destacados de la filoestratigrafía genómica ha sido inferir la correlación entre la filogenia y los procesos de desarrollo (a menudo llamada correlación filogenia-ontogenia). Utilizando la filoestratigrafía genómica, hasta el día de hoy los científicos han encontrado una correlación filogenia-ontogenia significativa en animales, [7] plantas, [8] hongos, [9] [10] e incluso biopelículas bacterianas. [11]
Aunque ahora la comunidad científica la utiliza con frecuencia, la filoestratigrafía genómica también ha recibido algunas críticas por ser demasiado inexacta para que sus mediciones sean confiables. En primer lugar, según algunos autores, los supuestos carecen de precisión. [12] [13] Es erróneo suponer, por ejemplo, que todas las especies más allá del organismo de interés comparten la misma tasa evolutiva de proteínas, lo cual no es cierto ya que varía dependiendo de la velocidad del ciclo celular , lo que genera problemas al establecer los límites de Error BLAST al englobar todas las proteínas originadas a partir del mismo gen fundador. Otro punto es que la búsqueda BLAST supone que las tasas de evolución de las proteínas son constantes en todos sus sitios, lo cual también es falso. Por último, se podría decir que el modelo no tiene en cuenta correctamente las duplicaciones de genes, así como las pérdidas de genes: los cambios en las tasas evolutivas causadas por duplicaciones de genes debido a nuevos cambios funcionales aumentarían las tasas de error BLAST y la pérdida de genes en taxones distantes a el estudiado podría conducir a grandes subestimaciones en la edad calculada del gen y el filoestrato de los genes fundadores en comparación con sus valores reales. Sin embargo, en lugar de exigir simplemente abandonar el método, los críticos han intentado trabajar para refinarlo desde su estado original, introduciendo otras posibles fórmulas matemáticas o herramientas de búsqueda de secuencias, [14] aunque el Instituto Ruđer Bošković ha respondido a tales críticas afirmando su enfoque original era válido y no necesitaba una revisión exhaustiva. [15] Este debate también se incluye como parte de una discusión más amplia sobre la importancia de los nacimientos de genes de novo en la creación de diversidad genética, en la que la filoestratigrafía genómica respalda que tienen un fuerte efecto. También se ha propuesto que los eventos fundadores de genes no solo representan eventos de nacimiento de genes de novo , sino también cambios significativos en la secuencia de proteínas que los modifican más allá del reconocimiento con otros genes relacionados y, por lo tanto, adquieren nuevas actividades biológicas. [16] No obstante, la filoestratigrafía genómica supone que la detección de tales "eventos fundadores" implica una novedad evolutiva. Sin embargo, estudios recientes sugieren que la detección de genes que están restringidos a ciertos grupos taxonómicos (llamados genes taxonómicamente restringidos) puede explicarse por una falla en la detección de homología, es decir, la incapacidad de las herramientas bioinformáticas (BLAST o cualquier otra herramienta para detectar homología de secuencia) para rastrear la homología cuando las secuencias de proteínas son pequeñas y evolucionan a un ritmo rápido, lo que lleva a la imposibilidad de rastrear genes. [17]Por lo tanto, muchos de los "eventos fundadores" propuestos que fueron detectados originalmente mediante filoestratigrafía genómica podrían reinterpretarse como un artefacto metodológico debido a las limitaciones tecnológicas para detectar homólogos relacionados más lejanamente. Afortunadamente, el fallo en la detección de homología se puede probar explícitamente. [17] La herramienta GenEra desarrollada recientemente es capaz de separar el fallo en la detección de homología de posibles eventos fundadores de genes mediante pruebas explícitas de imposibilidad de seguimiento de genes. [2]