La filogenómica es la intersección de los campos de la evolución y la genómica . [1] El término se ha utilizado de múltiples maneras para referirse al análisis que involucra datos del genoma y reconstrucciones evolutivas. [2] Es un grupo de técnicas dentro de los campos más amplios de la filogenética y la genómica. La filogenómica extrae información comparando genomas completos, o al menos grandes porciones de genomas. [3] La filogenética compara y analiza las secuencias de genes individuales, o de un pequeño número de genes, así como muchos otros tipos de datos. Cuatro áreas principales se incluyen en la filogenómica:
El objetivo final de la filogenómica es reconstruir la historia evolutiva de las especies a través de sus genomas. Esta historia generalmente se infiere a partir de una serie de genomas mediante el uso de un modelo de evolución del genoma y métodos de inferencia estadística estándar (por ejemplo, inferencia bayesiana o estimación de máxima verosimilitud ). [4]
Cuando Jonathan Eisen acuñó originalmente la filogenómica , se aplicó a la predicción de la función genética. Antes del uso de técnicas filogenómicas, la predicción de la función genética se hacía principalmente comparando la secuencia genética con secuencias de genes con funciones conocidas. Cuando están involucrados varios genes con secuencias similares pero funciones diferentes, este método por sí solo es ineficaz para determinar la función. Un ejemplo concreto se presenta en el artículo "Delicias gastronómicas: un festín móvil". [5] Se habían utilizado predicciones genéticas basadas únicamente en la similitud de secuencias para predecir que Helicobacter pylori puede reparar ADN no coincidente . [6] Esta predicción se basó en el hecho de que este organismo tiene un gen cuya secuencia es muy similar a genes de otras especies de la familia de genes "MutS", que incluye muchos que se sabe que están involucrados en la reparación de errores de coincidencia. Sin embargo, Eisen señaló que H. pylori carece de otros genes que se cree que son esenciales para esta función (específicamente, miembros de la familia MutL). Eisen sugirió una solución a esta aparente discrepancia: los árboles filogenéticos de genes de la familia MutS revelaron que el gen encontrado en H. pylori no pertenecía a la misma subfamilia que los que se sabe están implicados en la reparación de errores de coincidencia. [5] Además, sugirió que este enfoque "filogenómico" podría usarse como un método general para la predicción de funciones de genes. Este enfoque se describió formalmente en 1998. [7] Para revisiones de este aspecto de la filogenómica, consulte Brown D, Sjölander K. Clasificación funcional utilizando inferencia filogenómica. [8] [9]
Las técnicas filogenéticas tradicionales tienen dificultades para establecer diferencias entre genes que son similares debido a la transferencia lateral de genes y aquellos que son similares porque los organismos compartieron un ancestro. Al comparar una gran cantidad de genes o genomas completos entre muchas especies, es posible identificar genes transferidos, ya que estas secuencias se comportan de manera diferente a lo esperado dada la taxonomía del organismo. Utilizando estos métodos, los investigadores pudieron identificar más de 2.000 enzimas metabólicas obtenidas por varios parásitos eucariotas a partir de la transferencia lateral de genes. [10]
La comparación de conjuntos de genes completos para un grupo de organismos permite la identificación de eventos en la evolución genética, como la duplicación o eliminación de genes . A menudo, estos acontecimientos son evolutivamente relevantes. Por ejemplo, las duplicaciones múltiples de genes que codifican enzimas degradativas de ciertas familias son una adaptación común de los microbios a nuevas fuentes de nutrientes. Por el contrario, la pérdida de genes es importante en la evolución reductiva , como en los parásitos intracelulares o en los simbiontes. Los eventos de duplicación del genoma completo , que potencialmente duplican todos los genes de un genoma a la vez, son eventos evolutivos drásticos con gran relevancia en la evolución de muchos clados, y cuya señal se puede rastrear con métodos filogenómicos.
Los estudios tradicionales de un solo gen son eficaces para establecer árboles filogenéticos entre organismos estrechamente relacionados, pero tienen inconvenientes cuando se comparan organismos o microorganismos más distantes. Esto se debe a la transferencia lateral de genes , la convergencia y las diferentes tasas de evolución de diferentes genes. Al utilizar genomas completos en estas comparaciones, las anomalías creadas a partir de estos factores se ven abrumadas por el patrón de evolución indicado por la mayoría de los datos. [11] [12] [13] A través de la filogenómica , se ha descubierto que la mayoría de los eucariotas fotosintéticos están vinculados y posiblemente comparten un solo ancestro. Los investigadores compararon 135 genes de 65 especies diferentes de organismos fotosintéticos. Estos incluían plantas , alveolados , rizarianos , haptofitos y criptomonas . [14] A esto se le ha denominado megagrupo Plantas+HC+SAR . Con este método, es teóricamente posible crear árboles filogenéticos completamente resueltos y las restricciones de tiempo se pueden recuperar con mayor precisión. [15] [16] Sin embargo, en la práctica este no es siempre el caso. Debido a la falta de datos, a veces varios árboles pueden estar respaldados por los mismos datos cuando se analizan utilizando diferentes métodos. [17]