La filogenética microbiana es el estudio de la manera en que los distintos grupos de microorganismos están relacionados genéticamente. Esto ayuda a rastrear su evolución . [1] [2] Para estudiar estas relaciones, los biólogos se basan en la genómica comparativa , ya que la fisiología y la anatomía comparada no son métodos posibles. [3]
La filogenética microbiana surgió como campo de estudio en la década de 1960, cuando los científicos comenzaron a crear árboles genealógicos basados en las diferencias en el orden de los aminoácidos de las proteínas y los nucleótidos de los genes en lugar de utilizar la anatomía y la fisiología comparativas. [4] [5]
Una de las figuras más importantes en la etapa inicial de este campo es Carl Woese , quien en sus investigaciones se centró en las bacterias , observando el ARN en lugar de las proteínas. Más específicamente, decidió comparar los oligonucleótidos de la subunidad pequeña del ARN ribosómico (16rRNA). Los oligonucleótidos coincidentes en diferentes bacterias podrían compararse entre sí para determinar cuán estrechamente estaban relacionados los organismos. En 1977, después de recolectar y comparar fragmentos de ARNr 16s para casi 200 especies de bacterias, Woese y su equipo concluyeron en 1977 que las Archaebacteria no eran parte de las bacterias sino organismos completamente independientes. [3] [6]
En la década de 1980, la filogenética microbiana entró en su época dorada, ya que las técnicas para secuenciar ARN y ADN mejoraron enormemente. [7] [8] Por ejemplo, la comparación de las secuencias de nucleótidos de genes completos se vio facilitada por el desarrollo de los medios para clonar ADN, lo que hizo posible crear muchas copias de secuencias a partir de muestras diminutas. De increíble impacto para la filogenética microbiana fue la invención de la reacción en cadena de la polimerasa (PCR). [9] [10] Todas estas nuevas técnicas llevaron a la propuesta formal de los tres dominios de la vida: Bacteria , Archaea (el propio Woese propuso este nombre para reemplazar la antigua nominación de Archaebacteria) y Eukarya, posiblemente uno de los pasajes clave en la historia de la taxonomía. [11]
Uno de los problemas intrínsecos del estudio de los organismos microbianos era la dependencia de los estudios a partir de cultivos puros en un laboratorio. Los biólogos intentaron superar esta limitación mediante la secuenciación de genes de ARNr obtenidos a partir de ADN aislado directamente del medio ambiente. [12] [13] Esta técnica permitió apreciar plenamente que las bacterias, no sólo tienen la mayor diversidad, sino que constituyen la mayor biomasa de la Tierra. [14]
A finales de la década de 1990 se inició la secuenciación de genomas de varios organismos microbianos y en 2005 se habían secuenciado 260 genomas completos, lo que dio como resultado la clasificación de 33 eucariotas, 206 eubacterias y 21 arqueones. [15]
A principios de la década de 2000, los científicos comenzaron a crear árboles filogenéticos basados no en el ARNr , sino en otros genes con funciones diferentes (por ejemplo, el gen de la enzima ARN polimerasa [16] ). Las genealogías resultantes diferían en gran medida de las basadas en el ARNr. Estas historias genéticas eran tan diferentes entre sí que la única hipótesis que podía explicar estas divergencias era una influencia importante de la transferencia horizontal de genes (HGT), un mecanismo que permite a una bacteria adquirir uno o más genes de un organismo completamente no relacionado. [17] La HGT explica por qué las similitudes y diferencias en algunos genes deben estudiarse cuidadosamente antes de usarse como una medida de la relación genealógica de los organismos microbianos. [18]
Los estudios destinados a comprender la difusión de la HGT sugirieron que la facilidad con la que se transfieren genes entre bacterias hace imposible aplicarles "el concepto de especie biológica". [19] [20]
Desde Darwin , cada filogenia de cada organismo ha sido representada en forma de árbol. No obstante, debido al gran papel que la TGH juega para los microbios, algunos microbiólogos evolutivos sugirieron abandonar esta visión clásica en favor de una representación de genealogías más parecida a una red, también conocida como red. Sin embargo, existen algunos problemas con esta representación en red, como la incapacidad de establecer con precisión el organismo donante para un evento de TGH y la dificultad para determinar la ruta correcta a través de los organismos cuando ocurrieron múltiples eventos de TGH. Por lo tanto, todavía no hay un consenso entre los biólogos sobre qué representación se ajusta mejor al mundo microbiano. [21]
La mayoría de los taxones microbianos nunca han sido cultivados o caracterizados experimentalmente. El uso de la taxonomía y la filogenia son herramientas esenciales para organizar la diversidad de la vida. La recopilación de secuencias genéticas, la alineación de dichas secuencias en función de las homologías y, por lo tanto, el uso de modelos de mutación para inferir la historia evolutiva son métodos comunes para estimar las filogenias microbianas. [22] El ARNr de subunidad pequeña (SSU) (SSU rRNA) ha revolucionado la clasificación microbiana desde la década de 1970 y desde entonces se ha convertido en el gen más secuenciado [23] . Las inferencias filogenéticas se determinan en función de los genes elegidos, por ejemplo, el gen 16S rRNA se selecciona comúnmente para investigar inferencias en bacterias y arqueas, y los eucariotas microbianos utilizan con mayor frecuencia el gen 18S RNA. [24]
Los métodos comparativos filogenéticos ( PCM ) se utilizan comúnmente para comparar múltiples rasgos entre organismos. En el ámbito de los estudios del microbioma, no es común el uso de PCM; sin embargo, estudios recientes han logrado identificar genes asociados con la colonización del intestino humano. [22] Este desafío se abordó midiendo la asociación estadística entre una especie que alberga el gen y la probabilidad de que la especie esté presente en el microbioma intestinal. Los análisis muestran la combinación de metagenómica shotgun emparejada con modelos filogenéticamente conscientes. [25]
Este método se utiliza comúnmente para la estimación de perfiles genéticos y metabólicos de comunidades existentes utilizando un conjunto de genomas de referencia, comúnmente realizado con PICRUSt (Investigación filogenética de comunidades mediante la reconstrucción de estados no observados) en estudios de microbiomas. [22] PICRUSt es un enfoque computacional capaz de predecir la composición funcional de un metagenoma con datos de marcadores y una base de datos de genomas de referencia. Para predecir qué familias de genes están presentes, PICRUSt utiliza un algoritmo extendido de reconstrucción de estados ancestrales y luego combina las familias de genes para estimar el metagenoma compuesto. [26]
Las variables filogenéticas se utilizan para describir variables que se construyen utilizando características de la filogenia para resumir y contrastar datos de especies en el árbol filogenético. Los conjuntos de datos del microbioma se pueden simplificar utilizando variables filogenéticas al reducir las dimensiones de los datos a unas pocas variables que contienen información biológica. [22] Los métodos recientes como PhILR y la filofactorización abordan los desafíos del análisis de variables filogenéticas. La transformación PhILR combina modelos estadísticos y filogenéticos para superar los desafíos de los datos de composición. La incorporación de ambos modelos evolutivos microbianos con la transformación de razón logarítmica isométrica crea la transformación PhILR. [27] La filofactorización es una herramienta de reducción de dimensionalidad que se utiliza para identificar bordes en la filogenia de los cuales pueden haber surgido rasgos ecológicos funcionales putativos. [28]
Las inferencias en filogenética requieren la suposición de una ascendencia común o de homología, pero cuando se viola esta suposición la señal puede verse alterada por el ruido. [23] Es posible que los rasgos microbianos no estén relacionados debido a la transferencia horizontal de genes, lo que hace que la composición taxonómica revele poco sobre la función de un sistema. [29]