stringtranslate.com

Indeles de firma conservados

Las inserciones y eliminaciones de firmas conservadas ( CSI ) en secuencias de proteínas proporcionan una categoría importante de marcadores moleculares para comprender las relaciones filogenéticas. [1] [2] Los CSI, provocados por cambios genéticos raros, proporcionan marcadores filogenéticos útiles que generalmente son de tamaño definido y están flanqueados en ambos lados por regiones conservadas para garantizar su confiabilidad. Si bien los indeles pueden ser inserciones o eliminaciones arbitrarias, los CSI se definen como solo aquellos indeles de proteínas que están presentes dentro de regiones conservadas de la proteína. [2] [3] [4] [5]

Los CSI que están restringidos a un clado o grupo de especies particular generalmente proporcionan buenos marcadores filogenéticos de una ascendencia evolutiva común. [2] Debido a la rareza y la naturaleza altamente específica de tales cambios, es menos probable que puedan surgir de forma independiente mediante una evolución convergente o paralela (es decir, homoplasia) y, por lo tanto, es probable que representen una sinapomorfía . Otros factores de confusión, como las diferencias en las tasas evolutivas en diferentes sitios o entre diferentes especies, generalmente tampoco afectan la interpretación de un CSI. [2] [3] Al determinar la presencia o ausencia de CSI en una especie fuera del grupo, se puede inferir si la forma ancestral de CSI fue una inserción o eliminación y esto puede usarse para desarrollar una relación filogenética arraigada entre organismos. [1] [2]

Los CSI se descubren buscando cambios compartidos en un árbol filogenético construido a partir de secuencias de proteínas. Se ha descubierto que la mayoría de los CSI que se han identificado tienen un alto valor predictivo al agregar nuevas secuencias, conservando la especificidad para los clados de especies identificados originalmente. Se pueden utilizar para identificar especies conocidas e incluso previamente desconocidas que pertenecen a estos grupos en diferentes entornos. [3] En comparación con las órdenes de ramificación de árboles que pueden variar entre métodos, los CSI específicos crean circunscripciones más concretas que son computacionalmente más baratas de aplicar. [6]

Tipos

Específico del grupo

Figura 1: Ejemplo de un indel de firma conservada (CSI) específico de un grupo, que es específico para especies del taxón X. Los guiones en las alineaciones indican la presencia de un aminoácido idéntico al de la línea superior.

Los CSI específicos de grupo son comúnmente compartidos por diferentes especies que pertenecen a un taxón particular (por ejemplo, género, familia, clase, orden, filo), pero no están presentes en otros grupos. Lo más probable es que estos CSI se introdujeran en un ancestro del grupo de especies antes de que los miembros de los taxones divergieran. Proporcionan medios moleculares para distinguir a los miembros de un taxón particular de todos los demás organismos. [2] [5]

La Figura 1 muestra un ejemplo de 5aa CSI que se encuentra en todas las especies pertenecientes al taxón X. Esta es una característica distintiva de este taxón ya que no se encuentra en ninguna otra especie. Esta firma probablemente fue introducida en un ancestro común de la especie de este taxón. De manera similar, otras firmas específicas de grupo (no mostradas) podrían ser compartidas por A1 y A2 o B1 y B2, etc., o incluso por X1 y X2 o por X3 y X4, etc. Los grupos A, B, C, D y X, en este diagrama podría corresponder a diversos filos bacterianos o eucariotas . [7]

Los CSI específicos de grupo se han utilizado en el pasado para determinar la relación filogenética de varios filos bacterianos y subgrupos dentro de ellos. Por ejemplo, los miembros del filo Thermotogota (anteriormente Thermotogae) compartían de forma única un inserto de 3 aminoácidos en la proteína ribosómica esencial 50S L7/L12 , dentro de una región altamente conservada (82-124 aminoácidos). Esto no está presente en ninguna otra especie de bacteria y podría usarse para caracterizar a los miembros de Thermotogota de todas las demás bacterias. También se utilizaron CSI específicos de grupo para caracterizar subgrupos dentro de Thermotogota. [8]

Multigrupo o línea principal

Figura 2: Indel de firma conservada de línea principal o grupo múltiple (CSI). Los guiones indican la presencia de un aminoácido idéntico al de la línea superior.

Los CSI principales son aquellos en los que varios filos principales comparten una inserción o eliminación conservada, pero están ausentes en otros filos. [2]

La Figura 2 muestra un ejemplo de 5aa CSI encontrado en una región conservada que está comúnmente presente en las especies que pertenecen a los filos X, Y y Z, pero está ausente en otros filos (A, B y C). Esta firma indica una relación específica de los taxones X, Y y Z y también de A, B y C. Según la presencia o ausencia de dicho indel, en especies fuera del grupo (a saber, Archaea), se puede inferir si el indel es una inserción o una eliminación, y cuál de estos dos grupos A, B, C o X, Y, Z es ancestral. [7]

Los CSI principales se han utilizado en el pasado para determinar la relación filogenética de varios filos bacterianos. El gran CSI de aproximadamente 150 a 180 aminoácidos dentro de una región conservada de Girasa B (entre los aminoácidos 529 a 751), se comparte comúnmente entre varias especies de Pseudomonadota , Chlamydiota , Planctomycetota y Aquificota . Este CSI está ausente en otros filos bacterianos ancestrales, así como en Archaea . [9] De manera similar, un CSI grande de aproximadamente 100 aminoácidos en homólogos de RpoB (entre los aminoácidos 919-1058) está presente en varias especies pertenecientes a Pseudomonadota, Bacteroidota , Chlorobiota , Chlamydiota , Planctomycetota y Aquificota. Este CSI está ausente en otros filos bacterianos ancestrales, así como en Archaea. [10] [11] En ambos casos se puede inferir que los grupos que carecen del CSI son ancestrales.

Estudios evolutivos basados ​​en CSI

Figura 3: Un árbol de proteínas concatenado que muestra la relación filogenética del grupo Thermotogota. Se indica el número de CSI que soportan el orden de bifurcación.
Figura 4: Un árbol de proteínas concatenado que muestra la relación filogenética de dos filos de Archaea. Se indica el número de CSI que soportan el orden de bifurcación.
Figura 5: Un árbol de proteínas concatenado que muestra la relación filogenética del grupo Pasteurellales. Se indica el número de CSI que soportan el orden de bifurcación.

Una cuestión clave en la filogenia bacteriana es comprender cómo se relacionan las diferentes especies bacterianas entre sí y su orden de ramificación a partir de un ancestro común. Actualmente, la mayoría de los árboles filogenéticos se basan en el ARNr 16S u otros genes/proteínas. Estos árboles no siempre pueden resolver cuestiones filogenéticas clave con un alto grado de certeza. [12] [13] [14] [15] [16] Sin embargo, en los últimos años, el descubrimiento y los análisis de indeles conservados (CSI) en muchas proteínas distribuidas universalmente han ayudado en esta búsqueda. Se postula que los eventos genéticos que los llevaron a haber ocurrido en importantes puntos de ramificación evolutiva y los patrones de distribución de sus especies proporcionan información valiosa sobre el orden de ramificación y las interrelaciones entre diferentes filos bacterianos. [1] [2] [8]

termotogota

Recientemente se caracterizó la relación filogenética del grupo Thermotogota con base en el enfoque CSI. Hasta ahora no se conocían marcadores bioquímicos o moleculares que pudieran distinguir claramente las especies de este filo de todas las demás bacterias. Se descubrieron más de 60 CSI que eran específicos de todo el filo Thermotogota o sus diferentes subgrupos. 18 CSI están presentes de manera única en varias especies de Thermotogota y proporcionan marcadores moleculares para el filo. Además, hubo muchos CSI que eran específicos de varios subgrupos de Thermotogota. 12 CSI eran específicos de un clado que constaba de varias especies de Thermotogota excepto Tt. Lettingae. 14 CSI eran específicos de un clado formado por los géneros Fervidobacterium y Thermosipho y 18 CSI eran específicos del género Thermosiphon . [ cita necesaria ]

Por último, se informaron 16 CSI que fueron compartidos por algunas o todas las especies de Thermotogota o algunas especies de otros taxones como Archaea , Aquificota , Bacillota , Pseudomonadota , Deinococcota , Fusobacteriota , Dictyoglomota , Chloroflexota y eucariotas . La presencia compartida de algunos de estos CSI podría deberse a la transferencia lateral de genes (LGT) entre estos grupos. Sin embargo, el número de CSI que se comparten comúnmente con otros taxones es mucho menor que los que son específicos de Thermotogota y no exhiben ningún patrón específico. Por tanto, no tienen ningún efecto significativo en la distinción de Thermotogota. [8]

arqueas

Los termoproteotas mesófilos se colocaron recientemente en un nuevo filo de Archaea llamado Nitrososphaerota (anteriormente Thaumarchaeota). Sin embargo, existen muy pocos marcadores moleculares que puedan distinguir este grupo de arqueas del filo Thermoproteota (anteriormente Crenarchaeota). Se llevó a cabo un estudio filogenético detallado utilizando el enfoque CSI para distinguir estos filos en términos moleculares. Se encontraron 6 CSI de forma única en varios Nitrososphaerota, a saber, Cenarchaeum symbiosum , Nitrosopumilus maritimus y varios Thermoproteota marinos no cultivados. Se encontraron 3 CSI que eran comúnmente compartidos entre especies pertenecientes a Nitrososphaerota y Thermoproteota. Además, se encontraron varios CSI que son específicos para diferentes órdenes de Thermoproteota: 3 CSI para Sulfolobales , 5 CSI para Thermoproteales y, por último, 2 CSI comunes para Sulfolobales y Desulfurococcales . Las firmas descritas proporcionan medios novedosos para distinguir Thermoproteota y Nitrososphaerota, además podrían usarse como una herramienta para la clasificación e identificación de especies relacionadas. [17]

pasteurellales

Los miembros del orden Pasteurellales se distinguen actualmente principalmente por su posición en la ramificación del árbol 16srRNA. Actualmente se conocen muy pocos marcadores moleculares que puedan distinguir a los miembros de este orden de otras bacterias. Recientemente se utilizó un enfoque CSI para dilucidar las relaciones filogenéticas entre las especies en este orden; Se descubrieron más de 40 CSI que eran compartidos de forma única por todas o la mayoría de las especies. Dentro de este Pasteurellales se forman dos clados principales: el clado I, que abarca Aggregatibacter , Pasteurella , Actinobacillus succinogenes , Mannheimia succiniciproducens , Haemophilus influenzae y Haemophilus somnus , fue apoyado por 13 CSI. El clado II, que abarca Actinobacillus pleuropneumoniae , Actinobacillus minor , Haemophilus ducreyi , Mannheimia haemolytica y Haemophilus parasuis , contó con el apoyo de nueve CSI. Con base en estos resultados, se propuso dividir Pasteurellales de su familia actual en dos diferentes. Además, las firmas descritas proporcionarían medios novedosos para identificar especies de Pasteurellales no descubiertas. [18]

gammaproteobacterias

La clase Gammaproteobacteria forma uno de los grupos más grandes de bacterias. Actualmente se distingue de otras bacterias únicamente por árboles filogenéticos basados ​​en ARNr 16s . No se conocen características moleculares exclusivas de la clase o sus diferentes subgrupos. Se realizó un estudio detallado basado en CSI para comprender mejor la filogenia de esta clase. En primer lugar, se creó un árbol filogenético basado en secuencias concatenadas de varias proteínas distribuidas universalmente. El orden de ramificación de los diferentes órdenes de la clase Gammaproteobacteria (desde el más reciente hasta el más antiguo) fue: Enterobacteriales > Pasteurellales > Vibrionales , Aeromonadales > Alteromonadales > Oceanospirillales , Pseudomonadales >Chromatiales, Legionellales , Methylococcales , Xanthomonadales , Cardiobacteriales , Thiotrichales . Además, se descubrieron 4 CSI que eran exclusivas de la mayoría de las especies de la clase Gammaproteobacteria. Una eliminación de 2 aa en la transformilasa AICAR fue compartida exclusivamente por todas las gammaproteobacterias excepto Francisella tularensis . Se encontró una deleción de 4 aa en la subunidad b de la ARN polimerasa y una deleción de 1 aa en la proteína ribosómica L16 de forma única en varias especies pertenecientes a los órdenes Enterobacteriales, Pasteurellales, Vibrionales, Aeromonadales y Alteromonadales, pero no se encontraron en otras gammaproteobacterias. Por último, una deleción de 2 aa en la leucil-ARNt sintetasa estaba comúnmente presente en los órdenes anteriores de la clase Gammaproteobacteria y en algunos miembros del orden Oceanospirillales. [19] Otro estudio basado en CSI también ha identificado 4 CSI que son exclusivos del orden Xanthomonadales. En conjunto, estos dos hechos muestran que Xanthomonadales es un grupo monofilético ancestral de otras Gammaproteobacteria, lo que muestra además que Xanthomonadales es una subdivisión independiente y constituye uno de los linajes con ramificación más profunda dentro del clado Gammaproteobacteria. [4] [19]

Ver también

Referencias

  1. ^ abc Baldauf, SL (1993). "Los animales y los hongos son parientes más cercanos entre sí: evidencia congruente de múltiples proteínas". Procedimientos de la Academia Nacional de Ciencias . 90 (24): 11558–11562. Código bibliográfico : 1993PNAS...9011558B. doi : 10.1073/pnas.90.24.11558 . PMC  48023 . PMID  8265589.
  2. ^ abcdefgh Gupta, Radhey S. (1998). "Filogenias de proteínas y secuencias de firmas: una reevaluación de las relaciones evolutivas entre arqueobacterias, eubacterias y eucariotas". Reseñas de Microbiología y Biología Molecular . 62 (4): 1435–91. doi :10.1128/MMBR.62.4.1435-1491.1998. PMC 98952 . PMID  9841678. 
  3. ^ abc Gupta, Radhey S.; Griffiths, Emma (2002). "Cuestiones críticas en la filogenia bacteriana". Biología Teórica de Poblaciones . 61 (4): 423–34. doi :10.1006/tpbi.2002.1589. PMID  12167362.
  4. ^ ab Cutiño-Jiménez, Ania M.; Martins-Pinheiro, Marinalva; Lima, Wanessa C.; Martín-Tornet, Alexander; Morales, Osleidys G.; Menck, Carlos FM (2010). "Colocación evolutiva de Xanthomonadales basada en secuencias distintivas de proteínas conservadas". Filogenética molecular y evolución . 54 (2): 524–34. doi : 10.1016/j.ympev.2009.09.026 . PMID  19786109.
  5. ^ ab Rokas, Antonis; Holanda, Peter WH (2000). "Cambios genómicos raros como herramienta para la filogenética". Tendencias en ecología y evolución . 15 (11): 454–459. doi :10.1016/S0169-5347(00)01967-4. PMID  11050348.
  6. ^ Gupta, Radhey S.; Kanter-Eivin, David A. (9 de mayo de 2023). "Servidor AppIndels.com: una herramienta basada en web para la identificación de indeles de firma conservados específicos de taxones conocidos en secuencias del genoma. Validación de su utilidad mediante la predicción de la afiliación taxonómica de> 700 cepas no clasificadas de especies de Bacillus". Revista Internacional de Microbiología Sistemática y Evolutiva . 73 (5). doi :10.1099/ijsem.0.005844.
  7. ^ ab Gupta, Radhey. "Inserciones y eliminaciones conservadas en secuencias de proteínas". Filogenia bacteriana . Laboratorio Gupta. Archivado desde el original el 15 de septiembre de 2011 . Consultado el 2 de abril de 2012 .{{cite web}}: Mantenimiento CS1: bot: estado de la URL original desconocido ( enlace )
  8. ^ abc Gupta, Radhey S.; Bhandari, Vaibhav (2011). "Filogenia y firmas moleculares del filo Thermotogae y sus subgrupos". Antonie van Leeuwenhoek . 100 (1): 1–34. doi :10.1007/s10482-011-9576-z. PMID  21503713. S2CID  24995263.
  9. ^ Griffiths, E.; Gupta, RS (2007). "La filogenia y las inserciones conservadas compartidas en las proteínas proporcionan evidencia de que los Verrucomicrobia son los parientes de vida libre más cercanos conocidos de las clamidias". Microbiología . 153 (8): 2648–54. doi : 10.1099/mic.0.2007/009118-0 . PMID  17660429.
  10. ^ Gupta, Radhey S. (2003). "Relaciones evolutivas entre bacterias fotosintéticas". Investigación sobre la fotosíntesis . 76 (1–3): 173–83. doi :10.1023/A:1024999314839. PMID  16228576. S2CID  38460308.
  11. ^ Griffiths, Emma; Gupta, Radhey S. (2004). "Las secuencias de firmas en diversas proteínas proporcionan evidencia de la divergencia tardía del Orden Acuificales" (PDF) . Microbiología Internacional . 7 (1): 41–52. PMID  15179606.
  12. ^ Marrón, James R.; Douady, Christophe J.; Italia, Michael J.; Marshall, William E.; Stanhope, Michael J. (2001). "Árboles universales basados ​​en grandes conjuntos de datos de secuencias de proteínas combinadas". Genética de la Naturaleza . 28 (3): 281–5. doi :10.1038/90129. PMID  11431701. S2CID  8516570.
  13. ^ Cavalier-Smith, T (2002). "El origen neomurano de las arqueobacterias, la raíz negibacteriana del árbol universal y la megaclasificación bacteriana". Revista Internacional de Microbiología Sistemática y Evolutiva . 52 (1): 7–76. doi : 10.1099/00207713-52-1-7 . PMID  11837318.
  14. ^ Ciccarelli, FD; Doerks, T; Von Mering, C; Creevey, CJ; Snel, B; Bork, P (2006). "Hacia la reconstrucción automática de un árbol de la vida altamente resuelto". Ciencia . 311 (5765): 1283–7. Código bibliográfico : 2006 Ciencia... 311.1283C. CiteSeerX 10.1.1.381.9514 . doi : 10.1126/ciencia.1123061. PMID  16513982. S2CID  1615592. 
  15. ^ Daubin, V.; Gouy, M; Perrière, G (2002). "Un enfoque filogenómico de la filogenia bacteriana: evidencia de un núcleo de genes que comparten una historia común". Investigación del genoma . 12 (7): 1080–90. doi :10.1101/gr.187002. PMC 186629 . PMID  12097345. 
  16. ^ Eisen, Jonathan A. (1995). "La proteína RecA como molécula modelo para estudios sistemáticos moleculares de bacterias: comparación de árboles de RecA y ARNr 16S de la misma especie". Revista de evolución molecular . 41 (6): 1105–23. Código Bib : 1995JMolE..41.1105E. doi :10.1007/bf00173192. PMC 3188426 . PMID  8587109. 
  17. ^ Gupta, Radhey S.; Shami, Ali (2010). "Firmas moleculares de Crenarchaeota y Thaumarchaeota". Antonie van Leeuwenhoek . 99 (2): 133–57. doi :10.1007/s10482-010-9488-3. PMID  20711675. S2CID  12874800.
  18. ^ Naushad, Hafiz Sohail; Gupta, Radhey S. (2011). "Firmas moleculares (indeles conservados) en secuencias de proteínas que son específicas del orden Pasteurellales y distinguen dos de sus clados principales". Antonie van Leeuwenhoek . 101 (1): 105–24. doi :10.1007/s10482-011-9628-4. PMID  21830122. S2CID  15114511.
  19. ^ ab Gao, B.; Mohán, R.; Gupta, RS (2009). "Filogenómica y firmas de proteínas que aclaran las relaciones evolutivas entre las gammaproteobacterias". Revista Internacional de Microbiología Sistemática y Evolutiva . 59 (2): 234–47. doi : 10.1099/ijs.0.002741-0 . PMID  19196760.