stringtranslate.com

Indeles de firma conservadas

Las inserciones y deleciones de firmas conservadas ( CSIs ) en secuencias de proteínas proporcionan una categoría importante de marcadores moleculares para comprender las relaciones filogenéticas. [1] [2] Las CSIs, provocadas por cambios genéticos raros, proporcionan marcadores filogenéticos útiles que generalmente tienen un tamaño definido y están flanqueados en ambos lados por regiones conservadas para garantizar su confiabilidad. Si bien las indels pueden ser inserciones o deleciones arbitrarias, las CSIs se definen solo como aquellas indels de proteínas que están presentes dentro de regiones conservadas de la proteína. [2] [3] [4] [5]

Los CSI que están restringidos a un clado o grupo de especies en particular, generalmente proporcionan buenos marcadores filogenéticos de descendencia evolutiva común. [2] Debido a la rareza y la naturaleza altamente específica de tales cambios, es menos probable que puedan surgir de forma independiente por evolución convergente o paralela (es decir, homoplasia) y, por lo tanto, es probable que representen sinapomorfía . Otros factores de confusión, como las diferencias en las tasas evolutivas en diferentes sitios o entre diferentes especies, generalmente tampoco afectan la interpretación de un CSI. [2] [3] Al determinar la presencia o ausencia de CSI en una especie de grupo externo, se puede inferir si la forma ancestral del CSI fue una inserción o deleción y esto se puede utilizar para desarrollar una relación filogenética arraigada entre organismos. [1] [2]

Los CSI se descubren buscando cambios compartidos en un árbol filogenético construido a partir de secuencias de proteínas. Se ha descubierto que la mayoría de los CSI que se han identificado tienen un alto valor predictivo tras la adición de nuevas secuencias, manteniendo la especificidad para los clados de especies identificados originalmente. Se pueden utilizar para identificar especies conocidas e incluso desconocidas anteriormente que pertenecen a estos grupos en diferentes entornos. [3] En comparación con los órdenes de ramificación de árboles que pueden variar entre métodos, los CSI específicos permiten circunscripciones más concretas que son computacionalmente más baratas de aplicar. [6]

Tipos

Específico del grupo

Figura 1: Ejemplo de una indel de firma conservada (CSIs) específica de un grupo, que es específica para especies del taxón X. Los guiones en las alineaciones indican la presencia de un aminoácido idéntico al de la línea superior.

Los CSI específicos de grupo son comúnmente compartidos por diferentes especies que pertenecen a un taxón particular (por ejemplo, género, familia, clase, orden, filo), pero no están presentes en otros grupos. Estos CSI probablemente fueron introducidos en un ancestro del grupo de especies antes de que los miembros del taxón divergieran. Proporcionan medios moleculares para distinguir a los miembros de un taxón particular de todos los demás organismos. [2] [5]

La figura 1 muestra un ejemplo de CSI de 5aa que se encuentra en todas las especies pertenecientes al taxón X. Esta es una característica distintiva de este taxón, ya que no se encuentra en ninguna otra especie. Esta firma probablemente se introdujo en un ancestro común de la especie de este taxón. De manera similar, otras firmas específicas de grupo (no se muestran) podrían ser compartidas por A1 y A2 o B1 y B2, etc., o incluso por X1 y X2 o por X3 y X4, etc. Los grupos A, B, C, D y X, en este diagrama, podrían corresponder a varios filos bacterianos o eucariotas . [7]

En el pasado, se han utilizado CSI específicos de grupo para determinar la relación filogenética de varios filos bacterianos y subgrupos dentro de ellos. Por ejemplo, un inserto de 3 aminoácidos fue compartido de manera única por miembros del filo Thermotogota (anteriormente Thermotogae) en la proteína ribosomal esencial 50S L7/L12 , dentro de una región altamente conservada (82-124 aminoácidos). Esto no está presente en ninguna otra especie de bacteria y podría usarse para caracterizar a los miembros de Thermotogota de todas las demás bacterias. Los CSI específicos de grupo también se utilizaron para caracterizar subgrupos dentro de Thermotogota. [8]

Multigrupo o línea principal

Figura 2: Indel de firma conservada de línea principal o de varios grupos (CSI). Los guiones indican la presencia de un aminoácido idéntico al que aparece en la línea superior.

Los CSI principales son aquellos en los que una inserción o deleción conservada es compartida por varios filos principales, pero está ausente en otros filos. [2]

La figura 2 muestra un ejemplo de CSI de 5aa encontrado en una región conservada que está presente comúnmente en las especies pertenecientes a los filos X, Y y Z, pero está ausente en otros filos (A, B y C). Esta firma indica una relación específica de los taxones X, Y y Z y también A, B y C. Con base en la presencia o ausencia de tal indel, en especies de grupos externos (por ejemplo, Archaea), se puede inferir si el indel es una inserción o una deleción, y cuál de estos dos grupos A, B, C o X, Y, Z es ancestral. [7]

Los CSI de línea principal se han utilizado en el pasado para determinar la relación filogenética de varios filos bacterianos. El gran CSI de alrededor de 150-180 aminoácidos dentro de una región conservada de girasa B (entre los aminoácidos 529-751), es compartido comúnmente entre varias especies de Pseudomonadota , Chlamydiota , Planctomycetota y Aquificota . Este CSI está ausente en otros filos bacterianos ancestrales, así como en Archaea . [9] De manera similar, un gran CSI de alrededor de 100 aminoácidos en homólogos de RpoB (entre los aminoácidos 919-1058) está presente en varias especies pertenecientes a Pseudomonadota, Bacteroidota , Chlorobiota , Chlamydiota , Planctomycetota y Aquificota. Este CSI está ausente en otros filos bacterianos ancestrales, así como en Archaea. [10] [11] En ambos casos se puede inferir que los grupos que carecen del CSI son ancestrales.

Estudios evolutivos basados ​​en CSIs

Figura 3: Un árbol de proteínas concatenado que muestra la relación filogenética del grupo Thermotogota. Se indica el número de CSI que respaldan el orden de ramificación.
Figura 4: Un árbol de proteínas concatenado que muestra la relación filogenética de dos filos de Archaea. Se indica el número de CSI que respaldan el orden de ramificación.
Figura 5: Un árbol de proteínas concatenado que muestra la relación filogenética del grupo Pasteurellales. Se indica el número de CSI que respaldan el orden de ramificación.

Una cuestión clave en la filogenia bacteriana es comprender cómo se relacionan entre sí las diferentes especies bacterianas y su orden de ramificación a partir de un ancestro común. Actualmente, la mayoría de los árboles filogenéticos se basan en el ARNr 16S u otros genes/proteínas. Estos árboles no siempre son capaces de resolver cuestiones filogenéticas clave con un alto grado de certeza. [12] [13] [14] [15] [16] Sin embargo, en los últimos años, el descubrimiento y análisis de indeles conservados (CSI) en muchas proteínas distribuidas universalmente han ayudado en esta búsqueda. Se postula que los eventos genéticos que conducen a ellos ocurrieron en puntos de ramificación evolutiva importantes y sus patrones de distribución de especies brindan información valiosa sobre el orden de ramificación y las interrelaciones entre diferentes filos bacterianos. [1] [2] [8]

Termogota

Recientemente se ha caracterizado la relación filogenética del grupo Thermotogota con base en el enfoque CSI. Hasta ahora no se conocían marcadores bioquímicos o moleculares que pudieran distinguir claramente las especies de este filo de todas las demás bacterias. Se descubrieron más de 60 CSI que eran específicos para todo el filo Thermotogota o sus diferentes subgrupos. De estos, 18 CSI están presentes de forma única en varias especies de Thermotogota y proporcionan marcadores moleculares para el filo. Además, había muchos CSI que eran específicos para varios subgrupos de Thermotogota. Otros 12 CSI eran específicos para un clado que consta de varias especies de Thermotogota excepto Tt. Lettingae. Mientras que 14 CSI eran específicos para un clado que consta de los géneros Fervidobacterium y Thermosipho y 18 CSI eran específicos para el género Thermosiphon . [ cita requerida ]

Por último, se informaron 16 CSI que fueron compartidos por algunas o todas las especies de Thermotogota o algunas especies de otros taxones como Archaea , Aquificota , Bacillota , Pseudomonadota , Deinococcota , Fusobacteriota , Dictyoglomota , Chloroflexota y eucariotas . La presencia compartida de algunos de estos CSI podría deberse a la transferencia lateral de genes (LGT) entre estos grupos. Sin embargo, el número de CSI que se comparten comúnmente con otros taxones es mucho menor que los que son específicos de Thermotogota y no exhiben ningún patrón específico. Por lo tanto, no tienen un efecto significativo en la distinción de Thermotogota. [8]

Arqueas

Recientemente, los Thermoproteota mesófilos se han incluido en un nuevo filo de arqueas llamado Nitrososphaerota (anteriormente Thaumarchaeota). Sin embargo, hay muy pocos marcadores moleculares que puedan distinguir a este grupo de arqueas del filo Thermoproteota (anteriormente Crenarchaeota). Se realizó un estudio filogenético detallado utilizando el enfoque CSI para distinguir estos filos en términos moleculares. Se encontraron 6 CSI de forma única en varios Nitrososphaerota, a saber, Cenarchaeum symbiosum , Nitrosopumilus maritimus y varios Thermoproteota marinos no cultivados. Se encontraron 3 CSI que eran comúnmente compartidos entre especies pertenecientes a Nitrososphaerota y Thermoproteota. Además, se encontraron varios CSI que son específicos para diferentes órdenes de Thermoproteota: 3 CSI para Sulfolobales , 5 CSI para Thermoproteales y, por último, 2 CSI comunes para Sulfolobales y Desulfurococcales . Las firmas descritas proporcionan nuevos medios para distinguir Thermoproteota y Nitrososphaerota, además podrían utilizarse como una herramienta para la clasificación e identificación de especies relacionadas. [17]

Pasteurellas

Los miembros del orden Pasteurellales se distinguen actualmente principalmente en función de su posición en la ramificación del árbol 16srRNA. Actualmente se conocen muy pocos marcadores moleculares que puedan distinguir a los miembros de este orden de otras bacterias. Recientemente se utilizó un enfoque CSI para dilucidar las relaciones filogenéticas entre las especies de este orden; se descubrieron más de 40 CSI que eran compartidos de forma única por todas o la mayoría de las especies. Dentro de este Pasteurellales se forman dos clados principales: el clado I, que abarca Aggregatibacter , Pasteurella , Actinobacillus succinogenes , Mannheimia succiniciproducens , Haemophilus influenzae y Haemophilus somnus , fue respaldado por 13 CSI. El clado II, que abarca Actinobacillus pleuropneumoniae , Actinobacillus minor , Haemophilus ducreyi , Mannheimia haemolytica y Haemophilus parasuis , fue respaldado por 9 CSI. Con base en estos resultados, se propuso dividir Pasteurellales de su familia actual en dos familias diferentes. Además, las firmas descritas proporcionarían nuevos medios para identificar especies de Pasteurellales no descubiertas. [18]

Gammaproteobacteria

La clase Gammaproteobacteria forma uno de los grupos más grandes de bacterias. Actualmente se distingue de otras bacterias únicamente por árboles filogenéticos basados ​​en ARNr 16s . No se conocen características moleculares exclusivas de la clase o sus diferentes subgrupos. Se realizó un estudio detallado basado en CSI para comprender mejor la filogenia de esta clase. En primer lugar, se creó un árbol filogenético basado en secuencias concatenadas de varias proteínas distribuidas universalmente. El orden de ramificación de los diferentes órdenes de la clase Gammaproteobacteria (desde el más reciente hasta el más temprano en divergencia) fue: Enterobacteriales > Pasteurellales > Vibrionales , Aeromonadales > Alteromonadales > Oceanospirillales , Pseudomonadales > Chromatiales, Legionellales , Methylococcales , Xanthomonadales , Cardiobacteriales , Thiotrichales . Además, se descubrieron 4 CSI que eran exclusivos de la mayoría de las especies de la clase Gammaproteobacteria. Una deleción de 2 aa en la transformilasa AICAR fue compartida de forma única por todas las gammaproteobacterias excepto por Francisella tularensis . Una deleción de 4 aa en la subunidad b de la ARN polimerasa y una deleción de 1 aa en la proteína ribosomal L16 se encontraron de forma única en varias especies pertenecientes a los órdenes Enterobacteriales, Pasteurellales, Vibrionales, Aeromonadales y Alteromonadales, pero no se encontraron en otras gammaproteobacterias. Por último, una deleción de 2 aa en la leucil-ARNt sintetasa estuvo presente comúnmente en los órdenes anteriores de la clase Gammaproteobacteria y en algunos miembros del orden Oceanospirillales. [19] Otro estudio basado en CSI también ha identificado 4 CSI que son exclusivos del orden Xanthomonadales. En conjunto, estos dos hechos muestran que Xanthomonadales es un grupo monofilético ancestral de otras Gammaproteobacteria, lo que demuestra además que Xanthomonadales es una subdivisión independiente y constituye uno de los linajes de ramificación más profunda dentro del clado Gammaproteobacteria. [4] [19]

Véase también

Referencias

  1. ^ abc Baldauf, SL (1993). "Los animales y los hongos son parientes más cercanos entre sí: evidencia congruente a partir de múltiples proteínas". Actas de la Academia Nacional de Ciencias . 90 (24): 11558–11562. Bibcode :1993PNAS...9011558B. doi : 10.1073/pnas.90.24.11558 . PMC  48023 . PMID  8265589.
  2. ^ abcdefgh Gupta, Radhey S. (1998). "Filogenias de proteínas y secuencias distintivas: una reevaluación de las relaciones evolutivas entre arqueobacterias, eubacterias y eucariotas". Microbiology and Molecular Biology Reviews . 62 (4): 1435–91. doi :10.1128/MMBR.62.4.1435-1491.1998. PMC 98952 . PMID  9841678. 
  3. ^ abc Gupta, Radhey S.; Griffiths, Emma (2002). "Cuestiones críticas en la filogenia bacteriana". Biología de poblaciones teórica . 61 (4): 423–34. doi :10.1006/tpbi.2002.1589. PMID  12167362.
  4. ^ ab Cutiño-Jiménez, Ania M.; Martins-Pinheiro, Marinalva; Lima, Wanessa C.; Martín-Tornet, Alexander; Morales, Osleidys G.; Menck, Carlos FM (2010). "Ubicación evolutiva de Xanthomonadales basada en secuencias conservadas de firmas proteicas". Filogenética molecular y evolución . 54 (2): 524–34. doi : 10.1016/j.ympev.2009.09.026 . PMID  19786109.
  5. ^ ab Rokas, Antonis; Holland, Peter WH (2000). "Cambios genómicos raros como herramienta para la filogenética". Tendencias en ecología y evolución . 15 (11): 454–459. doi :10.1016/S0169-5347(00)01967-4. PMID  11050348.
  6. ^ Gupta, Radhey S.; Kanter-Eivin, David A. (9 de mayo de 2023). "Servidor AppIndels.com: una herramienta basada en la web para la identificación de indeles de firmas conservadas específicas de taxones conocidos en secuencias del genoma. Validación de su utilidad mediante la predicción de la afiliación taxonómica de >700 cepas no clasificadas de especies de Bacillus". Revista internacional de microbiología sistemática y evolutiva . 73 (5). doi :10.1099/ijsem.0.005844.
  7. ^ ab Gupta, Radhey. "Inserciones y deleciones conservadas en secuencias de proteínas". Filogenia bacteriana . Laboratorio Gupta. Archivado desde el original el 15 de septiembre de 2011. Consultado el 2 de abril de 2012 .{{cite web}}: CS1 maint: bot: estado de URL original desconocido ( enlace )
  8. ^ abc Gupta, Radhey S.; Bhandari, Vaibhav (2011). "Filogenia y firmas moleculares para el filo Thermotogae y sus subgrupos". Antonie van Leeuwenhoek . 100 (1): 1–34. doi :10.1007/s10482-011-9576-z. PMID  21503713. S2CID  24995263.
  9. ^ Griffiths, E.; Gupta, RS (2007). "La filogenia y las inserciones conservadas compartidas en proteínas proporcionan evidencia de que Verrucomicrobia son los parientes de vida libre más cercanos conocidos de las clamidias". Microbiología . 153 (8): 2648–54. doi : 10.1099/mic.0.2007/009118-0 . PMID  17660429.
  10. ^ Gupta, Radhey S. (2003). "Relaciones evolutivas entre bacterias fotosintéticas". Photosynthesis Research . 76 (1–3): 173–83. doi :10.1023/A:1024999314839. PMID  16228576. S2CID  38460308.
  11. ^ Griffiths, Emma; Gupta, Radhey S. (2004). "Las secuencias distintivas en diversas proteínas proporcionan evidencia de la divergencia tardía del orden Aquificales" (PDF) . Microbiología internacional . 7 (1): 41–52. PMID  15179606.
  12. ^ Brown, James R.; Douady, Christophe J.; Italia, Michael J.; Marshall, William E.; Stanhope, Michael J. (2001). "Árboles universales basados ​​en grandes conjuntos de datos de secuencias de proteínas combinadas". Nature Genetics . 28 (3): 281–5. doi :10.1038/90129. PMID  11431701. S2CID  8516570.
  13. ^ Cavalier-Smith, T (2002). "El origen neomurano de las arqueobacterias, la raíz negibacteriana del árbol universal y la megaclasificación bacteriana". Revista internacional de microbiología sistemática y evolutiva . 52 (1): 7–76. doi : 10.1099/00207713-52-1-7 . PMID  11837318.
  14. ^ Ciccarelli, FD; Doerks, T; Von Mering, C; Creevey, CJ; Snel, B; Bork, P (2006). "Hacia la reconstrucción automática de un árbol de la vida altamente resuelto". Science . 311 (5765): 1283–7. Bibcode :2006Sci...311.1283C. CiteSeerX 10.1.1.381.9514 . doi :10.1126/science.1123061. PMID  16513982. S2CID  1615592. 
  15. ^ Daubin, V.; Gouy, M; Perrière, G (2002). "Un enfoque filogenómico de la filogenia bacteriana: evidencia de un núcleo de genes que comparten una historia común". Genome Research . 12 (7): 1080–90. doi :10.1101/gr.187002. PMC 186629 . PMID  12097345. 
  16. ^ Eisen, Jonathan A. (1995). "La proteína RecA como molécula modelo para estudios sistemáticos moleculares de bacterias: comparación de árboles de RecA y ARNr 16S de la misma especie". Journal of Molecular Evolution . 41 (6): 1105–23. Bibcode :1995JMolE..41.1105E. doi :10.1007/bf00173192. PMC 3188426 . PMID  8587109. 
  17. ^ Gupta, Radhey S.; Shami, Ali (2010). "Firmas moleculares de Crenarchaeota y Thaumarchaeota". Antonie van Leeuwenhoek . 99 (2): 133–57. doi :10.1007/s10482-010-9488-3. PMID  20711675. S2CID  12874800.
  18. ^ Naushad, Hafiz Sohail; Gupta, Radhey S. (2011). "Firmas moleculares (indels conservados) en secuencias de proteínas que son específicas para el orden Pasteurellales y distinguen dos de sus clados principales". Antonie van Leeuwenhoek . 101 (1): 105–24. doi :10.1007/s10482-011-9628-4. PMID  21830122. S2CID  15114511.
  19. ^ ab Gao, B.; Mohan, R.; Gupta, RS (2009). "Filogenómica y firmas proteicas que dilucidan las relaciones evolutivas entre las Gammaproteobacteria". Revista internacional de microbiología sistemática y evolutiva . 59 (2): 234–47. doi : 10.1099/ijs.0.002741-0 . PMID  19196760.