stringtranslate.com

Pan-genoma

Análisis pangenomático de genomas de Streptococcus agalactiae realizado con el software Anvi'o [1] cuyo desarrollo está liderado por A. Murat Eren . Genomas obtenidos de Tettelin et al. (2005). [2] Cada círculo corresponde a un genoma y cada radio representa una familia de genes. En la parte inferior y a la derecha se localizan las familias del genoma core. Algunas familias en el core pueden tener más de un gen homólogo por genoma. En el medio, a la izquierda de la figura se observa el genoma shell. En la parte superior izquierda se muestran familias del genoma prescindible y singletons.

En los campos de la biología molecular y la genética , un pangenoma ( pangenoma o supragenoma ) es el conjunto completo de genes de todas las cepas dentro de un clado . De manera más general, es la unión de todos los genomas de un clado. [2] [3] [4] [5] El pangenoma se puede dividir en un "pangenoma central" que contiene genes presentes en todos los individuos, un "pangenoma de caparazón" que contiene genes presentes en dos o más cepas y un "pangenoma de nube" que contiene genes que solo se encuentran en una sola cepa. [3] [4] [6] Algunos autores también se refieren al genoma de nube como "genoma accesorio" que contiene genes "prescindibles" presentes en un subconjunto de las cepas y genes específicos de la cepa. [2] [3] [4] Nótese que el uso del término "prescindible" ha sido cuestionado, al menos en los genomas de plantas, ya que los genes accesorios juegan "un papel importante en la evolución del genoma y en la compleja interacción entre el genoma y el medio ambiente". [5] El campo de estudio de los pangenomas se llama pangenómica. [2]

El repertorio genético de una especie bacteriana es mucho mayor que el contenido genético de una cepa individual. [7] Algunas especies tienen pangenomas abiertos (o extensos), mientras que otras tienen pangenomas cerrados. [2] En el caso de las especies con un pangenoma cerrado, se añaden muy pocos genes por genoma secuenciado (después de secuenciar muchas cepas), y el tamaño del pangenoma completo se puede predecir teóricamente. Las especies con un pangenoma abierto tienen suficientes genes añadidos por genoma secuenciado adicional como para que predecir el tamaño del pangenoma completo sea imposible. [4] Se ha sugerido que el tamaño de la población y la versatilidad del nicho son los factores más influyentes para determinar el tamaño del pangenoma. [2]

Los pangenomas se construyeron originalmente para especies de bacterias y arqueas , pero más recientemente se han desarrollado pangenomas eucariotas , particularmente para especies de plantas . Los estudios de plantas han demostrado que la dinámica del pangenoma está vinculada a elementos transponibles. [8] [9] [10] [11] La importancia del pangenoma surge en un contexto evolutivo, especialmente con relevancia para la metagenómica , [12] pero también se utiliza en un contexto genómico más amplio. [13] Un libro de acceso abierto que revisa el concepto de pangenoma y sus implicaciones, editado por Tettelin y Medini, se publicó en la primavera de 2020. [14]

Etimología

El término "pangenoma" fue definido con su significado actual por Tettelin et al. en 2005; [2] deriva "pan" de la palabra griega παν, que significa "todo" o "todo", mientras que el término genoma es un término comúnmente utilizado para describir el material genético completo de un organismo. Tettelin et al. aplicaron el término específicamente a las bacterias , cuyo pangenoma "incluye un genoma central que contiene genes presentes en todas las cepas y un genoma prescindible compuesto por genes ausentes de una o más cepas y genes que son únicos para cada cepa". [2]

Partes del pangenoma

En el pangenoma, podemos identificar tres conjuntos de genes: genoma central, genoma de concha y genoma de nube. El genoma central comprende los genes que están presentes en todos los genomas analizados. Para evitar descartar familias debido a artefactos de secuenciación, algunos autores consideran el genoma blando (>95% de ocurrencia). El genoma de concha consiste en los genes compartidos por la mayoría de los genomas (10-95% de ocurrencia). Las familias de genes presentes en un solo genoma o <10% de ocurrencia se describen como genoma prescindible o genoma de nube.

Centro

Es la parte del pangenoma que comparten todos los genomas del conjunto analizado. Algunos autores han dividido el pangenoma central en núcleo duro, aquellas familias de genes homólogos que tienen al menos una copia de la familia compartida por todos los genomas (100% de los genomas) y el núcleo blando o núcleo extendido [15] , aquellas familias distribuidas por encima de un cierto umbral (90%). En un estudio que involucra los pangenomas de Bacillus cereus y Staphylococcus aureus , algunos de ellos aislados de la estación espacial internacional, los umbrales utilizados para segmentar los pangenomas fueron los siguientes: "Cloud", "Shell" y "Core" correspondientes a familias de genes con presencia en <10%, 10–95% y >95% de los genomas, respectivamente. [16]

El tamaño del genoma central y su proporción con respecto al pangenoma dependen de varios factores, pero dependen especialmente de la similitud filogenética de los genomas considerados. Por ejemplo, el núcleo de dos genomas idénticos también sería el pangenoma completo. El núcleo de un género siempre será más pequeño que el genoma central de una especie. Los genes que pertenecen al genoma central suelen estar relacionados con funciones de mantenimiento del hogar y el metabolismo primario del linaje; sin embargo, el gen central también puede contener algunos genes que diferencian a la especie de otras especies del género, es decir, que pueden estar relacionados con la patogenicidad y la adaptación al nicho. [17]

Caparazón

Es la parte del pangenoma compartida por la mayoría de los genomas en un pangenoma. [18] No existe un umbral universalmente aceptado para definir el genoma shell, algunos autores consideran una familia de genes como parte del pangenoma shell si es compartida por más del 50% de los genomas en el pangenoma. [19] Una familia puede ser parte del shell por varias dinámicas evolutivas, por ejemplo por pérdida de genes en un linaje donde anteriormente era parte del genoma core, tal es el caso de las enzimas en el operón triptófano en Actinomyces , [20] o por ganancia de genes y fijación de una familia de genes que anteriormente era parte del genoma prescindible tal es el caso del gen trpF en varias especies de Corynebacterium . [21]

Nube

El genoma en nube está formado por aquellas familias de genes compartidas por un subconjunto mínimo de los genomas del pangenoma, [22] incluye genes únicos o presentes en solo uno de los genomas. También se lo conoce como genoma periférico o genoma accesorio. Las familias de genes de esta categoría suelen estar relacionadas con la adaptación ecológica. [ cita requerida ]

Clasificación

a) Los pangenomas cerrados se caracterizan por tener genomas centrales grandes y genomas accesorios pequeños. b) Los pangenomas abiertos tienden a tener genomas centrales pequeños y genomas accesorios grandes. c) El tamaño de los pangenomas abiertos tiende a aumentar con cada genoma agregado, mientras que el tamaño de los pangenomas cerrados tiende a ser asintótico a pesar de agregar más genomas. Debido a esta característica, se puede predecir el tamaño completo de los pangenomas cerrados.

El pangenoma se puede clasificar de forma algo arbitraria como abierto o cerrado según el valor alfa de la ley de Heaps : [23] [15]

Si entonces el pangenoma se considera abierto.si entonces el pangenoma se considera cerrado.

Generalmente, el software pangenome puede calcular los parámetros de la ley Heap que mejor describen el comportamiento de los datos.

Pangenoma abierto

Un pangenoma abierto se produce cuando el número de nuevas familias de genes en un linaje taxonómico sigue aumentando sin parecer asintótico, independientemente de cuántos genomas nuevos se agreguen al pangenoma. Escherichia coli es un ejemplo de una especie con un pangenoma abierto. Cualquier tamaño de genoma de E. coli está en el rango de 4000 a 5000 genes y el tamaño del pangenoma estimado para esta especie con aproximadamente 2000 genomas está compuesto por 89 000 familias de genes diferentes. [24] El pangenoma del dominio bacteria también se considera abierto.

Pangenoma cerrado

Un pangenoma cerrado se produce en un linaje cuando sólo se añaden unas pocas familias de genes cuando se incorporan nuevos genomas al análisis del pangenoma, y ​​la cantidad total de familias de genes en el pangenoma parece ser asintótica a un número. Se cree que el parasitismo y las especies que son especialistas en algún nicho ecológico tienden a tener pangenomas cerrados. Staphylococcus lugdunensis es un ejemplo de bacteria comensal con pangenoma cerrado. [25]

Historia

Pangenoma

El concepto original de pangenoma fue desarrollado por Tettelin et al. [2] cuando analizaron los genomas de ocho aislamientos de Streptococcus agalactiae , donde describieron un genoma central compartido por todos los aislamientos, que representa aproximadamente el 80% de cualquier genoma individual, más un genoma prescindible que consiste en genes parcialmente compartidos y específicos de la cepa. La extrapolación sugirió que el reservorio de genes en el pangenoma de S. agalactiae es vasto y que se seguirían identificando nuevos genes únicos incluso después de secuenciar cientos de genomas. [2] El pangenoma comprende la totalidad de los genes descubiertos en los genomas secuenciados de una especie microbiana dada y puede cambiar cuando se secuencian nuevos genomas y se incorporan al análisis. [ cita requerida ]

El supergenoma se define como el conjunto de genes accesibles para una especie determinada, el pangenoma si se dispone de la secuenciación de todos los genomas de una especie. El metapangenoma es el análisis del pangenoma aplicado a muestras metagenómicas, donde se evalúa la unión de genes de varias especies para un hábitat determinado.

El pangenoma de un linaje genómico explica la variabilidad del contenido genético intralinaje. El pangenoma evoluciona debido a: la duplicación de genes, la dinámica de ganancia y pérdida de genes y la interacción del genoma con elementos móviles que se moldean por selección y deriva. [26] Algunos estudios señalan que los pangenomas de los procariotas son el resultado de una evolución adaptativa, no neutral , que confiere a las especies la capacidad de migrar a nuevos nichos. [27]

Supergenoma

El supergenoma puede considerarse como el tamaño real del pangenoma si se secuenciaran todos los genomas de una especie. [28] Se define como todos los genes accesibles para ser adquiridos por una determinada especie. No se puede calcular directamente, pero su tamaño se puede estimar mediante el tamaño del pangenoma calculado a partir de los datos genómicos disponibles. Estimar el tamaño del genoma en nube puede ser problemático debido a su dependencia de la aparición de genes y genomas raros. En 2011, se propuso la fluidez genómica como una medida para categorizar la similitud a nivel genético entre grupos de aislados secuenciados. [29] En algunos linajes, los supergenomas parecían infinitos , [30] como es el caso del dominio Bacteria. [31]

Metapangenoma

El 'metapangenoma' se ha definido como el resultado del análisis de pangenomas en conjunto con el medio ambiente, donde la abundancia y prevalencia de grupos de genes y genomas se recuperan a través de metagenomas de escopeta. [32] La combinación de metagenomas con pangenomas, también denominada "metapangenómica", revela los resultados a nivel de población del filtrado específico del hábitat del acervo genético pangenómico. [33]

Otros autores consideran que la metapangenómica expande el concepto de pangenoma al incorporar secuencias de genes obtenidas de microorganismos no cultivados mediante un enfoque metagenómico . Un metapangenoma comprende tanto secuencias de genomas ensamblados por metagenoma ( MAG ) como de genomas obtenidos de microorganismos cultivados. [34] La metapangenómica se ha aplicado para evaluar la diversidad de una comunidad, la adaptación al nicho microbiano, la evolución microbiana, las actividades funcionales y las redes de interacción de la comunidad. [35] La plataforma Anvi'o desarrolló un flujo de trabajo que integra el análisis y la visualización de metapangenomas mediante la generación de pangenomas y su estudio junto con los metagenomas. [32]

Ejemplos

Pangenoma procariota

El pangenoma de S. pneumoniae . (a) Número de genes nuevos en función del número de genomas secuenciados. El número previsto de genes nuevos cae bruscamente a cero cuando el número de genomas supera los 50. (b) Número de genes centrales en función del número de genomas secuenciados. El número de genes centrales converge a 1.647 para un número de genomas n→∞. De Donati et al. [36]

En 2018, el 87% de las secuencias de genoma completo disponibles eran bacterias, lo que alimentó el interés de los investigadores en calcular pangenomas procariotas en diferentes niveles taxonómicos. [22] En 2015, el pangenoma de 44 cepas de la bacteria Streptococcus pneumoniae muestra pocos genes nuevos descubiertos con cada nuevo genoma secuenciado (ver figura). De hecho, el número previsto de genes nuevos cayó a cero cuando el número de genomas supera los 50 (tenga en cuenta, sin embargo, que este no es un patrón que se encuentre en todas las especies). Esto significaría que S. pneumoniae tiene un "pangenoma cerrado". [37] La ​​principal fuente de genes nuevos en S. pneumoniae fue Streptococcus mitis desde el cual se transfirieron genes horizontalmente . El tamaño del pangenoma de S. pneumoniae aumentó logarítmicamente con el número de cepas y linealmente con el número de sitios polimórficos de los genomas muestreados, lo que sugiere que los genes adquiridos se acumulan proporcionalmente a la edad de los clones. [36] Otro ejemplo de pangenoma procariota es Prochlorococcus , el conjunto de genoma central es mucho más pequeño que el pangenoma, que es utilizado por diferentes ecotipos de Prochlorococcus . [38] Se ha observado un pangenoma abierto en aislados ambientales como Alcaligenes sp. [39] y Serratia sp., [40] mostrando un estilo de vida simpátrico. Sin embargo, el pangenoma abierto no es exclusivo de los microorganismos de vida libre, un estudio de 2015 sobre la bacteria Prevotella aislada de humanos , comparó los repertorios de genes de sus especies derivadas de diferentes sitios corporales de humanos. También informó un pangenoma abierto que muestra una gran diversidad de acervo genético. [41]

Las arqueas también tienen algunos estudios pangenómicos. El pangenoma de Halobacteria muestra las siguientes familias de genes en los subconjuntos del pangenoma: núcleo (300), componentes variables (Softcore: 998, Cloud:36531, Shell:11784). [42]

Pangenoma eucariota

Los organismos eucariotas como hongos , animales y plantas también han mostrado evidencia de pangenomas. En cuatro especies de hongos cuyo pangenoma ha sido estudiado, entre el 80 y el 90% de los modelos genéticos se encontraron como genes centrales. Los genes accesorios restantes estuvieron involucrados principalmente en la patogénesis y la resistencia antimicrobiana. [43]

En los animales, se está estudiando el pangenoma humano. En 2010, un estudio estimó que un pangenoma humano completo contendría entre 19 y 40 megabases de secuencias nuevas que no están presentes en el genoma humano de referencia existente . [44] El consorcio del Pangenoma Humano tiene como objetivo reconocer la diversidad del genoma humano. En 2023, se publicó un borrador de referencia del pangenoma humano. [45] Se basa en 47 genomas diploides de personas de diversas etnias. [45] Hay planes en marcha para una referencia mejorada que capture aún más biodiversidad a partir de una muestra aún más amplia. [45]

Entre las plantas, hay ejemplos de estudios de pangenomas en especies modelo, tanto diploides [9] como poliploides [10] , y una lista creciente de cultivos. [46] [47] Los pangenomas han demostrado ser prometedores como una herramienta en el mejoramiento de plantas al tener en cuenta las variantes estructurales y los SNP en genomas que no son de referencia, lo que ayuda a resolver el problema de la falta de heredabilidad que persiste en los estudios de asociación de todo el genoma . [48] Un concepto emergente basado en plantas es el de pan-NLRome, que es el repertorio de proteínas de repetición ricas en leucina (NLR) que se unen a nucleótidos, receptores inmunes intracelulares que reconocen proteínas patógenas y confieren resistencia a las enfermedades. [49]

Pangenoma viral

Los virus no necesariamente tienen genes ampliamente compartidos por clados, como es el caso del 16S en bacterias , y por lo tanto el genoma central del dominio viral completo está vacío. Sin embargo, varios estudios han calculado el pangenoma de algunos linajes virales. El genoma central de seis especies de pandoravirus comprende 352 familias de genes, solo el 4,7% del pangenoma, lo que resulta en un pangenoma abierto. [50]

Estructuras de datos

El número de genomas secuenciados crece continuamente, "la simple ampliación de los procesos de bioinformática establecidos no será suficiente para aprovechar todo el potencial de conjuntos de datos genómicos tan ricos". [51] Los gráficos de pangenomas son estructuras de datos emergentes diseñadas para representar pangenomas y mapear lecturas de manera eficiente a ellos. Han sido revisados ​​por Eizenga et al. [52]

Herramientas de software

Análisis pangenomático de genomas de Streptococcus agalactiae . [2] Ejemplo de filogenias realizadas con el software BPGA. Este software nos permite generar filogenias basadas en la agrupación del genoma central o pangenoma. Las reconstrucciones filogenéticas centrales y pan no necesariamente coinciden.

A medida que aumentó el interés en los pangenomas, se han desarrollado varias herramientas de software para ayudar a analizar este tipo de datos. Para comenzar un análisis pangenómico, el primer paso es la homogeneización de la anotación del genoma. [23] Se debe utilizar el mismo software para anotar todos los genomas utilizados, como GeneMark [53] o RAST. [54] En 2015, un grupo revisó los diferentes tipos de análisis y herramientas que un investigador puede tener disponibles. [55] Hay siete tipos de software desarrollados para analizar pangenomas: aquellos dedicados a agrupar genes homólogos; identificar SNP ; trazar perfiles pangenómicos; construir relaciones filogenéticas de genes ortólogos/familias de cepas/aislamientos; búsqueda basada en funciones; anotación y/o curación; y visualización. [55]

Las dos herramientas de software más citadas para el análisis pangenómico a finales de 2014 [55] fueron Panseq [56] y el pan-genomes analysis pipeline (PGAP). [57] Otras opciones incluyen BPGA – A Pan-Genome Analysis Pipeline para genomas procariotas, [58] GET_HOMOLOGUES, [59] Roary. [60] y PanDelos. [61] En 2015 se publicó una revisión centrada en pangenomas procariotas [62] y otra para pangenomas de plantas. [63] Entre los primeros paquetes de software diseñados para pangenomas de plantas se encontraban PanTools. [64] y GET_HOMOLOGUES-EST. [11] [59] En 2018 se lanzó panX, una herramienta web interactiva que permite la inspección de la historia evolutiva de las familias de genes. [65] panX puede mostrar una alineación de genomas, un árbol filogenético, mapeo de mutaciones e inferencia sobre la ganancia y pérdida de la familia en la filogenia del genoma central. En 2019, OrthoVenn 2.0 [66] permitió la visualización comparativa de familias de genes homólogos en diagramas de Venn de hasta 12 genomas. En 2023, se desarrolló BRIDGEcereal para examinar y graficar haplotipos basados ​​en indel de pan-genoma a través de un identificador de modelo genético. [67]

Gráfica de pangenoma de 3 117 genomas de Acinetobacter baumannii. Los bordes corresponden a la colocalización genómica y los nodos corresponden a los genes. El grosor de los bordes es proporcional al número de genomas que comparten ese vínculo. Los bordes entre los nodos persistentes (similares a los genes centrales), de la capa y de la nube están coloreados en naranja, verde y azul, respectivamente.
Gráfico de pangenoma de 3 117 genomas de Acinetobacter baumannii generado con el software PPanGGOLiN. Los bordes corresponden a la colocalización genómica y los nodos corresponden a los genes. El grosor de los bordes es proporcional al número de genomas que comparten ese vínculo. Los bordes entre los nodos persistentes (similares a los genes centrales), de la capa y de la nube están coloreados en naranja, verde y azul, respectivamente.

En 2020, Anvi'o [1] estuvo disponible como una plataforma multiómica que contiene análisis pangenómicos y metapangenómicos, así como flujos de trabajo de visualización. En Anvi'o, los genomas se muestran en círculos concéntricos y cada radio representa una familia de genes, lo que permite la comparación de más de 100 genomas en su visualización interactiva. En 2020, se lanzó una comparación computacional de herramientas para extraer contenido pangenómico basado en genes (como GET_HOMOLOGUES, PanDelos, Roary y otros). [68] Las herramientas se compararon desde una perspectiva metodológica, analizando las causas que llevan a una metodología determinada a superar a otras herramientas. El análisis se realizó teniendo en cuenta diferentes poblaciones bacterianas, que se generan sintéticamente al cambiar los parámetros evolutivos. Los resultados muestran una diferenciación del rendimiento de cada herramienta que depende de la composición de los genomas de entrada. Nuevamente en 2020, varias herramientas introdujeron una representación gráfica de los pangenomas que muestra la contigüidad de los genes (PPanGGOLiN, [46] Panaroo [65] ). Otras herramientas de software para pangenómica incluyen Prodigal, Prokka, PanVis, PanTools, Pangenome Graph Builder (PGGB), PanX, Pagoo y pgr-tk. [69]

Ejemplo de posibles resultados del software BPGA. Análisis pangenomático de genomas de Streptococcus agalactiae . A la izquierda, se muestra la distribución de los términos Go por genoma central/dispensable/único. En este ejemplo, la categoría de replicación, recombinación y reparación se enriquece en familias de genes únicos. A la derecha, se muestra un gráfico pan/core típico, cuando se han añadido más genomas, el tamaño del core disminuye y, por el contrario, el tamaño del pangenoma aumenta. [2]

Véase también

Referencias

  1. ^ ab Eren AM, Kiefl E, Shaiber A, Veseli I, Miller SE, Schechter MS, et al. (enero de 2021). "Multiómica integrada, reproducible y liderada por la comunidad con anvi'o". Nature Microbiology . 6 (1): 3–6. doi :10.1038/s41564-020-00834-3. PMC  8116326 . PMID  33349678.
  2. ^ abcdefghijkl Tettelin H, Masignani V, Cieslewicz MJ, Donati C, Medini D, Ward NL, Angiuoli SV, Crabtree J, Jones AL, Durkin AS, DeBoy RT (27 de septiembre de 2005). "Análisis genómico de múltiples aislamientos patógenos de Streptococcus agalactiae: implicaciones para el "pangenoma" microbiano". Actas de la Academia Nacional de Ciencias . 102 (39): 13950–13955. Bibcode :2005PNAS..10213950T. doi : 10.1073/pnas.0506758102 . ISSN  0027-8424. PMC 1216834 . PMID  16172379. 
  3. ^ abc Medini D, Donati C, Tettelin H, Masignani V, Rappuoli R (diciembre de 2005). "El pangenoma microbiano". Opinión actual en genética y desarrollo . 15 (6): 589–94. doi :10.1016/j.gde.2005.09.006. PMID  16185861.
  4. ^ abcd Vernikos G, Medini D, Riley DR, Tettelin H (febrero de 2015). "Diez años de análisis pangenómicos". Current Opinion in Microbiology . 23 : 148–54. doi :10.1016/j.mib.2014.11.016. PMID  25483351.
  5. ^ ab Marroni F, Pinosio S, Morgante M (abril de 2014). "Variación estructural y complejidad del genoma: ¿es realmente prescindible lo prescindible?". Current Opinion in Plant Biology . 18 : 31–36. Bibcode :2014COPB...18...31M. doi :10.1016/j.pbi.2014.01.003. PMID  24548794.
  6. ^ Wolf YI, Makarova KS, Yutin N, Koonin EV (diciembre de 2012). "Agrupamientos actualizados de genes ortólogos para Archaea: un ancestro complejo de Archaea y las vías de la transferencia horizontal de genes". Biology Direct . 7 : 46. doi : 10.1186/1745-6150-7-46 . PMC 3534625 . PMID  23241446. 
  7. ^ Mira A, Martín-Cuadrado AB, D'Auria G, Rodríguez-Valera F (2010). "El pangenoma bacteriano: un nuevo paradigma en microbiología". Int Microbiol . 13 (2): 45–57. doi :10.2436/20.1501.01.110. PMID  20890839.
  8. ^ Morgante M, De Paoli E, Radovic S (abril de 2007). "Elementos transponibles y pangenomas de plantas". Current Opinion in Plant Biology . 10 (2): 149–55. Bibcode :2007COPB...10..149M. doi :10.1016/j.pbi.2007.02.001. PMID  17300983.
  9. ^ ab Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S, et al. (diciembre de 2017). "La amplia variación del contenido genético en el pangenoma de Brachypodium distachyon se correlaciona con la estructura de la población". Nature Communications . 8 (1): 2184. Bibcode :2017NatCo...8.2184G. doi :10.1038/s41467-017-02292-8. PMC 5736591 . PMID  29259172. 
  10. ^ ab Gordon SP, Contreras-Moreira B, Levy JH, Djamei A, Czedik-Eysenberg A, Tartaglio VS, et al. (julio de 2020). "Evolución gradual del genoma poliploide revelada por análisis pangenómico de Brachypodium hybridum y sus progenitores diploides". Nature Communications . 11 (1): 3670. Bibcode :2020NatCo..11.3670G. doi : 10.1038/s41467-020-17302-5 . PMC 7391716 . PMID  32728126. 
  11. ^ ab Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, et al. (febrero de 2017). "Análisis de pangenomas y transcriptomas de plantas con GET_HOMOLOGUES-EST, una solución de agrupamiento para secuencias de la misma especie". Frontiers in Plant Science . 8 : 184. doi : 10.3389/fpls.2017.00184 . PMC 5306281 . PMID  28261241. 
  12. ^ Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (mayo de 2009). "Biogeografía del pangenoma de Sulfolobus islandicus". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (21): 8605–10. Bibcode :2009PNAS..106.8605R. doi : 10.1073/pnas.0808945106 . PMC 2689034 . PMID  19435847. 
  13. ^ Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (febrero de 2009). "Ensamblaje de novo utilizando datos de secuencias de lectura corta de baja cobertura del patógeno del arroz Pseudomonas syringae pv. oryzae". Genome Research . 19 (2): 294–305. doi :10.1101/gr.083311.108. PMC 2652211 . PMID  19015323. 
  14. ^ Tettelin H, Medini D (2020). Tettelin H, Medini D (eds.). El pangenoma (PDF) . doi :10.1007/978-3-030-38281-0. ISBN 978-3-030-38280-3. Número de identificación personal  32633908. Número de identificación personal  217167361.
  15. ^ ab Halachev MR, Loman NJ, Pallen MJ (2011). "Cálculo de ortólogos en bacterias y arqueas: un enfoque de divide y vencerás". PLOS ONE . ​​6 (12): e28388. Bibcode :2011PLoSO...628388H. doi : 10.1371/journal.pone.0028388 . PMC 3236195 . PMID  22174796. 
  16. ^ Blaustein RA, McFarland AG, Ben Maamar S, Lopez A, Castro-Wallace S, Hartmann EM (2019). "Enfoque pangenómico para comprender las adaptaciones microbianas dentro de un entorno construido modelo, la Estación Espacial Internacional, en relación con los huéspedes humanos y el suelo". mSystems . 4 (1): e00281-18. doi :10.1128/mSystems.00281-18. PMC 6325168 . PMID  30637341. 
  17. ^ Mosquera-Rendón J, Rada-Bravo AM, Cárdenas-Brito S, Corredor M, Restrepo-Pineda E, Benítez-Páez A (enero de 2016). "Análisis de evolución molecular y de todo el pangenoma de la especie Pseudomonas aeruginosa". Genómica BMC . 17 (45): 45. doi : 10.1186/s12864-016-2364-4 . PMC 4710005 . PMID  26754847. 
  18. ^ Snipen L, Ussery DW (enero de 2010). "Procedimiento operativo estándar para calcular árboles pangenómicos". Estándares en Ciencias Genómicas . 2 (1): 135–41. doi :10.4056/sigs.38923. PMC 3035256 . PMID  21304685. 
  19. ^ Sélem-Mojica N, Aguilar C, Gutiérrez-García K, Martínez-Guerrero CE, Barona-Gómez F (diciembre de 2019). "EvoMining revela el origen y destino de las enzimas biosintéticas de productos naturales". Genómica microbiana . 5 (12): e000260. doi : 10.1099/mgen.0.000260 . PMC 6939163 . PMID  30946645. 
  20. ^ Juárez-Vázquez AL, Edirisinghe JN, Verduzco-Castro EA, Michalska K, Wu C, Noda-García L, et al. (Marzo de 2017). "Evolución de la especificidad de sustrato en una enzima retenida impulsada por la pérdida de genes". eVida . 6 (6): e22679. doi : 10.7554/eLife.22679 . PMC 5404923 . PMID  28362260. 
  21. ^ Noda-García L, Camacho-Zarco AR, Medina-Ruíz S, Gaytán P, Carrillo-Tripp M, Fülöp V, Barona-Gómez F (septiembre de 2013). "Evolución de la especificidad del sustrato en la enzima de un receptor tras transferencia horizontal de genes". Biología molecular y evolución . 30 (9): 2024–34. doi : 10.1093/molbev/mst115 . PMID  23800623.
  22. ^ ab Vernikos GS (2020). "Una revisión de las herramientas de pangenoma y estudios recientes". El pangenoma . págs. 89–112. doi :10.1007/978-3-030-38281-0_4. ISBN 978-3-030-38280-3. Número de identificación personal  32633917. Número de identificación personal  219011507.
  23. ^ ab Costa SS, Guimarães LC, Silva A, Soares SC, Baraúna RA (2020). "Primeros pasos en el análisis de pangenomas procarióticos". Perspectivas de bioinformática y biología . 14 : 1177932220938064. doi : 10.1177/1177932220938064. PMC 7418249 . PMID  32843837. 
  24. ^ Land M, Hauser L, Jun SR, Nookaew I, Leuze MR, Ahn TH, et al. (marzo de 2015). "Información obtenida a partir de 20 años de secuenciación del genoma bacteriano". Genómica funcional e integradora . 15 (2): 141–61. doi :10.1007/s10142-015-0433-4. PMC 4361730 . PMID  25722247. 
  25. ^ Argemi X, Matelska D, Ginalski K, Riegel P, Hansmann Y, Bloom J, et al. (agosto de 2018). "El análisis genómico comparativo de Staphylococcus lugdunensis muestra un pangenoma cerrado y múltiples barreras para la transferencia horizontal de genes". BMC Genomics . 19 (1): 621. doi : 10.1186/s12864-018-4978-1 . PMC 6102843 . PMID  30126366. 
  26. ^ Brockhurst MA, Harrison E, Hall JP, Richards T, McNally A, MacLean C (octubre de 2019). "La ecología y evolución de los pangenomas". Current Biology . 29 (20): R1094–R1103. Bibcode :2019CBio...29R1094B. doi : 10.1016/j.cub.2019.08.012 . PMID  31639358. S2CID  204823648.
  27. ^ McInerney JO, McNally A, O'Connell MJ (marzo de 2017). "Por qué los procariotas tienen pangenomas" (PDF) . Nature Microbiology . 2 (4): 17040. doi :10.1038/nmicrobiol.2017.40. PMID  28350002. S2CID  19612970.
  28. ^ Koonin EV (junio de 2015). "La dinámica de redes turbulentas de la evolución microbiana y el árbol estadístico de la vida". Journal of Molecular Evolution . 80 (5–6): 244–50. Bibcode :2015JMolE..80..244K. doi :10.1007/s00239-015-9679-7. PMC 4472940 . PMID  25894542. 
  29. ^ Kislyuk AO, Haegeman B, Bergman NH, Weitz JS (enero de 2011). "Fluidez genómica: una visión integradora de la diversidad genética dentro de las poblaciones microbianas". BMC Genomics . 12 (12): 32. doi : 10.1186/1471-2164-12-32 . PMC 3030549 . PMID  21232151. 
  30. ^ Puigbò P, Lobkovsky AE, Kristensen DM, Wolf YI, Koonin EV (agosto de 2014). "Genomas en crisis: cuantificación de la dinámica genómica en supergenomas procariotas". BMC Biology . 12 (66): 66. doi : 10.1186/s12915-014-0066-4 . PMC 4166000 . PMID  25141959. 
  31. ^ Lapierre P, Gogarten JP (marzo de 2009). "Estimación del tamaño del pangenoma bacteriano". Tendencias en genética . 25 (3): 107–10. doi :10.1016/j.tig.2008.12.004. PMID  19168257.
  32. ^ ab Delmont TO, Eren AM (2018). "Vinculación de pangenomas y metagenomas: el metapangenoma de Prochlorococcus". PeerJ . 6 : e4320. doi : 10.7717/peerj.4320 . PMC 5804319 . PMID  29423345. 
  33. ^ Utter DR, Borisy GG, Eren AM, Cavanaugh CM, Mark Welch JL (16 de diciembre de 2020). "La metapangenómica del microbioma oral proporciona información sobre la adaptación al hábitat y la diversidad de cultivares". Genome Biology . 21 (1): 293. doi : 10.1186/s13059-020-02200-2 . PMC 7739467 . PMID  33323129. 
  34. ^ Ma B, France M, Ravel J (2020). "Meta-Pangenoma: En la encrucijada de la pangenómica y la metagenómica". En Tettelin H, Medini D (eds.). El pangenoma: diversidad, dinámica y evolución de los genomas. Springer. págs. 205–218. doi :10.1007/978-3-030-38281-0_9. ISBN 978-3-030-38281-0. Número de identificación personal  32633911. Número de identificación personal  219067583.
  35. ^ Zhong C, Chen C, Wang L, Ning K (2021). "Integración de pangenoma con metagenoma para la elaboración de perfiles de comunidades microbianas". Revista de biotecnología estructural y computacional . 19 : 1458–1466. doi :10.1016/j.csbj.2021.02.021. PMC 8010324 . PMID  33841754. 
  36. ^ ab Donati C, Hiller NL, Tettelin H, Muzzi A, Croucher NJ, Angiuoli SV, et al. (2010). "Estructura y dinámica del pangenoma de Streptococcus pneumoniae y especies estrechamente relacionadas". Genome Biology . 11 (10): R107. doi : 10.1186/gb-2010-11-10-r107 . PMC 3218663 . PMID  21034474. 
  37. ^ Rouli L, Merhej V, Fournier PE, Raoult D (septiembre de 2015). "El pangenoma bacteriano como una nueva herramienta para analizar bacterias patógenas". Nuevos microbios y nuevas infecciones . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756 . PMID  26442149. 
  38. ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, et al. (diciembre de 2007). "Patrones e implicaciones de la ganancia y pérdida de genes en la evolución de Prochlorococcus". PLOS Genetics . 3 (12): e231. doi : 10.1371/journal.pgen.0030231 . PMC 2151091 . PMID  18159947. 
  39. ^ Basharat Z, Yasmin A, He T, Tong Y (2018). "Secuenciación genómica y análisis de Alcaligenes faecalis subsp. phenolicus MB207". Scientific Reports . 8 (1): 3616. Bibcode :2018NatSR...8.3616B. doi :10.1038/s41598-018-21919-4. PMC 5827749 . PMID  29483539. 
  40. ^ Basharat Z, Yasmin A (2016). "Análisis pangenómico del género Serratia". arXiv : 1610.04160 [q-bio.GN].
  41. ^ Gupta VK, Chaudhari NM, Iskepalli S, Dutta C (marzo de 2015). "Divergencias en el repertorio de genes entre los genomas de referencia de Prevotella derivados de distintos sitios corporales de humanos". BMC Genomics . 16 (153): 153. doi : 10.1186/s12864-015-1350-6 . PMC 4359502 . PMID  25887946. 
  42. ^ Gaba S, Kumari A, Medema M, Kaushik R (diciembre de 2020). "Análisis pangenómico y reconstrucción del estado ancestral de la clase halobacteria: probabilidad de un nuevo superorden". Scientific Reports . 10 (1): 21205. Bibcode :2020NatSR..1021205G. doi :10.1038/s41598-020-77723-6. PMC 7713125 . PMID  33273480. 
  43. ^ McCarthy CG, Fitzpatrick DA (febrero de 2019). "Análisis pangenómico de especies de hongos modelo". Genómica microbiana . 5 (2). doi : 10.1099/mgen.0.000243 . PMC 6421352 . PMID  30714895. 
  44. ^ Li R, Li Y, Zheng H, Luo R, Zhu H, Li Q, Qian W, Ren Y, Tian G, Li J, Zhou G, Zhu X, Wu H, Qin J, Jin X, Li D, Cao H, Hu X, Blanche H, Cann H, Zhang X, Li S, Bolund L, Kristiansen K, Yang H, Wang J, Wang J (2010). "Construcción del mapa de secuencia del pangenoma humano". Nat Biotecnología . 28 (1): 57–63. doi :10.1038/nbt.1596. PMID  19997067. S2CID  205274447.
  45. ^ abc Liao WW, Asri M, Ebler J, Doerr D, Haukness M, Hickey G, et al. (mayo de 2023). "Borrador de una referencia del pangenoma humano". Nature . 617 (7960): 312–324. Bibcode :2023Natur.617..312L. doi : 10.1038/s41586-023-05896-x . PMC 10172123 . PMID  37165242. 
  46. ^ ab Gao L, Gonda I, Sun H, et al. (mayo de 2019). "El pangenoma del tomate descubre nuevos genes y un alelo raro que regula el sabor de la fruta". Nature Genetics . 51 (6): 1044–51. doi :10.1038/s41588-019-0410-2. PMID  31086351. S2CID  152283283.
  47. ^ Jayakodi M, Padmarasu S, Haberer G y col. (noviembre de 2020). "El pangenoma de la cebada revela el legado oculto del mejoramiento por mutaciones". Naturaleza . 588 (7837): 284–9. Código Bib :2020Natur.588..284J. doi : 10.1038/s41586-020-2947-8 . PMC 7759462 . PMID  33239781. 
  48. ^ Zhou Y, Zhang Z, Bao Z, Li H, Lyu Y, Zan Y, Wu Y, Cheng L, Fang Y, Wu K, Zhang J, Lyu H, Lin T, Gao Q, Saha S (8 de julio de 2022). "El pangenoma gráfico captura la heredabilidad faltante y potencia el mejoramiento del tomate". Nature . 606 (7914): 527–534. Bibcode :2022Natur.606..527Z. doi : 10.1038/s41586-022-04808-9 . hdl : 20.500.11850/553553 . ISSN  1476-4687. PMC 9200638 . PMID  35676474. 
  49. ^ Van de Weyer AL, Monteiro F, Furzer OJ, Nishimura MT, Cevik V, Witek K, Jones JD, Dangl JL, Weigel D, Bemm F (agosto de 2019). "Un inventario de genes y alelos NLR de toda la especie en Arabidopsis thaliana". Celúla . 178 (5): 1260–72. doi : 10.1016/j.cell.2019.07.038 . PMC 6709784 . PMID  31442410. 
  50. ^ Aherfi S, Andreani J, Baptiste E, Oumessoum A, Dornas FP, Andrade AC, et al. (2018). "Un gran pangenoma abierto y un genoma central pequeño para los pandorvirus gigantes". Frontiers in Microbiology . 9 (9): 1486. ​​doi : 10.3389/fmicb.2018.01486 . PMC 6048876 . PMID  30042742. 
  51. ^ El Consorcio de Pangenómica Computacional (enero de 2018). "Pangenómica computacional: estado, promesas y desafíos". Briefings in Bioinformatics . 19 (1): 118–135. doi :10.1093/bib/bbw089. PMC 5862344 . PMID  27769991. 
  52. ^ Eizenga JM, Novak AM, Sibbesen JA, Heumos S, Ghaffaari A, Hickey G, et al. (agosto de 2020). "Gráficos de pangenoma". Revista Anual de Genómica y Genética Humana . 21 : 139-162. doi :10.1146/annurev-genom-120219-080406. PMC 8006571 . PMID  32453966. 
  53. ^ Besemer J, Lomsadze A, Borodovsky M (junio de 2001). "GeneMarkS: un método de autoentrenamiento para la predicción de inicios de genes en genomas microbianos. Implicaciones para encontrar motivos de secuencia en regiones reguladoras". Nucleic Acids Research . 29 (12): 2607–18. doi :10.1093/nar/29.12.2607. PMC 55746 . PMID  11410670. 
  54. ^ Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA, et al. (febrero de 2008). "El servidor RAST: anotaciones rápidas utilizando tecnología de subsistemas". BMC Genomics . 9 (9): 75. doi : 10.1186/1471-2164-9-75 . PMC 2265698 . PMID  18261238. 
  55. ^ abc Xiao J, Zhang Z, Wu J, Yu J (febrero de 2015). "Una breve revisión de herramientas de software para pangenómica". Genómica, proteómica y bioinformática . 13 (1): 73–6. doi :10.1016/j.gpb.2015.01.007. PMC 4411478 . PMID  25721608. 
  56. ^ Laing C, Buchanan C, Taboada EN, Zhang Y, Kropinski A, Villegas A, et al. (septiembre de 2010). "Análisis de secuencias pangenómicas utilizando Panseq: una herramienta en línea para el análisis rápido de regiones genómicas centrales y accesorias". BMC Bioinformatics . 11 (1): 461. doi : 10.1186/1471-2105-11-461 . PMC 2949892 . PMID  20843356. 
  57. ^ Zhao Y, Wu J, Yang J, Sun S, Xiao J, Yu J (febrero de 2012). "PGAP: proceso de análisis de pan-genomas". Bioinformática . 28 (3): 416–8. doi :10.1093/bioinformatics/btr655. PMC 3268234 . PMID  22130594. 
  58. ^ Chaudhari NM, Gupta VK, Dutta C (abril de 2016). "BPGA: un proceso de análisis pangenómico ultrarrápido". Scientific Reports . 6 (24373): 24373. Bibcode :2016NatSR...624373C. doi :10.1038/srep24373. PMC 4829868 . PMID  27071527. 
  59. ^ ab Contreras-Moreira B, Vinuesa P (diciembre de 2013). "GET_HOMOLOGUES, un paquete de software versátil para el análisis escalable y robusto de pangenomas microbianos". Applied and Environmental Microbiology . 79 (24): 7696–701. Bibcode :2013ApEnM..79.7696C. doi :10.1128/AEM.02411-13. PMC 3837814 . PMID  24096415. 
  60. ^ Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT, et al. (noviembre de 2015). "Roary: análisis rápido a gran escala del genoma de procariotas". Bioinformática . 31 (22): 3691–3. doi :10.1093/bioinformatics/btv421. PMC 4817141 . PMID  26198102. 
  61. ^ Bonnici V, Giugno R, Manca V (noviembre de 2018). "PanDelos: un método basado en diccionario para el descubrimiento de contenido pangenómico". BMC Bioinformatics . 19 (Supl. 15): 437. doi : 10.1186/s12859-018-2417-6 . PMC 6266927 . PMID  30497358. 
  62. ^ Guimarães LC, Florczak-Wyspianska J, de Jesus LB, Viana MV, Silva A, Ramos RT, et al. (agosto de 2015). "Dentro del pangenoma: descripción general de los métodos y el software". Genómica actual . 16 (4): 245–52. doi :10.2174/1389202916666150423002311. PMC 4765519 . PMID  27006628. 
  63. ^ Golicz AA, Batley J, Edwards D (abril de 2016). "Hacia la pangenómica de las plantas" (PDF) . Plant Biotechnology Journal . 14 (4): 1099–105. doi :10.1111/pbi.12499. PMID  26593040.
  64. ^ Sheikhizadeh S, Schranz ME, Akdel M, de Ridder D, Smit S (septiembre de 2016). "PanTools: representación, almacenamiento y exploración de datos pangenómicos". Bioinformática . 32 (17): i487–i493. doi : 10.1093/bioinformatics/btw455 . PMID  27587666.
  65. ^ ab Ding W, Baumdicker F, Neher RA (enero de 2018). "panX: análisis y exploración pangenómica". Nucleic Acids Research . 46 (1): e5. doi :10.1093/nar/gkx977. PMC 5758898 . PMID  29077859. 
  66. ^ Xu L, Dong Z, Fang L, Luo Y, Wei Z, Guo H, et al. (julio de 2019). "OrthoVenn2: un servidor web para la comparación de todo el genoma y la anotación de grupos ortólogos en múltiples especies". Nucleic Acids Research . 47 (W1): W52–W58. doi :10.1093/nar/gkz333. PMC 6602458 . PMID  31053848. 
  67. ^ Zhang B, Huang H, Tibbs-Cortes LE, Vanous A, Zhang Z, Sanguinet K, Garland-Campbell KA, Yu J, Li X (2023). "Optimice el aprendizaje automático no supervisado para examinar y graficar haplotipos basados ​​en indel de pangenomas". Molecular Plant . 16 (6): 975–978. doi : 10.1016/j.molp.2023.05.005 . PMID  37202927.
  68. ^ Bonnici V, Maresi E, Giugno R (2020). "Desafíos en los enfoques orientados a genes para el descubrimiento del contenido del pangenoma". Sesiones informativas en Bioinformática . 22 (3). doi : 10.1093/bib/bbaa198. ISSN  1477-4054. PMID  32893299.
  69. ^ Bonnici V, Chicco D (3 de septiembre de 2024). "Siete consejos rápidos para el análisis pangenómico computacional centrado en genes". BioData Mining . 17 (28): 28. doi : 10.1186/s13040-024-00380-2 . ISSN  1756-0381. PMC 11370085 . PMID  39227987.