stringtranslate.com

Pangenoma

Análisis de pangenomas de genomas de Streptococcus agalactiae realizado con el software Anvi'o [1] cuyo desarrollo está liderado por A. Murat Eren . Genomas obtenidos de Tettelin et al. (2005). [2] Cada círculo corresponde a un genoma y cada radio representa una familia de genes. En la parte inferior y a la derecha están localizadas las familias centrales del genoma. Algunas familias del núcleo pueden tener más de un gen homólogo por genoma. En el medio, a la izquierda de la figura, se observa el genoma de la concha. En la parte superior izquierda se muestran familias del genoma prescindible y ejemplares únicos.

En los campos de la biología molecular y la genética , un pangenoma ( pangenoma o supragenoma ) es el conjunto completo de genes de todas las cepas dentro de un clado . De manera más general, es la unión de todos los genomas de un clado. [2] [3] [4] [5] El pangenoma se puede dividir en un "pangenoma central" que contiene genes presentes en todos los individuos, un "pangenoma de cáscara" que contiene genes presentes en dos o más cepas, y un "pangenoma de nube" que contiene genes que sólo se encuentran en una única cepa. [3] [4] [6] Algunos autores también se refieren al genoma de la nube como "genoma accesorio" que contiene genes "prescindibles" presentes en un subconjunto de las cepas y genes específicos de la cepa. [2] [3] [4] Tenga en cuenta que el uso del término 'prescindible' ha sido cuestionado, al menos en los genomas de las plantas, ya que los genes accesorios desempeñan "un papel importante en la evolución del genoma y en la compleja interacción entre el genoma y el ambiente". [5] El campo de estudio de los pangenomas se llama pangenómica. [2]

El repertorio genético de una especie bacteriana es mucho mayor que el contenido genético de una cepa individual. [7] Algunas especies tienen pangenomas abiertos (o extensos), mientras que otras tienen pangenomas cerrados. [2] Para especies con un pangenoma cerrado, se agregan muy pocos genes por genoma secuenciado (después de secuenciar muchas cepas), y el tamaño del pangenoma completo se puede predecir teóricamente. Las especies con un pangenoma abierto tienen suficientes genes agregados por genoma secuenciado adicional, por lo que es imposible predecir el tamaño del pangenoma completo. [4] Se ha sugerido que el tamaño de la población y la versatilidad del nicho son los factores más influyentes en la determinación del tamaño del pangenoma. [2]

Los pangenomas se construyeron originalmente para especies de bacterias y arqueas , pero más recientemente se han desarrollado pangenomas eucariotas , particularmente para especies de plantas . Los estudios de plantas han demostrado que la dinámica del pangenoma está vinculada a elementos transponibles. [8] [9] [10] [11] La importancia del pangenoma surge en un contexto evolutivo, especialmente con relevancia para la metagenómica , [12] pero también se utiliza en un contexto genómico más amplio . [13] En la primavera de 2020 se publicó un libro de acceso abierto que revisa el concepto de pangenoma y sus implicaciones, editado por Tettelin y Medini.

Etimología

El término "pangenoma" fue definido con su significado actual por Tettelin et al. en 2005; [2] deriva 'pan' de la palabra griega παν, que significa 'todo' o 'todo', mientras que genoma es un término comúnmente utilizado para describir el material genético completo de un organismo. Tettelin et al. aplicó el término específicamente a las bacterias , cuyo pangenoma "incluye un genoma central que contiene genes presentes en todas las cepas y un genoma prescindible compuesto de genes ausentes de una o más cepas y genes que son únicos para cada cepa". [2]

Partes del pangenoma

En el pangenoma, podemos identificar tres conjuntos de genes: genoma Core, Shell y Cloud. El genoma Core comprende los genes que están presentes en todos los genomas analizados. Para evitar descartar familias debido a artefactos de secuenciación, algunos autores consideran el núcleo blando (>95% de ocurrencia). El genoma de Shell consta de genes compartidos por la mayoría de los genomas (entre el 10 y el 95%). Las familias de genes presentes en un solo genoma o en <10% de ocurrencia se describen como genoma dispensable o de nube.

Centro

Es la parte del pangenoma que comparte cada genoma del conjunto probado. Algunos autores han dividido el pangenoma central en núcleo duro, aquellas familias de genes homólogos que tienen al menos una copia de la familia compartida por cada genoma (el 100% de los genomas) y el núcleo blando o núcleo extendido, [15] aquellas familias distribuidas arriba un cierto umbral (90%). En un estudio que involucra los pangenomas de Bacillus cereus y Staphylococcus aureus , algunos de ellos aislados de la estación espacial internacional, los umbrales utilizados para segmentar los pangenomas fueron los siguientes: "Nube", "Cáscara" y "Núcleo" correspondientes al gen familias con presencia en <10%, 10 a 95% y >95% de los genomas, respectivamente. [dieciséis]

El tamaño del genoma central y la proporción con el pangenoma depende de varios factores, pero depende especialmente de la similitud filogenética de los genomas considerados. Por ejemplo, el núcleo de dos genomas idénticos sería también el pangenoma completo. El núcleo de un género siempre será más pequeño que el núcleo del genoma de una especie. Los genes que pertenecen al genoma central a menudo están relacionados con funciones de mantenimiento y metabolismo primario del linaje; sin embargo, el gen central también puede contener algunos genes que diferencian la especie de otras especies del género, es decir, que pueden estar relacionados con la patogenicidad con el nicho. adaptación. [17]

Caparazón

Es la parte del pangenoma compartida por la mayoría de los genomas de un pangenoma. [18] No existe un umbral universalmente aceptado para definir el genoma de la concha; algunos autores consideran una familia de genes como parte del pangenoma de la concha si es compartida por más del 50% de los genomas del pangenoma. [19] Una familia puede ser parte del caparazón por varias dinámicas evolutivas, por ejemplo por pérdida de genes en un linaje donde anteriormente formaba parte del genoma central, tal es el caso de las enzimas en el operón triptófano en Actinomyces , [20] o por ganancia y fijación de genes de una familia de genes que anteriormente formaba parte del genoma prescindible, como es el caso del gen trpF en varias especies de Corynebacterium . [21]

Nube

El genoma de la nube consta de aquellas familias de genes compartidas por un subconjunto mínimo de genomas en el pangenoma, [22] incluye genes únicos o genes presentes en solo uno de los genomas. También se le conoce como genoma periférico o genoma accesorio. Las familias de genes de esta categoría suelen estar relacionadas con la adaptación ecológica. [ cita necesaria ]

Clasificación

a) Los pangenomas cerrados se caracterizan por genomas centrales grandes y genomas accesorios pequeños. b) Los pangenomas abiertos tienden a tener genomas centrales pequeños y genomas accesorios grandes. c) El tamaño de los pangenomas abiertos tiende a aumentar con cada genoma agregado, mientras que el tamaño de los pangenomas cerrados tiende a ser asintótico a pesar de agregar más genomas. Debido a esta característica, se puede predecir el tamaño completo del pangenoma para pangenomas cerrados.

El pangenoma se puede clasificar de forma algo arbitraria como abierto o cerrado según el valor alfa de la ley de Heap: [23] [15]

si entonces el pangenoma se considera abierto.si entonces el pangenoma se considera cerrado.

Por lo general, el software pangenome puede calcular los parámetros de la ley de Heap que mejor describen el comportamiento de los datos.

pangenoma abierto

Un pangenoma abierto ocurre cuando en un linaje taxonómico sigue aumentando el número de nuevas familias de genes y este incremento no parece ser asintótico independientemente de cuántos genomas nuevos se agreguen al pangenoma. Escherichia coli es un ejemplo de especie con un pangenoma abierto. Cualquier tamaño del genoma de E. coli está en el rango de 4000 a 5000 genes y el tamaño del pangenoma estimado para esta especie con aproximadamente 2000 genomas está compuesto por 89.000 familias de genes diferentes. [24] El pangenoma de las bacterias de dominio también se considera abierto.

Pangenoma cerrado

Un pangenoma cerrado ocurre en un linaje cuando solo se agregan unas pocas familias de genes cuando se incorporan nuevos genomas al análisis del pangenoma, y ​​la cantidad total de familias de genes en el pangenoma parece ser asintótica con respecto a un número. Se cree que el parasitismo y las especies especialistas en algún nicho ecológico tienden a tener pangenomas cerrados. Staphylococcus lugdunensis es un ejemplo de bacteria comensal con pangenoma cerrado. [25]

Historia

pangenoma

El concepto de pangenoma original fue desarrollado por Tettelin et al. [2] cuando analizaron los genomas de ocho aislados de Streptococcus agalactiae , donde describieron un genoma central compartido por todos los aislados, que representa aproximadamente el 80% de cualquier genoma individual, más un genoma prescindible que consta de genes parcialmente compartidos y específicos de la cepa. La extrapolación sugirió que el reservorio de genes en el pangenoma de S. agalactiae es enorme y que se seguirían identificando nuevos genes únicos incluso después de secuenciar cientos de genomas. [2] El pangenoma comprende la totalidad de los genes descubiertos en los genomas secuenciados de una especie microbiana determinada y puede cambiar cuando se secuencian e incorporan nuevos genomas al análisis. [ cita necesaria ]

El supergenoma se define como todos los genes accesibles para una determinada especie, el pangenoma si estuviera disponible la secuenciación de todos los genomas de una especie. Metapangenoma es el análisis de pangenoma aplicado a muestras metagenómicas, donde se evalúa la unión de genes de varias especies para un hábitat determinado.

El pangenoma de un linaje genómico representa la variabilidad del contenido genético dentro del linaje. El pangenoma evoluciona debido a: duplicación de genes, dinámica de ganancia y pérdida de genes e interacción del genoma con elementos móviles que están moldeados por selección y deriva. [26] Algunos estudios señalan que los pangenomas de procariotas son el resultado de una evolución adaptativa, no neutral , que confiere a las especies la capacidad de migrar a nuevos nichos. [27]

supergenoma

Se puede considerar que el supergenoma tiene el tamaño real del pangenoma si se secuenciaran todos los genomas de una especie. [28] Se define como todos los genes accesibles para ser adquiridos por una determinada especie. No se puede calcular directamente, pero su tamaño se puede estimar mediante el tamaño del pangenoma calculado a partir de los datos del genoma disponibles. Estimar el tamaño del genoma de la nube puede resultar preocupante debido a su dependencia de la aparición de genes y genomas raros. En 2011, se propuso la fluidez genómica como medida para categorizar la similitud a nivel genético entre grupos de aislados secuenciados. [29] En algunos linajes los supergenomas sí parecían infinitos , [30] como es el caso del dominio Bacteria. [31]

Metapangenoma

El 'metapangenoma' se ha definido como el resultado del análisis de pangenomas junto con el entorno donde la abundancia y prevalencia de grupos de genes y genomas se recuperan a través de metagenomas de escopeta. [32] La combinación de metagenomas con pangenomas, también conocida como "metapangenómica", revela los resultados a nivel de población del filtrado específico del hábitat del acervo genético pangenómico. [33]

Otros autores consideran que la Metapangenómica amplía el concepto de pangenoma al incorporar secuencias de genes obtenidas de microorganismos no cultivados mediante un enfoque metagenómico . Un metapangenoma comprende tanto secuencias de genomas ensamblados en metagenomas ( MAG ) como de genomas obtenidos de microorganismos cultivados. [34] La metapangenómica se ha aplicado para evaluar la diversidad de una comunidad, la adaptación del nicho microbiano, la evolución microbiana, las actividades funcionales y las redes de interacción de la comunidad. [35] La plataforma Anvi'o desarrolló un flujo de trabajo que integra el análisis y la visualización de metapangenomas generando pangenomas y estudiándolos junto con los metagenomas. [32]

Ejemplos

pangenoma procariota

El pangenoma de S. pneumoniae . (a) Número de genes nuevos en función del número de genomas secuenciados. El número previsto de genes nuevos cae bruscamente a cero cuando el número de genomas supera los 50. (b) Número de genes centrales en función del número de genomas secuenciados. El número de genes centrales converge a 1647 para el número de genomas n→∞. De Donati et al. [36]

En 2018, el 87% de las secuencias del genoma completo disponibles eran bacterias, lo que alimentó el interés de los investigadores en calcular pangenomas procariotas en diferentes niveles taxonómicos. [22] En 2015, el pangenoma de 44 cepas de la bacteria Streptococcus pneumoniae muestra pocos genes nuevos descubiertos con cada nuevo genoma secuenciado (ver figura). De hecho, el número previsto de genes nuevos se redujo a cero cuando el número de genomas supera los 50 (tenga en cuenta, sin embargo, que este no es un patrón que se encuentre en todas las especies). Esto significaría que S. pneumoniae tiene un "pangenoma cerrado". [37] La ​​principal fuente de nuevos genes en S. pneumoniae fue Streptococcus mitis, desde donde se transfirieron genes horizontalmente . El tamaño del pangenoma de S. pneumoniae aumentó logarítmicamente con el número de cepas y linealmente con el número de sitios polimórficos de los genomas muestreados, lo que sugiere que los genes adquiridos se acumulan proporcionalmente a la edad de los clones. [36] Otro ejemplo de pangenoma procariota es Proclorococo , el conjunto central del genoma es mucho más pequeño que el pangenoma, que es utilizado por diferentes ecotipos de Proclorococo . [38] Se ha observado pangenoma abierto en aislados ambientales como Alcaligenes sp. [39] y Serratia sp., [40] que muestran un estilo de vida simpátrico. Sin embargo, el pangenoma abierto no es exclusivo de los microorganismos de vida libre; un estudio de 2015 sobre la bacteria Prevotella aislada de humanos comparó los repertorios de genes de sus especies derivados de diferentes partes del cuerpo humano. También informó sobre un pangenoma abierto que muestra una gran diversidad de acervo genético. [41]

Archaea también tiene algunos estudios de pangenomas. El pangenoma de halobacterias muestra las siguientes familias de genes en los subconjuntos de pangenomas: núcleo (300), componentes variables (Softcore: 998, Cloud:36531, Shell:11784). [42]

pangenoma eucariota

Organismos eucariotas como hongos , animales y plantas también han mostrado evidencia de pangenomas. En cuatro especies de hongos cuyo pangenoma se ha estudiado, se encontraron entre el 80 y el 90% de los modelos genéticos como genes centrales. Los genes accesorios restantes participaron principalmente en la patogénesis y la resistencia a los antimicrobianos. [43]

En animales se está estudiando el pangenoma humano. En 2010, un estudio estimó que un pangenoma humano completo contendría entre 19 y 40 megabases de secuencia novedosa que no está presente en el genoma humano de referencia existente . [44] El consorcio Human Pangenome tiene como objetivo reconocer la diversidad del genoma humano. En 2023, se publicó un borrador de referencia del pangenoma humano. [45] Se basa en 47 genomas de personas de variada etnia. [45] Hay planes en marcha para una referencia mejorada que capture aún más biodiversidad a partir de una muestra aún más amplia. [45]

Entre las plantas, hay ejemplos de estudios de pangenomas en especies modelo, tanto diploides [9] como poliploides, [10] y una lista cada vez mayor de cultivos. [46] [47] Los pangenomas se han mostrado prometedores como herramienta en el fitomejoramiento al tener en cuenta variantes estructurales y SNP en genomas que no son de referencia, lo que ayuda a resolver el problema de la heredabilidad faltante que persiste en los estudios de asociación de todo el genoma . [48] ​​Un concepto emergente basado en plantas es el de pan-NLRome, que es el repertorio de proteínas repetidas ricas en leucina (NLR) de unión a nucleótidos, receptores inmunes intracelulares que reconocen proteínas patógenas y confieren resistencia a las enfermedades. [49]

pangenoma del virus

El virus no necesariamente tiene genes ampliamente compartidos por clados, como es el caso del 16S en las bacterias y, por lo tanto, el genoma central del dominio del virus completo está vacío. Sin embargo, varios estudios han calculado el pangenoma de algunos linajes virales. El genoma central de seis especies de pandoravirus comprende 352 familias de genes (solo el 4,7% del pangenoma), lo que da como resultado un pangenoma abierto. [50]

Estructuras de datos

El número de genomas secuenciados crece continuamente "la simple ampliación de los canales bioinformáticos establecidos no será suficiente para aprovechar todo el potencial de conjuntos de datos genómicos tan ricos". [51] Los gráficos de pangenomas son estructuras de datos emergentes diseñadas para representar pangenomas y mapear eficientemente sus lecturas. Han sido revisados ​​por Eizenga et al. [52]

Herramientas de software

Análisis pangenoma de genomas de Streptococcus agalactiae . [2] Ejemplo de filogenias realizadas con software BPGA. Este software nos permite generar filogenias basadas en la agrupación del genoma central o pangenoma. Las reconstrucciones centrales y panfilogenéticas no necesariamente coinciden.

A medida que aumentó el interés en los pangenomas, se han desarrollado varias herramientas de software para ayudar a analizar este tipo de datos. Para iniciar un análisis pangenómico, el primer paso es la homogeneización de la anotación del genoma. [23] Se debe utilizar el mismo software para anotar todos los genomas utilizados, como GeneMark [53] o RAST. [54] En 2015, un grupo revisó los diferentes tipos de análisis y herramientas que un investigador puede tener disponibles. [55] Hay siete tipos de software desarrollados para analizar pangenomas: aquellos dedicados a agrupar genes homólogos; identificar SNP ; trazar perfiles pangenómicos; construir relaciones filogenéticas de genes/familias de cepas/aislados ortólogos; búsqueda basada en funciones; anotación y/o curación; y visualización. [55]

Las dos herramientas de software más citadas para el análisis pangenómico a finales de 2014 [55] fueron Panseq [56] y el proceso de análisis pangenómico (PGAP). [57] Otras opciones incluyen BPGA: un canal de análisis pangenómico para genomas procarióticos, [58] GET_HOMOLOGUES, [59] Roary. [60] y PanDelos. [61] En 2015 se publicó una revisión centrada en pangenomas procariotas [62] y otra sobre pangenomas de plantas. [63] Entre los primeros paquetes de software diseñados para pangenomas de plantas se encontraba PanTools. [64] y GET_HOMOLOGUES-EST. [11] [59] En 2018 se lanzó panX, una herramienta web interactiva que permite inspeccionar la historia evolutiva de las familias de genes. [65] panX puede mostrar una alineación de genomas, un árbol filogenético, mapeo de mutaciones e inferencias sobre ganancias y pérdidas de la familia en la filogenia del genoma central. En 2019, OrthoVenn 2.0 [66] permitió la visualización comparativa de familias de genes homólogos en diagramas de Venn de hasta 12 genomas. En 2023, se desarrolló BRIDGEcereal para estudiar y graficar haplotipos basados ​​en indel del pangenoma a través de una identificación de modelo genético. [67]

Gráfico de pangenomas de 3 117 genomas de Acinetobacter baumannii. Los bordes corresponden a colocalización genómica y los nodos corresponden a genes. El grosor de los bordes es proporcional al número de genomas que comparten ese vínculo. Los bordes entre los nodos persistentes (similares a los genes centrales), la capa y la nube están coloreados en naranja, verde y azul, respectivamente.
Gráfico de pangenomas de 3 117 genomas de Acinetobacter baumannii generados con el software PPanGGOLiN. Los bordes corresponden a colocalización genómica y los nodos corresponden a genes. El grosor de los bordes es proporcional al número de genomas que comparten ese vínculo. Los bordes entre los nodos persistentes (similares a los genes centrales), la capa y la nube están coloreados en naranja, verde y azul, respectivamente.

En 2020, Anvi'o [1] estaba disponible como una plataforma multiómica que contiene análisis pangenómicos y metapangenómicos, así como flujos de trabajo de visualización. En Anvi'o, los genomas se muestran en círculos concéntricos y cada radio representa una familia de genes, lo que permite comparar más de 100 genomas en su visualización interactiva. En 2020, se publicó una comparación computacional de herramientas para extraer contenidos pangenómicos basados ​​en genes (como GET_HOMOLOGUES, PanDelos, Roary y otras). [68] Las herramientas se compararon desde una perspectiva metodológica, analizando las causas que llevan a una determinada metodología a superar a otras herramientas. El análisis se realizó teniendo en cuenta diferentes poblaciones bacterianas, que se generan sintéticamente al cambiar los parámetros evolutivos. Los resultados muestran una diferenciación del rendimiento de cada herramienta que depende de la composición de los genomas de entrada. Nuevamente en 2020, varias herramientas introdujeron una representación gráfica de los pangenomas que muestra la contigüidad de los genes (PPanGGOLiN, [46] Panaroo [65] ).

Ejemplo de posibles salidas del software BPGA. Análisis pangenoma de genomas de Streptococcus agalactiae . A la izquierda, se muestra la distribución de los términos de Go por genoma central/prescindible/único. En este ejemplo, la categoría replicación, recombinación y reparación se enriquece en familias de genes únicas. A la derecha se muestra un gráfico pan/núcleo típico, cuando se han agregado más genomas, el tamaño del núcleo disminuye y, por el contrario, el tamaño del pangenoma aumenta. [2]

Ver también

Referencias

  1. ^ ab Eren AM, Kiefl E, Shaiber A, Veseli I, Miller SE, Schechter MS y col. (enero de 2021). "Multiómica reproducible, integrada y dirigida por la comunidad con anvi'o". Microbiología de la naturaleza . 6 (1): 3–6. doi :10.1038/s41564-020-00834-3. PMC  8116326 . PMID  33349678.
  2. ^ abcdefghijkl Tettelin H, Masignani V, Cieslewicz MJ, Donati C, Medini D, Ward NL, Angiuoli SV, Crabtree J, Jones AL, Durkin AS, DeBoy RT (27 de septiembre de 2005). "Análisis del genoma de múltiples aislados patógenos de Streptococcus agalactiae: implicaciones para el" pangenoma" microbiano". Procedimientos de la Academia Nacional de Ciencias . 102 (39): 13950–13955. Código Bib : 2005PNAS..10213950T. doi : 10.1073/pnas.0506758102 . ISSN  0027-8424. PMC 1216834 . PMID  16172379. 
  3. ^ abc Medini D, Donati C, Tettelin H, Masignani V, Rappuoli R (diciembre de 2005). "El pangenoma microbiano". Opinión actual en genética y desarrollo . 15 (6): 589–94. doi :10.1016/j.gde.2005.09.006. PMID  16185861.
  4. ^ abcd Vernikos G, Medini D, Riley DR, Tettelin H (febrero de 2015). "Diez años de análisis pangenómicos". Opinión actual en microbiología . 23 : 148–54. doi :10.1016/j.mib.2014.11.016. PMID  25483351.
  5. ^ ab Marroni F, Pinosio S, Morgante M (abril de 2014). "Variación estructural y complejidad del genoma: ¿es realmente prescindible?". Opinión actual en biología vegetal . 18 : 31–36. Código Bib : 2014COPB...18...31M. doi :10.1016/j.pbi.2014.01.003. PMID  24548794.
  6. ^ Wolf YI, Makarova KS, Yutin N, Koonin EV (diciembre de 2012). "Grupos actualizados de genes ortólogos de Archaea: un ancestro complejo de Archaea y los caminos de la transferencia horizontal de genes". Biología Directa . 7 : 46. doi : 10.1186/1745-6150-7-46 . PMC 3534625 . PMID  23241446. 
  7. ^ Mira A, Martín-Cuadrado AB, D'Auria G, Rodríguez-Valera F (2010). "El pangenoma bacteriano: un nuevo paradigma en microbiología". Microbiol Internacional . 13 (2): 45–57. doi :10.2436/20.1501.01.110. PMID  20890839.
  8. ^ Morgante M, De Paoli E, Radovic S (abril de 2007). "Elementos transponibles y pangenomas vegetales". Opinión actual en biología vegetal . 10 (2): 149–55. Código Bib : 2007COPB...10..149M. doi :10.1016/j.pbi.2007.02.001. PMID  17300983.
  9. ^ ab Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S, et al. (Diciembre de 2017). "La amplia variación del contenido genético en el pangenoma de Brachypodium distachyon se correlaciona con la estructura de la población". Comunicaciones de la naturaleza . 8 (1): 2184. Código bibliográfico : 2017NatCo...8.2184G. doi :10.1038/s41467-017-02292-8. PMC 5736591 . PMID  29259172. 
  10. ^ ab Gordon SP, Contreras-Moreira B, Levy JH, Djamei A, Czedik-Eysenberg A, Tartaglio VS, et al. (julio de 2020). "Evolución gradual del genoma poliploide revelada por análisis pangenómico de Brachypodium hybridum y sus progenitores diploides". Comunicaciones de la naturaleza . 11 (1): 3670. Código bibliográfico : 2020NatCo..11.3670G. doi : 10.1038/s41467-020-17302-5 . PMC 7391716 . PMID  32728126. 
  11. ^ ab Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, et al. (febrero de 2017). "Análisis de pangenomas y transcriptomas de plantas con GET_HOMOLOGUES-EST, una solución de agrupación para secuencias de la misma especie". Fronteras en la ciencia vegetal . 8 : 184. doi : 10.3389/fpls.2017.00184 . PMC 5306281 . PMID  28261241. 
  12. ^ Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (mayo de 2009). "Biogeografía del pangenoma de Sulfolobus islandicus". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (21): 8605–10. Código Bib : 2009PNAS..106.8605R. doi : 10.1073/pnas.0808945106 . PMC 2689034 . PMID  19435847. 
  13. ^ Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (febrero de 2009). "Ensamblaje de novo utilizando datos de secuencia de lectura corta de baja cobertura del patógeno del arroz Pseudomonas syringae pv. Oryzae". Investigación del genoma . 19 (2): 294–305. doi :10.1101/gr.083311.108. PMC 2652211 . PMID  19015323. 
  14. ^ Tettelin H, Medini D (2020). Tettelin H, Medini D (eds.). El pangenoma (PDF) . doi :10.1007/978-3-030-38281-0. ISBN 978-3-030-38280-3. PMID  32633908. S2CID  217167361.
  15. ^ ab Halachev MR, Loman Nueva Jersey, Pallen MJ (2011). "Cálculo de ortólogos en bacterias y Archaea: un enfoque de divide y vencerás". MÁS UNO . 6 (12): e28388. Código Bib : 2011PLoSO...628388H. doi : 10.1371/journal.pone.0028388 . PMC 3236195 . PMID  22174796. 
  16. ^ Blaustein RA, McFarland AG, Ben Maamar S, López A, Castro-Wallace S, Hartmann EM (2019). "Enfoque pangenómico para comprender las adaptaciones microbianas dentro de un entorno construido modelo, la estación espacial internacional, en relación con los huéspedes humanos y el suelo". mSistemas . 4 (1): e00281-18. doi :10.1128/mSystems.00281-18. PMC 6325168 . PMID  30637341. 
  17. ^ Mosquera-Rendón J, Rada-Bravo AM, Cárdenas-Brito S, Corredor M, Restrepo-Pineda E, Benítez-Páez A (enero de 2016). "Análisis de evolución molecular y de todo el pangenoma de la especie Pseudomonas aeruginosa". Genómica BMC . 17 (45): 45. doi : 10.1186/s12864-016-2364-4 . PMC 4710005 . PMID  26754847. 
  18. ^ Snipen L, Ussery DW (enero de 2010). "Procedimiento operativo estándar para calcular árboles pangenomas". Estándares en Ciencias Genómicas . 2 (1): 135–41. doi :10.4056/sigs.38923. PMC 3035256 . PMID  21304685. 
  19. ^ Sélem-Mojica N, Aguilar C, Gutiérrez-García K, Martínez-Guerrero CE, Barona-Gómez F (diciembre de 2019). "EvoMining revela el origen y destino de las enzimas biosintéticas de productos naturales". Genómica microbiana . 5 (12): e000260. doi : 10.1099/mgen.0.000260 . PMC 6939163 . PMID  30946645. 
  20. ^ Juárez-Vázquez AL, Edirisinghe JN, Verduzco-Castro EA, Michalska K, Wu C, Noda-García L, et al. (Marzo de 2017). "Evolución de la especificidad de sustrato en una enzima retenida impulsada por la pérdida de genes". eVida . 6 (6): e22679. doi : 10.7554/eLife.22679 . PMC 5404923 . PMID  28362260. 
  21. ^ Noda-García L, Camacho-Zarco AR, Medina-Ruíz S, Gaytán P, Carrillo-Tripp M, Fülöp V, Barona-Gómez F (septiembre de 2013). "Evolución de la especificidad de sustrato en la enzima de un receptor tras la transferencia horizontal de genes". Biología Molecular y Evolución . 30 (9): 2024–34. doi : 10.1093/molbev/mst115 . PMID  23800623.
  22. ^ ab Vernikos GS (2020). "Una revisión de las herramientas del pangenoma y estudios recientes". El Pangenoma . págs. 89-112. doi :10.1007/978-3-030-38281-0_4. ISBN 978-3-030-38280-3. PMID  32633917. S2CID  219011507.
  23. ^ ab Costa SS, Guimarães LC, Silva A, Soares SC, Baraúna RA (2020). "Primeros pasos en el análisis de pangenomas procarióticos". Perspectivas de bioinformática y biología . 14 : 1177932220938064. doi : 10.1177/1177932220938064. PMC 7418249 . PMID  32843837. 
  24. ^ Land M, Hauser L, Jun SR, Nookaew I, Leuze MR, Ahn TH y col. (Marzo de 2015). "Conocimientos de 20 años de secuenciación del genoma bacteriano". Genómica funcional e integradora . 15 (2): 141–61. doi :10.1007/s10142-015-0433-4. PMC 4361730 . PMID  25722247. 
  25. ^ Argemi X, Matelska D, Ginalski K, Riegel P, Hansmann Y, Bloom J, et al. (Agosto de 2018). "El análisis genómico comparativo de Staphylococcus lugdunensis muestra un pangenoma cerrado y múltiples barreras para la transferencia horizontal de genes". Genómica BMC . 19 (1): 621. doi : 10.1186/s12864-018-4978-1 . PMC 6102843 . PMID  30126366. 
  26. ^ Brockhurst MA, Harrison E, Hall JP, Richards T, McNally A, MacLean C (octubre de 2019). "La ecología y evolución de los pangenomas". Biología actual . 29 (20): R1094–R1103. Código Bib : 2019CBio...29R1094B. doi : 10.1016/j.cub.2019.08.012 . PMID  31639358. S2CID  204823648.
  27. ^ McInerney JO, McNally A, O'Connell MJ (marzo de 2017). "Por qué los procariotas tienen pangenomas" (PDF) . Microbiología de la naturaleza . 2 (4): 17040. doi :10.1038/nmicrobiol.2017.40. PMID  28350002. S2CID  19612970.
  28. ^ Koonin EV (junio de 2015). "La dinámica de la red turbulenta de la evolución microbiana y el árbol estadístico de la vida". Revista de evolución molecular . 80 (5–6): 244–50. Código Bib : 2015JMolE..80..244K. doi :10.1007/s00239-015-9679-7. PMC 4472940 . PMID  25894542. 
  29. ^ Kislyuk AO, Haegeman B, Bergman NH, Weitz JS (enero de 2011). "Fluidez genómica: una visión integradora de la diversidad genética dentro de las poblaciones microbianas". Genómica BMC . 12 (12): 32. doi : 10.1186/1471-2164-12-32 . PMC 3030549 . PMID  21232151. 
  30. ^ Puigbò P, Lobkovsky AE, Kristensen DM, Wolf YI, Koonin EV (agosto de 2014). "Genomas en confusión: cuantificación de la dinámica del genoma en supergenomas procariotas". Biología BMC . 12 (66): 66. doi : 10.1186/s12915-014-0066-4 . PMC 4166000 . PMID  25141959. 
  31. ^ Lapierre P, Gogarten JP (marzo de 2009). "Estimación del tamaño del pangenoma bacteriano". Tendencias en Genética . 25 (3): 107–10. doi :10.1016/j.tig.2008.12.004. PMID  19168257.
  32. ^ ab Delmont TO, Eren AM (2018). "Vinculación de pangenomas y metagenomas: el metapangenoma de Proclorococcus". PeerJ . 6 : e4320. doi : 10.7717/peerj.4320 . PMC 5804319 . PMID  29423345. 
  33. ^ Absoluto DR, Borisy GG, Eren AM, Cavanaugh CM, Mark Welch JL (16 de diciembre de 2020). "La metapangenómica del microbioma oral proporciona información sobre la adaptación del hábitat y la diversidad de cultivares". Biología del genoma . 21 (1): 293. doi : 10.1186/s13059-020-02200-2 . PMC 7739467 . PMID  33323129. 
  34. ^ Ma B, Francia M, Ravel J (2020). "Metapangenoma: en la encrucijada de la pangenómica y la metagenómica". En Tettelin H, Medini D (eds.). El pangenoma: diversidad, dinámica y evolución de los genomas. Saltador. págs. 205-218. doi :10.1007/978-3-030-38281-0_9. ISBN 978-3-030-38281-0. PMID  32633911. S2CID  219067583.
  35. ^ Zhong C, Chen C, Wang L, Ning K (2021). "Integración de pangenoma con metagenoma para la elaboración de perfiles de comunidades microbianas". Revista de Biotecnología Computacional y Estructural . 19 : 1458-1466. doi :10.1016/j.csbj.2021.02.021. PMC 8010324 . PMID  33841754. 
  36. ^ ab Donati C, Hiller NL, Tettelin H, Muzzi A, Croucher NJ, Angiuoli SV, et al. (2010). "Estructura y dinámica del pangenoma de Streptococcus pneumoniae y especies estrechamente relacionadas". Biología del genoma . 11 (10): R107. doi : 10.1186/gb-2010-11-10-r107 . PMC 3218663 . PMID  21034474. 
  37. ^ Rouli L, Merhej V, Fournier PE, Raoult D (septiembre de 2015). "El pangenoma bacteriano como nueva herramienta para el análisis de bacterias patógenas". Nuevos microbios y nuevas infecciones . 7 : 72–85. doi :10.1016/j.nmni.2015.06.005. PMC 4552756 . PMID  26442149. 
  38. ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, et al. (Diciembre de 2007). "Patrones e implicaciones de la ganancia y pérdida de genes en la evolución de Proclorococo". PLOS Genética . 3 (12): e231. doi : 10.1371/journal.pgen.0030231 . PMC 2151091 . PMID  18159947. 
  39. ^ Basharat Z, Yasmin A, He T, Tong Y (2018). "Secuenciación y análisis del genoma de Alcaligenes faecalis subsp. phenolicus MB207". Informes científicos . 8 (1): 3616. Código bibliográfico : 2018NatSR...8.3616B. doi :10.1038/s41598-018-21919-4. PMC 5827749 . PMID  29483539. 
  40. ^ Basharat Z, Yasmin A (2016). "Análisis del pangenoma del género Serratia". arXiv : 1610.04160 [q-bio.GN].
  41. ^ Gupta VK, Chaudhari NM, Iskepalli S, Dutta C (marzo de 2015). "Divergencias en el repertorio de genes entre los genomas de Prevotella de referencia derivados de distintas partes del cuerpo humano". Genómica BMC . 16 (153): 153. doi : 10.1186/s12864-015-1350-6 . PMC 4359502 . PMID  25887946. 
  42. ^ Gaba S, Kumari A, Medema M, Kaushik R (diciembre de 2020). "Análisis pangenoma y reconstrucción del estado ancestral de halobacterias de clase: probabilidad de un nuevo superorden". Informes científicos . 10 (1): 21205. Código bibliográfico : 2020NatSR..1021205G. doi :10.1038/s41598-020-77723-6. PMC 7713125 . PMID  33273480. 
  43. ^ McCarthy CG, Fitzpatrick DA (febrero de 2019). "Análisis pangenómicos de especies de hongos modelo". Genómica microbiana . 5 (2). doi : 10.1099/mgen.0.000243 . PMC 6421352 . PMID  30714895. 
  44. ^ Li R, Li Y, Zheng H, Luo R, Zhu H, Li Q, Qian W, Ren Y, Tian G, Li J, Zhou G, Zhu X, Wu H, Qin J, Jin X, Li D, Cao H, Hu X, Blanche H, Cann H, Zhang X, Li S, Bolund L, Kristiansen K, Yang H, Wang J, Wang J (2010). "Construcción del mapa de secuencia del pangenoma humano". Nat Biotecnología . 28 (1): 57–63. doi :10.1038/nbt.1596. PMID  19997067. S2CID  205274447.
  45. ^ abc Liao WW, Asri M, Ebler J, Doerr D, Haukness M, Hickey G, et al. (mayo de 2023). "Un borrador de referencia del pangenoma humano". Naturaleza . 617 (7960): 312–324. Código Bib :2023Natur.617..312L. doi : 10.1038/s41586-023-05896-x . PMC 10172123 . PMID  37165242. 
  46. ^ ab Gao L, Gonda I, Sun H, et al. (mayo de 2019). "El pangenoma del tomate descubre nuevos genes y un alelo poco común que regula el sabor de la fruta". Genética de la Naturaleza . 51 (6): 1044–51. doi :10.1038/s41588-019-0410-2. PMID  31086351. S2CID  152283283.
  47. ^ Jayakodi M, Padmarasu S, Haberer G y col. (noviembre de 2020). "El pangenoma de la cebada revela el legado oculto del mejoramiento por mutaciones". Naturaleza . 588 (7837): 284–9. Código Bib :2020Natur.588..284J. doi : 10.1038/s41586-020-2947-8 . PMC 7759462 . PMID  33239781. 
  48. ^ Zhou Y, Zhang Z, Bao Z, Li H, Lyu Y, Zan Y, Wu Y, Cheng L, Fang Y, Wu K, Zhang J, Lyu H, Lin T, Gao Q, Saha S (8 de julio de 2022) . "El pangenoma gráfico captura la heredabilidad faltante y potencia el mejoramiento del tomate". Naturaleza . 606 (7914): 527–534. Código Bib :2022Natur.606..527Z. doi : 10.1038/s41586-022-04808-9 . hdl : 20.500.11850/553553 . ISSN  1476-4687. PMC 9200638 . PMID  35676474. 
  49. ^ Van de Weyer AL, Monteiro F, Furzer OJ, Nishimura MT, Cevik V, Witek K, Jones JD, Dangl JL, Weigel D, Bemm F (agosto de 2019). "Un inventario de genes y alelos NLR de toda la especie en Arabidopsis thaliana". Celúla . 178 (5): 1260–72. doi : 10.1016/j.cell.2019.07.038 . PMC 6709784 . PMID  31442410. 
  50. ^ Aherfi S, Andreani J, Baptiste E, Oumessoum A, Dornas FP, Andrade AC, et al. (2018). "Un gran pangenoma abierto y un genoma central pequeño para Pandoravirus gigantes". Fronteras en Microbiología . 9 (9): 1486. ​​doi : 10.3389/fmicb.2018.01486 . PMC 6048876 . PMID  30042742. 
  51. ^ El Consorcio de Pangenómica Computacional (enero de 2018). "Pangenómica computacional: estado, promesas y desafíos". Sesiones informativas en Bioinformática . 19 (1): 118-135. doi : 10.1093/babero/bbw089. PMC 5862344 . PMID  27769991. 
  52. ^ Eizenga JM, Novak AM, Sibbesen JA, Heumos S, Ghaffaari A, Hickey G, et al. (agosto de 2020). "Gráficos de pangenoma". Revista Anual de Genómica y Genética Humana . 21 : 139-162. doi :10.1146/annurev-genom-120219-080406. PMC 8006571 . PMID  32453966. 
  53. ^ Besemer J, Lomsadze A, Borodovsky M (junio de 2001). "GeneMarkS: un método de autoentrenamiento para la predicción de inicios de genes en genomas microbianos. Implicaciones para encontrar motivos de secuencia en regiones reguladoras". Investigación de ácidos nucleicos . 29 (12): 2607–18. doi :10.1093/nar/29.12.2607. PMC 55746 . PMID  11410670. 
  54. ^ Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA, et al. (febrero de 2008). "El servidor RAST: anotaciones rápidas utilizando tecnología de subsistemas". Genómica BMC . 9 (9): 75. doi : 10.1186/1471-2164-9-75 . PMC 2265698 . PMID  18261238. 
  55. ^ abc Xiao J, Zhang Z, Wu J, Yu J (febrero de 2015). "Una breve revisión de las herramientas de software para pangenómica". Genómica, proteómica y bioinformática . 13 (1): 73–6. doi :10.1016/j.gpb.2015.01.007. PMC 4411478 . PMID  25721608. 
  56. ^ Laing C, Buchanan C, Taboada EN, Zhang Y, Kropinski A, Villegas A, et al. (Septiembre de 2010). "Análisis de secuencia pangenoma utilizando Panseq: una herramienta en línea para el análisis rápido de regiones genómicas centrales y accesorias". Bioinformática BMC . 11 (1): 461. doi : 10.1186/1471-2105-11-461 . PMC 2949892 . PMID  20843356. 
  57. ^ Zhao Y, Wu J, Yang J, Sun S, Xiao J, Yu J (febrero de 2012). "PGAP: proceso de análisis de pangenomas". Bioinformática . 28 (3): 416–8. doi : 10.1093/bioinformática/btr655. PMC 3268234 . PMID  22130594. 
  58. ^ Chaudhari NM, Gupta VK, Dutta C (abril de 2016). "BPGA: un proceso de análisis pangenómico ultrarrápido". Informes científicos . 6 (24373): 24373. Código bibliográfico : 2016NatSR...624373C. doi :10.1038/srep24373. PMC 4829868 . PMID  27071527. 
  59. ^ ab Contreras-Moreira B, Vinuesa P (diciembre de 2013). "GET_HOMOLOGUES, un paquete de software versátil para análisis de pangenomas microbianos robusto y escalable". Microbiología Aplicada y Ambiental . 79 (24): 7696–701. Código bibliográfico : 2013ApEnM..79.7696C. doi :10.1128/AEM.02411-13. PMC 3837814 . PMID  24096415. 
  60. ^ Página AJ, Cummins CA, Hunt M, Wong VK, Reuters S, Holden MT y otros. (noviembre de 2015). "Roary: análisis rápido del genoma pan procariota a gran escala". Bioinformática . 31 (22): 3691–3. doi : 10.1093/bioinformática/btv421. PMC 4817141 . PMID  26198102. 
  61. ^ Bonnici V, Giugno R, Manca V (noviembre de 2018). "PanDelos: un método basado en diccionario para el descubrimiento de contenido pangenómico". Bioinformática BMC . 19 (Suplemento 15): 437. doi : 10.1186/s12859-018-2417-6 . PMC 6266927 . PMID  30497358. 
  62. ^ Guimarães LC, Florczak-Wyspianska J, de Jesus LB, Viana MV, Silva A, Ramos RT, et al. (Agosto de 2015). "Dentro del pangenoma: descripción general de métodos y software". Genómica actual . 16 (4): 245–52. doi :10.2174/1389202916666150423002311. PMC 4765519 . PMID  27006628. 
  63. ^ Golicz AA, Batley J, Edwards D (abril de 2016). "Hacia la pangenómica vegetal" (PDF) . Revista de Biotecnología Vegetal . 14 (4): 1099–105. doi :10.1111/pbi.12499. PMID  26593040.
  64. ^ Sheikhizadeh S, Schranz ME, Akdel M, de Ridder D, Smit S (septiembre de 2016). "PanTools: representación, almacenamiento y exploración de datos pangenómicos". Bioinformática . 32 (17): i487–i493. doi : 10.1093/bioinformática/btw455 . PMID  27587666.
  65. ^ ab Ding W, Baumdicker F, Neher RA (enero de 2018). "panX: análisis y exploración del pangenoma". Investigación de ácidos nucleicos . 46 (1): e5. doi : 10.1093/nar/gkx977. PMC 5758898 . PMID  29077859. 
  66. ^ Xu L, Dong Z, Fang L, Luo Y, Wei Z, Guo H, et al. (julio de 2019). "OrthoVenn2: un servidor web para la comparación del genoma completo y la anotación de grupos ortólogos en múltiples especies". Investigación de ácidos nucleicos . 47 (W1): W52-W58. doi :10.1093/nar/gkz333. PMC 6602458 . PMID  31053848. 
  67. ^ Zhang B, Huang H, Tibbs-Cortes LE, Vanous A, Zhang Z, Sanguinet K, Garland-Campbell KA, Yu J, Li X (2023). "Simplifique el aprendizaje automático no supervisado para estudiar y representar gráficamente haplotipos basados ​​en indel a partir de pangenomas". Planta Molecular . 16 (6): 975–978. doi : 10.1016/j.molp.2023.05.005 . PMID  37202927.
  68. ^ Bonnici V, Maresi E, Giugno R (2020). "Desafíos en los enfoques orientados a genes para el descubrimiento del contenido del pangenoma". Sesiones informativas en Bioinformática . 22 (3). doi : 10.1093/bib/bbaa198. ISSN  1477-4054. PMID  32893299.