Análisis de enriquecimiento del conjunto de genes

El análisis de enriquecimiento de conjuntos de genes (GSEA) (también llamado análisis de enriquecimiento funcional o análisis de enriquecimiento de vías ) es un método para identificar clases de genes o proteínas que están sobrerrepresentadas en un gran conjunto de genes o proteínas, y pueden tener una asociación con diferentes fenotipos (por ejemplo, diferentes patrones de crecimiento de organismos o enfermedades). El método utiliza enfoques estadísticos para identificar grupos de genes significativamente enriquecidos o empobrecidos. Las tecnologías transcriptómicas y los resultados de la proteómica a menudo identifican miles de genes, que se utilizan para el análisis. ^[1]

Los investigadores que realizan experimentos de alto rendimiento que generan conjuntos de genes (por ejemplo, genes que se expresan de manera diferente en diferentes condiciones) a menudo desean recuperar un perfil funcional de ese conjunto de genes para comprender mejor los procesos biológicos subyacentes. Esto se puede hacer comparando el conjunto de genes de entrada con cada uno de los contenedores (términos) en la ontología genética ; se puede realizar una prueba estadística para cada contenedor para ver si está enriquecido con los genes de entrada.

Fondo

Tras la finalización del Proyecto Genoma Humano , el problema de cómo interpretarlo y analizarlo permaneció. Para buscar genes asociados con enfermedades, se utilizaron microarreglos de ADN para medir la cantidad de expresión génica en diferentes células. Se llevaron a cabo microarreglos en miles de genes diferentes y se compararon los resultados de dos categorías de células diferentes, por ejemplo, células normales frente a células cancerosas. Sin embargo, este método de comparación no es lo suficientemente sensible para detectar las diferencias sutiles entre la expresión de genes individuales, porque las enfermedades suelen involucrar grupos enteros de genes. ^[2] Múltiples genes están vinculados a una única vía biológica, por lo que es el cambio aditivo en la expresión dentro de los conjuntos de genes lo que conduce a la diferencia en la expresión fenotípica. El análisis de enriquecimiento de conjuntos de genes se desarrolló ^[2] para centrarse en los cambios de expresión en grupos de conjuntos de genes definidos a priori. Al hacerlo, este método resuelve el problema de los pequeños cambios indetectables en la expresión de genes individuales. ^[3]

Métodos

El análisis de enriquecimiento de conjuntos de genes utiliza conjuntos de genes a priori que se han agrupado por su participación en la misma vía biológica o por ubicación proximal en un cromosoma. ^[1] Se puede encontrar una base de datos de estos conjuntos predefinidos en la base de datos de firmas moleculares (MSigDB). ^[4]^[5] En GSEA, los microarrays de ADN, o ahora RNA-Seq , todavía se realizan y comparan entre dos categorías de células, pero en lugar de centrarse en genes individuales en una lista larga, el enfoque se pone en un conjunto de genes. ^[1] Los investigadores analizan si la mayoría de los genes en el conjunto caen en los extremos de esta lista: la parte superior e inferior de la lista corresponden a las mayores diferencias en la expresión entre los dos tipos de células. Si el conjunto de genes cae en la parte superior (sobreexpresado) o inferior (subexpresado), se cree que está relacionado con las diferencias fenotípicas.

En el método que normalmente se conoce como GSEA estándar, hay tres pasos involucrados en el proceso analítico. ^[1]^[2] Los pasos generales se resumen a continuación:

Calcule el puntaje de enriquecimiento (ES) que representa la cantidad en la que los genes del conjunto están sobrerrepresentados en la parte superior o inferior de la lista. Este puntaje es una estadística similar a la de Kolmogorov-Smirnov . ^[1]^[2]
Estimar la significancia estadística del ES. Este cálculo se realiza mediante una prueba de permutación basada en el fenotipo para producir una distribución nula para el ES. El valor P se determina mediante comparación con la distribución nula. ^[1]^[2]
- Calcular la significancia de esta manera prueba la dependencia del conjunto de genes de las etiquetas diagnósticas/fenotípicas ^[1]^[2]
Ajuste para pruebas de hipótesis múltiples cuando se analiza una gran cantidad de conjuntos de genes a la vez. Los puntajes de enriquecimiento para cada conjunto se normalizan y se calcula una tasa de descubrimiento falso . ^[1]^[2]

Esto se puede describir como:

${\begin{alignedat}{1}&P_{hit}(S,i)=\sum _{g_{j}\in S,j\leq i}{\dfrac {|r_{j}|^{p}}{N_{R}}};\\[0.6ex]&P_{miss}(S,i)=\sum _{g_{j}\not \in S,j\leq i}{\dfrac {1}{N-N_{H}}};\\[0.6ex]&N_{R}=\sum _{g_{j}\in S}|r_{j}|^{p};\\[0.6ex]&ES=P(S,i)=P_{hit}(S,i)-P_{miss}(S,i)=max(|P_{hit}(S,i)-P_{miss}(S,i)|)\\[0.6ex]\end{alignedat}}$ Donde es el rango del gen, la potencia generalmente se establece en 1 (si fuera 0, sería equivalente a la prueba de Kolmogorov-Smirnov). ${\estilo de visualización r}$ ${\estilo de visualización p}$

Limitaciones y alternativas propuestas

MAR

Cuando se propuso por primera vez el GSEA en 2003, surgieron algunas preocupaciones inmediatas con respecto a su metodología. Estas críticas llevaron al uso de la prueba de Kolmogorov-Smirnov ponderada por correlación , el ES normalizado y el cálculo de la tasa de descubrimiento falso, todos los cuales son los factores que actualmente definen el GSEA estándar. ^[6] Sin embargo, el GSEA ahora también ha sido criticado por el hecho de que su distribución nula es superflua y demasiado difícil para que valga la pena calcularla, así como por el hecho de que su estadística similar a Kolmogorov-Smirnov no es tan sensible como la original. ^[6] Como alternativa, se propuso el método conocido como Análisis de Enriquecimiento Más Simple (SEA, por sus siglas en inglés). Este método supone la independencia de los genes y utiliza un enfoque más simple para calcular la prueba t. Sin embargo, se cree que estas suposiciones son de hecho demasiado simplificadoras y no se puede ignorar la correlación genética. ^[6]

SGSE

Otra limitación del análisis de enriquecimiento de conjuntos de genes es que los resultados dependen en gran medida del algoritmo que agrupa los genes y del número de grupos que se estén probando. ^[7] El enriquecimiento espectral de conjuntos de genes (SGSE) es una prueba propuesta y no supervisada. Los fundadores del método afirman que es una mejor manera de encontrar asociaciones entre los conjuntos de genes de MSigDB y los datos de microarrays. Los pasos generales incluyen:

1. Cálculo de la asociación entre componentes principales y conjuntos de genes. ^[7]

2. Utilizando el método Z ponderado para calcular la asociación entre los conjuntos de genes y la estructura espectral de los datos. ^[7]

Herramientas

El GSEA utiliza estadísticas complejas, por lo que requiere un programa informático para ejecutar los cálculos. El GSEA se ha convertido en una práctica estándar y existen muchos sitios web y programas descargables que proporcionan los conjuntos de datos y ejecutan el análisis.

MOET

Multi-Ontology Enrichment Tool (MOET) es una herramienta de análisis de ontología basada en la web que proporciona funcionalidad para múltiples ontologías, incluidas las entidades Disease, GO, Pathway, Phenotype y Chemical (ChEBI) para múltiples especies, incluidas la rata, el ratón, el ser humano, el bonobo, la ardilla, el perro, el cerdo, la chinchilla, la rata topo desnuda y el vervet (mono verde). ^[8] Produce un gráfico descargable y una lista de términos estadísticamente sobrerrepresentados en la lista de genes del usuario utilizando una distribución hipergeométrica. MOET también muestra la corrección de Bonferroni y la razón de probabilidades correspondientes en la página de resultados. Es fácil de usar y los resultados se proporcionan con unos pocos clics en segundos; no se requieren instalaciones de software ni habilidades de programación. Además, MOET se actualiza semanalmente, lo que proporciona al usuario los datos más recientes para los análisis.

NASQAR

NASQAR (Nucleic Acid SeQuence Analysis Resource) es una plataforma web de código abierto para el análisis y visualización de datos de secuenciación de alto rendimiento. ^[9]^[10] GSEA se puede ejecutar utilizando el paquete clusterProfiler basado en R. ^[11] NASQAR actualmente admite el enriquecimiento de GO Term y KEGG Pathway con todos los organismos respaldados por una base de datos Org.Db. ^[12]

Mapa de registro de plantas

Está disponible la anotación de ontología genética (GO) para 165 especies de plantas y el análisis de enriquecimiento de GO. ^[13]

Base de datos MSig

La base de datos de firmas moleculares alberga una amplia colección de conjuntos de genes anotados que se pueden utilizar con la mayoría del software GSEA. ^[14]

Instituto Broad

El sitio web del Broad Institute está en cooperación con MSigDB y tiene un software GSEA descargable, así como un tutorial general. ^[15]

WebGestalt

WebGestalt ^[16] es un conjunto de herramientas de análisis de conjuntos de genes basado en la web. Admite tres métodos bien establecidos y complementarios para el análisis de enriquecimiento, incluidos el análisis de sobrerrepresentación (ORA), el análisis de enriquecimiento de conjuntos de genes (GSEA) y el análisis basado en topología de red (NTA). El análisis se puede realizar en 12 organismos y 321.251 categorías funcionales utilizando 354 identificadores de genes de varias bases de datos y plataformas tecnológicas.

Enriquecer

Enrichr ^[17]^[18]^[19] es una herramienta de análisis de enriquecimiento de conjuntos de genes para conjuntos de genes de mamíferos. Contiene bibliotecas de antecedentes para la regulación de la transcripción, vías e interacciones de proteínas, ontologías que incluyen GO y las ontologías de fenotipo humano y de ratón, firmas de células tratadas con medicamentos, conjuntos de genes asociados con enfermedades humanas y expresión de genes en diferentes células y tejidos. Las bibliotecas de antecedentes provienen de más de 200 recursos y contienen más de 450.000 conjuntos de genes anotados. Se puede acceder a la herramienta a través de API y proporciona diferentes formas de visualizar los resultados. ^[20]

GenSCF

GeneSCF es una herramienta de enriquecimiento funcional en tiempo real con soporte para múltiples organismos ^[21] y está diseñada para superar los problemas asociados con el uso de recursos y bases de datos obsoletos. ^[22] Ventajas de usar GeneSCF: análisis en tiempo real, los usuarios no tienen que depender de herramientas de enriquecimiento para actualizarse, es fácil para los biólogos computacionales integrar GeneSCF con su flujo de trabajo de NGS, admite múltiples organismos, análisis de enriquecimiento para múltiples listas de genes utilizando múltiples bases de datos de origen en una sola ejecución, recuperar o descargar términos/rutas/funciones GO completos con genes asociados como un formato de tabla simple en un archivo de texto sin formato. ^[23]^[24]

DAVID

DAVID es la base de datos para anotación, visualización y descubrimiento integrado, una herramienta bioinformática que reúne información de la mayoría de las principales fuentes bioinformáticas, con el objetivo de analizar grandes listas de genes de una manera de alto rendimiento . ^[25] DAVID va más allá del GSEA estándar con funciones adicionales como cambiar entre identificadores de genes y proteínas a escala del genoma, ^[25] sin embargo, las anotaciones utilizadas por DAVID no se actualizaron desde octubre de 2016 hasta diciembre de 2021, ^[26] lo que puede tener un impacto considerable en la interpretación práctica de los resultados. ^[27] Sin embargo, una actualización más reciente se realizó en 2021 ^[26]

Metapaisaje

Metascape es un portal de análisis de listas de genes orientado a biólogos. ^[28] Metascape integra análisis de enriquecimiento de vías, análisis de complejos proteicos y metanálisis de múltiples listas en un flujo de trabajo integrado al que se puede acceder a través de una interfaz de usuario significativamente simplificada. Metascape mantiene la precisión del análisis actualizando sus 40 bases de conocimiento subyacentes mensualmente. Metascape presenta los resultados mediante gráficos fáciles de interpretar, hojas de cálculo y presentaciones de calidad de publicación, y está disponible de forma gratuita. ^[29]

Amigo 2

El consorcio Gene Ontology (GO) también ha desarrollado su propia herramienta de enriquecimiento de términos GO en línea, ^[30] que permite un análisis de enriquecimiento específico de especies en comparación con la base de datos completa, bases de datos GO de grano grueso o referencias personalizadas. ^[31]

EXCELENTE

La herramienta de enriquecimiento de anotaciones de regiones genómicas (GREAT) es un software que aprovecha los dominios reguladores para asociar mejor los términos de ontología génica con los genes. ^[32]^[33] Su propósito principal es identificar vías y procesos que están significativamente asociados con la actividad de regulación de factores. Este método mapea genes con regiones reguladoras a través de una prueba hipergeométrica sobre genes, infiriendo dominios reguladores de genes proximales. Esto se hace utilizando la fracción total del genoma asociado con un término de ontología dado como la fracción esperada de regiones de entrada asociadas con el término por casualidad. El enriquecimiento se calcula por todas las regiones reguladoras, y se realizaron varios experimentos para validar GREAT, uno de los cuales fueron análisis de enriquecimiento realizados en 8 conjuntos de datos ChIP-seq . ^[32]

Diversión rica

La herramienta de análisis de enriquecimiento funcional (FunRich) ^[34] se utiliza principalmente para el enriquecimiento funcional y el análisis de red de datos ómicos . ^[35]

Función asociada

La herramienta FuncAssociate permite realizar análisis de ontología genética y de enriquecimiento personalizado. ^[36] Permite ingresar conjuntos ordenados, así como archivos de espacio genético ponderados para el fondo. ^[37]

InterMina

Las instancias de InterMine proporcionan automáticamente análisis de enriquecimiento ^[38] para conjuntos de genes cargados y otras entidades biológicas.

Paquete ToppGene

ToppGene es un portal único para el análisis de enriquecimiento de listas de genes y la priorización de genes candidatos basado en anotaciones funcionales y redes de interacciones de proteínas. ^[39] Desarrollado y mantenido por la División de Informática Biomédica del Centro Médico del Hospital de Niños de Cincinnati .

QUÉ SAGE

El análisis cuantitativo de conjuntos para la expresión génica (QuSAGE) es un método computacional para el análisis de enriquecimiento de conjuntos de genes. ^[40] QuSAGE mejora la potencia al tener en cuenta las correlaciones entre genes y cuantifica la actividad del conjunto de genes con una función de densidad de probabilidad (PDF) completa. A partir de esta PDF, se pueden extraer fácilmente los valores P y los intervalos de confianza . La preservación de la PDF también permite el análisis post-hoc (por ejemplo, comparaciones por pares de la actividad del conjunto de genes) mientras se mantiene la trazabilidad estadística. La aplicabilidad de QuSAGE se ha extendido a estudios longitudinales al agregar funcionalidad para modelos lineales mixtos generales. ^[41] El NIH/NIAID utilizó QuSAGE para identificar firmas transcripcionales de referencia que se asociaron con las respuestas de la vacunación contra la influenza humana . ^[42] QuSAGE está disponible como un paquete R/ Bioconductor . ^[43]

Explosión2GO

Blast2GO es una plataforma bioinformática para la anotación funcional y el análisis de conjuntos de datos genómicos. ^[44] Esta herramienta permite realizar análisis de enriquecimiento de conjuntos de genes, ^[45] entre otras funciones.

g:Perfilador

g:Profiler es un conjunto de herramientas para encontrar categorías biológicas enriquecidas en listas de genes, conversiones entre identificadores de genes y asignaciones a sus ortólogos. ^[46] g:Profiler se basa en Ensembl como fuente de datos principal y sigue su ciclo de publicación trimestral mientras actualiza las otras fuentes de datos simultáneamente. g:Profiler admite cerca de 500 especies y cepas, incluidos vertebrados, plantas, hongos, insectos y parásitos.

Aplicaciones

Estudios de asociación de todo el genoma

Los polimorfismos de un solo nucleótido , o SNP, son mutaciones de una sola base que pueden estar asociadas con enfermedades. Un cambio de base tiene el potencial de afectar la proteína que resulta de la expresión de ese gen; sin embargo, también tiene el potencial de no tener ningún efecto en absoluto. Los estudios de asociación de todo el genoma (GWAS) son comparaciones entre genotipos sanos y enfermos para tratar de encontrar SNP que están sobrerrepresentados en los genomas de la enfermedad y podrían estar asociados con esa afección. Antes de GSEA, la precisión de los estudios de asociación de SNP de todo el genoma estaba severamente limitada por un alto número de falsos positivos. ^[47] La teoría de que los SNP que contribuyen a una enfermedad tienden a agruparse en un conjunto de genes que están todos involucrados en la misma vía biológica, es en lo que se basa el método GSEA-SNP. Esta aplicación de GSEA no solo ayuda en el descubrimiento de SNP asociados a enfermedades, sino que ayuda a iluminar las vías y mecanismos correspondientes de las enfermedades. ^[47]

Parto prematuro espontáneo

Los métodos de enriquecimiento de conjuntos de genes condujeron al descubrimiento de nuevos genes sospechosos y vías biológicas relacionadas con los nacimientos prematuros espontáneos . ^{[48] Las secuencias} del exoma de mujeres que habían experimentado SPTB se compararon con las de mujeres del Proyecto 1000 Genomas, utilizando una herramienta que puntuaba las posibles variantes causantes de la enfermedad. Los genes con puntuaciones más altas se ejecutaron a través de diferentes programas para agruparlos en conjuntos de genes basados en vías y grupos de ontología. Este estudio encontró que las variantes se agruparon significativamente en conjuntos relacionados con varias vías, todas sospechosas de SPTB. ^[48]

Perfil de células cancerosas

El análisis de enriquecimiento de conjuntos de genes se puede utilizar para comprender los cambios que experimentan las células durante la carcinogénesis y la metástasis . En un estudio, se realizaron microarrays en metástasis de carcinoma de células renales , tumores renales primarios y tejido renal normal, y los datos se analizaron utilizando GSEA. ^[49] Este análisis mostró cambios significativos de expresión en genes involucrados en vías que no se han asociado previamente con la progresión del cáncer renal. A partir de este estudio, GSEA ha proporcionado nuevos objetivos potenciales para la terapia del carcinoma de células renales.

Esquizofrenia

La GSEA se puede utilizar para ayudar a comprender los mecanismos moleculares de trastornos complejos. La esquizofrenia es un trastorno en gran medida hereditario, pero también es muy complejo, y el inicio de la enfermedad involucra a muchos genes que interactúan dentro de múltiples vías, así como la interacción de esos genes con factores ambientales. Por ejemplo, los cambios epigenéticos, como la metilación del ADN , se ven afectados por el medio ambiente, pero también dependen inherentemente del ADN mismo. La metilación del ADN es el cambio epigenético mejor estudiado, y recientemente se analizó utilizando GSEA en relación con los fenotipos intermedios relacionados con la esquizofrenia. ^[50] Los investigadores clasificaron los genes por su correlación entre los patrones de metilación y cada uno de los fenotipos. Luego utilizaron GSEA para buscar un enriquecimiento de genes que se prevé que sean el objetivo de los microARN en la progresión de la enfermedad. ^[50]

Depresión

La GSEA puede ayudar a proporcionar evidencia molecular de la asociación de vías biológicas con enfermedades. Estudios previos han demostrado que los síntomas de depresión a largo plazo están correlacionados con cambios en la respuesta inmune y las vías inflamatorias. ^[51] Se buscó evidencia genética y molecular para respaldar esto. Los investigadores tomaron muestras de sangre de pacientes con depresión y utilizaron datos de expresión de todo el genoma, junto con GSEA para encontrar diferencias de expresión en conjuntos de genes relacionados con las vías inflamatorias. Este estudio encontró que aquellas personas que calificaron con los síntomas de depresión más severos también tenían diferencias de expresión significativas en esos conjuntos de genes, y este resultado respalda la hipótesis de asociación. ^[51]

Véase también

Enriquecimiento de términos de ontología genética

Referencias

^ abcdefgh Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, et al. (octubre de 2005). "Análisis de enriquecimiento del conjunto de genes: un enfoque basado en el conocimiento para interpretar los perfiles de expresión de todo el genoma". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (43): 15545–15550. doi : 10.1073/pnas.0506580102 . PMC 1239896 . PMID 16199517.
^ abcdefg Mootha VK, Lindgren CM, Eriksson KF, Subramanian A, Sihag S, Lehar J, et al. (julio de 2003). "Los genes que responden a PGC-1alfa y que están implicados en la fosforilación oxidativa se regulan de forma coordinada a la baja en la diabetes humana". Nature Genetics . 34 (3): 267–273. doi :10.1038/ng1180. PMID 12808457. S2CID 13940856.
^ Maleki F, Ovens K, Hogan DJ, Kusalik AJ (2020). "Análisis del conjunto de genes: desafíos, oportunidades e investigación futura". Frontiers in Genetics . 11 : 654. doi : 10.3389/fgene.2020.00654 . PMC 7339292 . PMID 32695141.
^ Liberzon A, Birger C, Thorvaldsdóttir H, Ghandi M, Mesirov JP, Tamayo P (diciembre de 2015). "La colección de conjuntos de genes distintivos de la Base de datos de firmas moleculares (MSigDB)". Cell Systems . 1 (6): 417–425. doi :10.1016/j.cels.2015.12.004. PMC 4707969 . PMID 26771021.
^ "Base de datos de firmas moleculares (MSigDB) 3.0 (Descarga en PDF disponible)". ResearchGate .
^ abc Tamayo P, Steinhardt G, Liberzon A, Mesirov JP (febrero de 2016). "Las limitaciones del análisis de enriquecimiento de conjuntos de genes simples asumiendo la independencia de los genes". Métodos estadísticos en investigación médica . 25 (1): 472–487. arXiv : 1110.4128 . doi :10.1177/0962280212460441. PMC 3758419 . PMID 23070592.
^ abc Frost HR, Li Z, Moore JH (marzo de 2015). "Enriquecimiento del conjunto de genes espectrales (SGSE)". BMC Bioinformatics . 16 (1): 70. doi : 10.1186/s12859-015-0490-7 . PMC 4365810 . PMID 25879888.
^ Vedi M, Nalabolu HS, Lin CW, Hoffman MJ, Smith JR, Brodie K, et al. (abril de 2022). "MOET: una herramienta de enriquecimiento de conjuntos de genes basada en la web en la base de datos del genoma de la rata para análisis multiontología y multiespecie". Genética . 220 (4). doi :10.1093/genetics/iyac005. PMC 8982048 . PMID 35380657.
^ Yousif A, Drou N, Rowe J, Khalfan M, Gunsalus KC (junio de 2020). "NASQAR: una plataforma basada en la web para el análisis y visualización de datos de secuenciación de alto rendimiento". BMC Bioinformatics . 21 (1): 267. bioRxiv 10.1101/709980 . doi : 10.1186/s12859-020-03577-4 . PMC 7322916 . PMID 32600310.
^ "NASQAR: recurso de análisis de secuencias de ácidos nucleicos".
^ Yu G, Wang LG, Han Y, He QY (mayo de 2012). "clusterProfiler: un paquete R para comparar temas biológicos entre grupos de genes". Omics . 16 (5): 284–287. doi :10.1089/omi.2011.0118. PMC 3339379 . PMID 22455463.
^ "Paquetes Org.Db" – vía Bioconductor.
^ Tian F, Yang DC, Meng YQ, Jin J, Gao G (enero de 2020). "PlantRegMap: trazado de mapas reguladores funcionales en plantas". Investigación de ácidos nucleicos . 48 (D1): D1104–D1113. doi :10.1093/nar/gkz1020. PMC 7145545 . PMID 31701126.
^ Liberzon A (2014). "Una descripción del sitio web de la Base de datos de firmas moleculares (MSigDB)". Redes transcripcionales de células madre . Métodos en biología molecular. Vol. 1150. Clifton, NJ: Springer. págs. 153–160. doi :10.1007/978-1-4939-0512-6_9. ISBN . 978-1-4939-0511-9. Número de identificación personal 24743996.
^ "GSEA | Tutorial de escritorio". software.broadinstitute.org .
^ "WebGestalt (kit de herramientas de análisis de genes basado en WEB)". www.webgestalt.org .
^ Chen EY, Tan CM, Kou Y, Duan Q, Wang Z, Meirelles GV, et al. (abril de 2013). "Enrichr: herramienta de análisis de enriquecimiento de listas de genes HTML5 interactiva y colaborativa". BMC Bioinformatics . 14 : 128. doi : 10.1186/1471-2105-14-128 . PMC 3637064 . PMID 23586463.
^ Kuleshov MV, Jones MR, Rouillard AD, Fernandez NF, Duan Q, Wang Z, et al. (julio de 2016). "Enrichr: un servidor web integral de análisis de enriquecimiento de conjuntos de genes, actualización de 2016". Nucleic Acids Research . 44 (W1): W90–W97. doi :10.1093/nar/gkw377. PMC 4987924 . PMID 27141961.
^ Xie Z, Bailey A, Kuleshov MV, Clarke DJ, Evangelista JE, Jenkins SL, et al. (marzo de 2021). "Descubrimiento de conocimiento del conjunto de genes con Enrichr". Protocolos actuales . 1 (3): e90. doi :10.1002/cpz1.90. PMC 8152575 . PMID 33780170.
^ "Laboratorio Ma'ayan - Biología de sistemas computacionales - Facultad de Medicina Icahn en el Monte Sinaí". labs.icahn.mssm.edu . 19 de septiembre de 2023.
^ Subhash S, Kanduri C (septiembre de 2016). "GeneSCF: una herramienta de enriquecimiento funcional basada en tiempo real con soporte para múltiples organismos". BMC Bioinformatics . 17 (1): 365. doi : 10.1186/s12859-016-1250-z . PMC 5020511 . PMID 27618934.
^ Wadi L, Meyer M, Weiser J, Stein LD, Reimand J (agosto de 2016). "Impacto de las anotaciones genéticas obsoletas en el análisis de enriquecimiento de vías". Nature Methods . 13 (9): 705–706. doi :10.1038/nmeth.3963. PMC 7802636 . PMID 27575621. S2CID 19548133.
^ "GeneSCF::Agrupamiento de conjuntos de genes basado en anotación funcional". genescf.kandurilab.org .
^ "Agrupamiento de conjuntos de genes basado en anotación funcional (GeneSCF)". www.biostars.org .
^ ab Huang DA, Sherman BT, Lempicki RA (2009). "Análisis sistemático e integrador de grandes listas de genes utilizando recursos bioinformáticos de DAVID". Nature Protocols . 4 (1): 44–57. doi :10.1038/nprot.2008.211. PMID 19131956. S2CID 10418677.
^ ab Información sobre la versión y el lanzamiento de DAVID, Recursos de bioinformática de DAVID 6.8
^ Huang DA, Sherman BT, Lempicki RA (1 de diciembre de 2008). "Análisis sistemático e integrador de grandes listas de genes utilizando recursos bioinformáticos de DAVID". Nature Protocols . 4 (1): 44–57. doi :10.1038/nprot.2008.211. PMID 19131956. S2CID 10418677.
^ Zhou Y, Zhou B, Pache L, Chang M, Khodabakhshi AH, Tanaseichuk O, et al. (abril de 2019). "Metascape proporciona un recurso orientado a los biólogos para el análisis de conjuntos de datos a nivel de sistemas". Nature Communications . 10 (1): 1523. Bibcode :2019NatCo..10.1523Z. doi :10.1038/s41467-019-09234-6. PMC 6447622 . PMID 30944313.
^ "Metascape". metascape.org . Consultado el 20 de diciembre de 2019 .
^ Consorcio de Ontología Genética. "AmiGO 2: Bienvenido". amigo.geneontology.org .
^ Blake JA, Christie KR, Dolan ME, Drabkin HJ, Hill DP, Ni L, et al. (Gene Ontology Consortium) (enero de 2015). "Gene Ontology Consortium: going forward". Nucleic Acids Research . 43 (número de la base de datos): D1049–D1056. doi :10.1093/nar/gku1179. PMC 4383973 . PMID 25428369.
^ ab McLean CY, Bristor D, Hiller M, Clarke SL, Schaar BT, Lowe CB, et al. (mayo de 2010). "GREAT mejora la interpretación funcional de las regiones cis-reguladoras". Nature Biotechnology . 28 (5): 495–501. doi :10.1038/nbt.1630. PMC 4840234 . PMID 20436461.
^ "GREAT Input: Genomic Regions Enrichment of Annotations Tool". Laboratorio Bejerano . Universidad de Stanford. Archivado desde el original el 3 de diciembre de 2018.
^ "FunRich:: Descargar". funrich.org .
^ Pathan M, Keerthikumar S, Ang CS, Gangoda L, Quek CY, Williamson NA, et al. (agosto de 2015). "FunRich: una herramienta de acceso abierto independiente de enriquecimiento funcional y análisis de redes de interacción". Proteomics . 15 (15): 2597–2601. doi :10.1002/pmic.201400515. PMID 25921073. S2CID 28583044.
^ Berriz GF, King OD, Bryant B, Sander C, Roth FP (diciembre de 2003). "Caracterización de conjuntos de genes con FuncAssociate". Bioinformática . 19 (18): 2502–4. doi :10.1093/bioinformatics/btg363. PMID 14668247.
^ Berriz GF, Beaver JE, Cenik C, Tasan M, Roth FP (noviembre de 2009). "Software de próxima generación para análisis de tendencias funcionales". Bioinformática . 25 (22): 3043–3044. doi :10.1093/bioinformatics/btp498. PMC 2800365 . PMID 19717575.
^ "Estadísticas de widgets de enriquecimiento de listas — Documentación de InterMine".
^ Chen J, Bardes EE, Aronow BJ, Jegga AG (julio de 2009). "ToppGene Suite para el análisis de enriquecimiento de listas de genes y la priorización de genes candidatos". Nucleic Acids Research . 37 (edición del servidor web): W305–W311. doi :10.1093/nar/gkp427. PMC 2703978 . PMID 19465376.
^ Yaari G, Bolen CR, Thakar J, Kleinstein SH (octubre de 2013). "Análisis cuantitativo de conjuntos de genes para la expresión génica: un método para cuantificar la expresión diferencial de conjuntos de genes, incluidas las correlaciones gen-gen". Nucleic Acids Research . 41 (18): e170. doi :10.1093/nar/gkt660. PMC 3794608 . PMID 23921631.
^ Turner JA, Bolen CR, Blankenship DM (agosto de 2015). "Análisis cuantitativo de conjuntos de genes generalizado para medidas repetidas, ajuste de factores de confusión y covariables continuas". BMC Bioinformatics . 16 : 272. doi : 10.1186/s12859-015-0707-9 . PMC 4551517 . PMID 26316107.
^ Avey S, Cheung F, Fermin D, Frelinger J, Gaujoux R, Gottardo R, et al. (Equipo del proyecto HIPC-CHI Signatures, Consorcio HIPC-I) (agosto de 2017). "El análisis multicohorte revela predictores transcripcionales basales de las respuestas a la vacunación contra la influenza". Science Immunology . 2 (14): eaal4656. doi :10.1126/sciimmunol.aal4656. PMC 5800877 . PMID 28842433.
^ Bolen C, Yaari G, Thakar J, Meng H, Turner J, Blankenship D, et al. (2017). "qusage: Análisis cuantitativo de conjuntos para la expresión genética". doi :10.18129/B9.bioc.qusage – vía Bioconductor.
^ Conesa A, Götz S, García-Gómez JM, Terol J, Talón M, Robles M (septiembre de 2005). "Blast2GO: una herramienta universal para la anotación, visualización y análisis en la investigación en genómica funcional". Bioinformática . 21 (18): 3674–3676. doi : 10.1093/bioinformatics/bti610 . PMID 16081474.
^ "Figura 3: Mapas de calor del análisis de enriquecimiento del conjunto de genes (GSEA) de DEG basados en datos de RNAseq en respuesta a estreses abióticos". www.nature.com . Consultado el 5 de septiembre de 2018 .
^ Berriz GF, King OD, Bryant B, Sander C, Roth FP (diciembre de 2003). "Caracterización de conjuntos de genes con FuncAssociate". Bioinformática . 19 (18). Oxford, Inglaterra: 2502–4. doi :10.1093/bioinformatics/btg363. PMID 14668247.
^ ab Holden M, Deng S, Wojnowski L, Kulle B (diciembre de 2008). "GSEA-SNP: aplicación del análisis de enriquecimiento de conjuntos de genes a los datos de SNP de estudios de asociación de todo el genoma". Bioinformática . 24 (23): 2784–2785. doi : 10.1093/bioinformatics/btn516 . PMID 18854360.
^ ab Manuck TA, Watkins S, Esplin MS, Parry S, Zhang H, Huang H, et al. (2016). "242: Investigación del enriquecimiento del conjunto de genes de la variación del exoma materno en el parto prematuro espontáneo (SPTB)". Revista estadounidense de obstetricia y ginecología . 214 (1): S142–S143. doi : 10.1016/j.ajog.2015.10.280 .
^ Maruschke M, Hakenberg OW, Koczan D, Zimmermann W, Stief CG, Buchner A (enero de 2014). "Perfiles de expresión del carcinoma de células renales metastásico mediante análisis de enriquecimiento de conjuntos de genes". Revista internacional de urología . 21 (1): 46–51. doi : 10.1111/iju.12183 . PMID 23634695. S2CID 33377555.
^ ab Hass J, Walton E, Wright C, Beyer A, Scholz M, Turner J, et al. (junio de 2015). "Asociaciones entre la metilación del ADN y los fenotipos intermedios relacionados con la esquizofrenia: un análisis de enriquecimiento del conjunto de genes". Progreso en neuropsicofarmacología y psiquiatría biológica . 59 : 31–39. doi :10.1016/j.pnpbp.2015.01.006. PMC 4346504. PMID 25598502 .
^ ab Elovainio M, Taipale T, Seppälä I, Mononen N, Raitoharju E, Jokela M, et al. (diciembre de 2015). "Las vías inmunoinflamatorias activadas están asociadas con síntomas depresivos de larga duración: evidencia de los análisis de enriquecimiento del conjunto de genes en el estudio de los jóvenes finlandeses". Revista de investigación psiquiátrica . 71 : 120–125. doi :10.1016/j.jpsychires.2015.09.017. PMID 26473696.

Lectura adicional

Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, et al. (octubre de 2005). "Análisis de enriquecimiento del conjunto de genes: un enfoque basado en el conocimiento para interpretar los perfiles de expresión de todo el genoma". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (43): 15545–15550. doi : 10.1073/pnas.0506580102 . PMC 1239896 . PMID 16199517.
Reimand J, Isserlin R, Voisin V, Kucera M, Tannus-Lopes C, Rostamianfar A, et al. (febrero de 2019). "Análisis de enriquecimiento de vías y visualización de datos ómicos utilizando g:Profiler, GSEA, Cytoscape y EnrichmentMap". Nature Protocols . 14 (2): 482–517. doi :10.1038/s41596-018-0103-9. PMC 6607905 . PMID 30664679.
Chicco D, Agapito G (agosto de 2022). "Nueve consejos rápidos para el análisis de enriquecimiento de vías". PLOS Computational Biology . 18 (8): e1010348. Bibcode :2022PLSCB..18E0348C. doi : 10.1371/journal.pcbi.1010348 . PMC 9371296 . PMID 35951505. S2CID 251494694.

Enlaces externos

Base de datos de firmas moleculares (MSigDB)