stringtranslate.com

Red genética

GeneNetwork es una base de datos combinada y un recurso de software de análisis de datos bioinformáticos de código abierto para la genética de sistemas. [1] Este recurso se utiliza para estudiar las redes reguladoras de genes que vinculan las diferencias en las secuencias de ADN con las diferencias correspondientes en la expresión de genes y proteínas y con la variación en rasgos como el riesgo de salud y enfermedad. Los conjuntos de datos en GeneNetwork generalmente se componen de grandes colecciones de genotipos (por ejemplo, SNP ) y fenotipos de grupos de individuos, incluidos humanos, cepas de ratones y ratas, y organismos tan diversos como Drosophila melanogaster , Arabidopsis thaliana y cebada . [2] La inclusión de genotipos hace que sea práctico realizar un mapeo genético basado en la web para descubrir aquellas regiones de los genomas que contribuyen a las diferencias entre individuos en los niveles de ARNm, proteínas y metabolitos, así como diferencias en la función celular, la anatomía, la fisiología y el comportamiento.

Historia

El desarrollo de GeneNetwork comenzó en el Centro de Ciencias de la Salud de la Universidad de Tennessee en 1994 como una versión basada en la web del Diccionario portátil del genoma del ratón (1994). [3] GeneNetwork es el primer servicio web en funcionamiento continuo y el más antiguo en investigación biomédica [consulte https://en.wikipedia.org/wiki/Genenetwork/List_of_websites_founded_before_1995]. En 1999, el Diccionario portátil de genes se combinó con el programa de mapeo QT Map Manager de Kenneth F. Manly para producir un sistema en línea para el análisis genético en tiempo real. [4] A principios de 2003, se incorporaron los primeros grandes conjuntos de datos de expresión genética de Affymetrix (ARNm de cerebro de ratón completo y células madre hematopoyéticas) y el sistema pasó a llamarse WebQTL. [5] [6] GeneNetwork ahora es desarrollado por un grupo internacional de desarrolladores y tiene sitios espejo y de desarrollo en Europa, Asia y Australia. Los servicios de producción están alojados en sistemas en el Centro de Ciencias de la Salud de la Universidad de Tennessee con una instancia de respaldo en Europa.

La versión de producción actual de GeneNetwork (también conocida como GN2) se lanzó en 2016. [7] La ​​versión actual de GeneNetwork utiliza la misma base de datos que su predecesora, GN1, pero tiene un código fuente abierto mucho más modular y fácil de mantener (disponible en GitHub). GeneNetwork ahora también tiene nuevas características importantes, que incluyen soporte para:

Organización y uso

GeneNetwork consta de dos componentes principales:

Generalmente se obtienen cuatro niveles de datos para cada familia o población:

  1. Secuencias de ADN y genotipos
  2. Datos de expresión molecular a menudo generados mediante matrices , secuenciación de ARN , métodos epigenómicos, proteómicos, metabolómicos y metagenómicos (fenotipos moleculares)
  3. Fenotipos cuantitativos estándar que a menudo forman parte de un historial médico típico (por ejemplo, química sanguínea, peso corporal)
  4. Archivos de anotaciones y metadatos para rasgos y conjuntos de datos

Los tipos de datos combinados se almacenan juntos en una base de datos relacional y un servidor de archivos IPSF, y se organizan y agrupan conceptualmente por especie, cohorte y familia. El sistema se implementa como una pila LAMP (paquete de software) . El código y una versión simplificada de la base de datos MariaDB están disponibles en GitHub.

GeneNetwork es utilizado principalmente por investigadores, pero también se ha adoptado con éxito para cursos de grado y posgrado en genética y bioinformática (ver ejemplo en YouTube), bioinformática, fisiología y psicología. [11] Los investigadores y estudiantes suelen recuperar conjuntos de genotipos y fenotipos de una o más familias y utilizan funciones estadísticas y de mapeo integradas para explorar las relaciones entre las variables y ensamblar redes de asociaciones. Los pasos clave incluyen el análisis de estos factores:

  1. La gama de variación de los rasgos
  2. Covariación entre rasgos (diagramas de dispersión y correlaciones, análisis de componentes principales)
  3. Arquitectura de redes más amplias de rasgos
  4. Mapeo cuantitativo de locus de rasgos y modelos causales del vínculo entre diferencias de secuencia y diferencias de fenotipo

Fuentes de datos

Los conjuntos de datos de rasgos y expresión molecular son enviados directamente por los investigadores o se extraen de repositorios como el Centro Nacional de Información Biotecnológica Gene Expression Omnibus. Los datos cubren una variedad de células y tejidos, desde poblaciones de células individuales del sistema inmunológico, tejidos específicos (retina, corteza prefrontal), hasta sistemas completos (cerebro completo, pulmón, músculo, corazón, grasa, riñón, flor, embriones de plantas completas). Un conjunto de datos típico cubre cientos de individuos completamente genotipados y también puede incluir réplicas técnicas y biológicas. Los genotipos y fenotipos generalmente se toman de artículos revisados ​​por pares. GeneNetwork incluye archivos de anotación para varias plataformas de perfilado de ARN (Affymetrix, Illumina y Agilent). También están disponibles datos proteómicos, metabolómicos, epigenéticos y metagenómicos cuantitativos y de secuenciación de ARN para varias especies, incluidos ratones y humanos.

Herramientas y funciones

En el sitio hay herramientas para una amplia gama de funciones que van desde simples representaciones gráficas de la variación en la expresión genética u otros fenotipos, diagramas de dispersión de pares de rasgos (orden de Pearson o de rango), construcción de gráficos de redes simples y complejos, análisis de componentes principales y rasgos sintéticos, mapeo de QTL mediante regresión de marcadores, mapeo de intervalos y escaneos de pares para interacciones epistáticas. La mayoría de las funciones funcionan con hasta 100 rasgos y varias funciones funcionan con un transcriptoma completo .

La base de datos se puede explorar y buscar en la página de búsqueda principal. Hay disponible un tutorial en línea. Los usuarios también pueden descargar los conjuntos de datos primarios como archivos de texto, Excel o, en el caso de los gráficos de red, como SBML . A partir de 2017, GN2 está disponible como versión beta.

Código

GeneNetwork es un proyecto de código abierto publicado bajo la Licencia Pública General Affero (AGPLv3). La mayoría del código está escrito en Python, pero incluye módulos y otro código escrito en C, R y JavaScript. El código es principalmente Python 2.4. GN2 está escrito principalmente en Python 2.7 en un marco Flask con plantillas HTML Jinja 2), pero con la conversión a Python 3.X planificada para los próximos años. GN2 llama a muchos procedimientos estadísticos escritos en el lenguaje de programación R. El código fuente original de 2010 junto con una base de datos compacta están disponibles en SourceForge. Si bien GN1 se mantuvo activamente hasta 2019 en GitHub , a partir de 2020 todo el trabajo se centra en GN2.

Véase también

Referencias

  1. ^ Morahan, G; Williams, RW (2007). "Genética de sistemas: ¿la próxima generación en investigación genética?". Descifrando el control genómico de las reacciones inmunitarias . Simposios de la Fundación Novartis. Vol. 281. págs. 181–8, discusión 188–91, 208–9. doi :10.1002/9780470062128.ch15. ISBN 9780470062128. Número de identificación personal  17534074. {{cite book}}: |journal=ignorado ( ayuda )
  2. ^ Druka, A; Druka, I; Centeno, AG; Li, H; Sun, Z; Thomas, WT; Bonar, N; Steffenson, BJ; Ullrich, SE; Kleinhofs, Andris; Wise, Roger P; Close, Timothy J; Potokina, Elena; Luo, Zewei; Wagner, Carola; Schweizer, Günther F; Marshall, David F; Kearsey, Michael J; Williams, Robert W; Waugh, Robbie (2008). "Hacia análisis genéticos de sistemas en cebada: Integración de datos fenotípicos, de expresión y genotípicos en GeneNetwork". BMC Genetics . 9 : 73. doi : 10.1186/1471-2156-9-73 . PMC 2630324 . PMID  19017390. 
  3. ^ Williams, RW (1994). "El diccionario portátil del genoma del ratón: una base de datos personal para el mapeo genético y la biología molecular". Genoma de mamíferos . 5 (6): 372–5. doi :10.1007/bf00356557. PMID  8043953. S2CID  655396.
  4. ^ Chesler, EJ; Lu, L; Wang, J; Williams, RW; Manly, KF (2004). "WebQTL: análisis exploratorio rápido de la expresión génica y redes genéticas para el cerebro y el comportamiento". Nature Neuroscience . 7 (5): 485–6. doi :10.1038/nn0504-485. PMID  15114364. S2CID  20241963.
  5. ^ Chesler, EJ; Lu, L; Shou, S; Qu, Y; Gu, J; Wang, J; Hsu, HC; Mountz, JD; et al. (2005). "El análisis complejo de rasgos de la expresión génica descubre redes poligénicas y pleiotrópicas que modulan la función del sistema nervioso". Nature Genetics . 37 (3): 233–42. doi :10.1038/ng1518. PMID  15711545. S2CID  13189340.
  6. ^ Bystrykh, L; Weersing, E; Dontje, B; Sutton, S; Pletcher, MT; Wiltshire, T; Su, AI; Vellenga, E; et al. (2005). "Descubrimiento de vías reguladoras que afectan la función de las células madre hematopoyéticas mediante 'genómica genética'"". Nature Genetics . 37 (3): 225–32. doi :10.1038/ng1497. PMID  15711547. S2CID  5622506.
  7. ^ Sloan, Z (2016). "GeneNetwork: marco para la genética basada en la web". The Journal of Open Source Software . 1 (2): 25. Bibcode :2016JOSS....1...25S. doi : 10.21105/joss.00025 .
  8. ^ Zhou, X (2014). "Algoritmos de modelos mixtos lineales multivariados eficientes para estudios de asociación de todo el genoma". Nature Methods . 11 (2): 407–9. doi :10.1038/nmeth.2848. PMC 4211878 . PMID  24531419. 
  9. ^ Arends, D (2016). "Mapeo de loci de rasgos de correlación (CTL): inferencia de red de fenotipos sujeta al genotipo". The Journal of Open Source Software . 1 (6): 87. Bibcode :2016JOSS....1...87A. doi : 10.21105/joss.00087 .
  10. ^ Ziebarth, JD (2013). "Servidor web de red bayesiana: una herramienta integral para el modelado de redes biológicas". Bioinformática . 29 (2 1): 2803–3. doi : 10.1093/bioinformatics/btt472 . PMID  23969134.
  11. ^ Grisham, W; Schottler, NA; Valli-Marill, J; Beck, L; Beatty, J (2010). "Enseñanza de bioinformática y neuroinformática mediante herramientas gratuitas basadas en la web". CBE: Life Sciences Education . 9 (2): 98–107. doi :10.1187/cbe.09-11-0079. PMC 2879386 . PMID  20516355. 

Enlaces externos

Recursos relacionados

Otros sistemas de genética y bases de datos de redes