GeneNetwork es una base de datos combinada y un recurso de software de análisis de datos bioinformáticos de código abierto para la genética de sistemas. [1] Este recurso se utiliza para estudiar las redes reguladoras de genes que vinculan las diferencias en las secuencias de ADN con las diferencias correspondientes en la expresión de genes y proteínas y con la variación en rasgos como el riesgo de salud y enfermedad. Los conjuntos de datos en GeneNetwork generalmente se componen de grandes colecciones de genotipos (por ejemplo, SNP ) y fenotipos de grupos de individuos, incluidos humanos, cepas de ratones y ratas, y organismos tan diversos como Drosophila melanogaster , Arabidopsis thaliana y cebada . [2] La inclusión de genotipos hace que sea práctico realizar un mapeo genético basado en la web para descubrir aquellas regiones de los genomas que contribuyen a las diferencias entre individuos en los niveles de ARNm, proteínas y metabolitos, así como diferencias en la función celular, la anatomía, la fisiología y el comportamiento.
El desarrollo de GeneNetwork comenzó en el Centro de Ciencias de la Salud de la Universidad de Tennessee en 1994 como una versión basada en la web del Diccionario portátil del genoma del ratón (1994). [3] GeneNetwork es el primer servicio web en funcionamiento continuo y el más antiguo en investigación biomédica [consulte https://en.wikipedia.org/wiki/Genenetwork/List_of_websites_founded_before_1995]. En 1999, el Diccionario portátil de genes se combinó con el programa de mapeo QT Map Manager de Kenneth F. Manly para producir un sistema en línea para el análisis genético en tiempo real. [4] A principios de 2003, se incorporaron los primeros grandes conjuntos de datos de expresión genética de Affymetrix (ARNm de cerebro de ratón completo y células madre hematopoyéticas) y el sistema pasó a llamarse WebQTL. [5] [6] GeneNetwork ahora es desarrollado por un grupo internacional de desarrolladores y tiene sitios espejo y de desarrollo en Europa, Asia y Australia. Los servicios de producción están alojados en sistemas en el Centro de Ciencias de la Salud de la Universidad de Tennessee con una instancia de respaldo en Europa.
La versión de producción actual de GeneNetwork (también conocida como GN2) se lanzó en 2016. [7] La versión actual de GeneNetwork utiliza la misma base de datos que su predecesora, GN1, pero tiene un código fuente abierto mucho más modular y fácil de mantener (disponible en GitHub). GeneNetwork ahora también tiene nuevas características importantes, que incluyen soporte para:
GeneNetwork consta de dos componentes principales:
Generalmente se obtienen cuatro niveles de datos para cada familia o población:
Los tipos de datos combinados se almacenan juntos en una base de datos relacional y un servidor de archivos IPSF, y se organizan y agrupan conceptualmente por especie, cohorte y familia. El sistema se implementa como una pila LAMP (paquete de software) . El código y una versión simplificada de la base de datos MariaDB están disponibles en GitHub.
GeneNetwork es utilizado principalmente por investigadores, pero también se ha adoptado con éxito para cursos de grado y posgrado en genética y bioinformática (ver ejemplo en YouTube), bioinformática, fisiología y psicología. [11] Los investigadores y estudiantes suelen recuperar conjuntos de genotipos y fenotipos de una o más familias y utilizan funciones estadísticas y de mapeo integradas para explorar las relaciones entre las variables y ensamblar redes de asociaciones. Los pasos clave incluyen el análisis de estos factores:
Los conjuntos de datos de rasgos y expresión molecular son enviados directamente por los investigadores o se extraen de repositorios como el Centro Nacional de Información Biotecnológica Gene Expression Omnibus. Los datos cubren una variedad de células y tejidos, desde poblaciones de células individuales del sistema inmunológico, tejidos específicos (retina, corteza prefrontal), hasta sistemas completos (cerebro completo, pulmón, músculo, corazón, grasa, riñón, flor, embriones de plantas completas). Un conjunto de datos típico cubre cientos de individuos completamente genotipados y también puede incluir réplicas técnicas y biológicas. Los genotipos y fenotipos generalmente se toman de artículos revisados por pares. GeneNetwork incluye archivos de anotación para varias plataformas de perfilado de ARN (Affymetrix, Illumina y Agilent). También están disponibles datos proteómicos, metabolómicos, epigenéticos y metagenómicos cuantitativos y de secuenciación de ARN para varias especies, incluidos ratones y humanos.
En el sitio hay herramientas para una amplia gama de funciones que van desde simples representaciones gráficas de la variación en la expresión genética u otros fenotipos, diagramas de dispersión de pares de rasgos (orden de Pearson o de rango), construcción de gráficos de redes simples y complejos, análisis de componentes principales y rasgos sintéticos, mapeo de QTL mediante regresión de marcadores, mapeo de intervalos y escaneos de pares para interacciones epistáticas. La mayoría de las funciones funcionan con hasta 100 rasgos y varias funciones funcionan con un transcriptoma completo .
La base de datos se puede explorar y buscar en la página de búsqueda principal. Hay disponible un tutorial en línea. Los usuarios también pueden descargar los conjuntos de datos primarios como archivos de texto, Excel o, en el caso de los gráficos de red, como SBML . A partir de 2017, GN2 está disponible como versión beta.
GeneNetwork es un proyecto de código abierto publicado bajo la Licencia Pública General Affero (AGPLv3). La mayoría del código está escrito en Python, pero incluye módulos y otro código escrito en C, R y JavaScript. El código es principalmente Python 2.4. GN2 está escrito principalmente en Python 2.7 en un marco Flask con plantillas HTML Jinja 2), pero con la conversión a Python 3.X planificada para los próximos años. GN2 llama a muchos procedimientos estadísticos escritos en el lenguaje de programación R. El código fuente original de 2010 junto con una base de datos compacta están disponibles en SourceForge. Si bien GN1 se mantuvo activamente hasta 2019 en GitHub , a partir de 2020 todo el trabajo se centra en GN2.
{{cite book}}
: |journal=
ignorado ( ayuda )Otros sistemas de genética y bases de datos de redes