El personal de PomBase selecciona manualmente una amplia variedad de tipos de datos utilizando fuentes de bioinformática y literatura primaria, y se emplean numerosos mecanismos para garantizar la validez del contenido tanto sintáctico como biológico. [3]
Los tipos de datos curados incluyen:
Secuencia y características del genoma (por ejemplo, ubicación física de los genes en el genoma)
Funciones de las proteínas y del ARNnc , procesos celulares en los que participan y dónde se localizan
Sitios específicos de modificación de proteínas y cuándo ocurren
Ortólogos de genes de S. pombe de levaduras humanas y en ciernes (conjunto de datos seleccionado manualmente)
Metadatos de los conjuntos de datos cargados en el navegador del genoma
Asociaciones de enfermedades para cuando se sabe que el ortólogo humano causa la enfermedad
Datos sobre cuándo se expresan genes específicos
Datos de complementación para cuando existe complementación funcional entre un gen de levadura de fisión y un gen de otro organismo
Composición de subunidades de complejos
Organización de datos
La anotación de genes se puede ver a nivel específico de genes (en las páginas de genes) o a nivel específico de términos (en las páginas de términos de ontología). Esto permite:
Ver todas las anotaciones creadas para un gen, por ejemplo pat1
Ver todos los genes anotados con un término, por ejemplo citocinesis
Ver todas las anotaciones creadas a partir de una referencia específica, por ejemplo 26776736 Chica et al. 2016
Se puede acceder a los conjuntos de datos de todo el genoma (incluidos los conjuntos de datos de proteínas, todas las anotaciones, listas de ortólogos seleccionadas manualmente, etc.) desde la página de conjuntos de datos. Se puede acceder a los conjuntos de datos adecuados para visualizarse en un explorador de genomas y que se han cargado a través de la instancia JBrowse de PomBase.
PomBase utiliza varias ontologías biológicas para capturar información específica de genes, entre ellas:
Ontología genética (OG): se utiliza para describir las funciones enzimáticas, los roles biológicos y las ubicaciones celulares de los productos genéticos.
Ontología del fenotipo de la levadura de fisión (FYPO), [4] Se utiliza para asociar fenotipos con alelos de genes, en comparación con el fenotipo de la cepa de referencia.
Ontología de secuencias : se utiliza para describir características del ADN o de las proteínas.
Modificaciones de proteínas mediante PSI-MOD [5]
Estado de caracterización genética
La página GO slim ofrece una descripción general del "rol biológico" de todos los genes de levadura de fisión "conocidos": se trata de proteínas que se han caracterizado experimentalmente en la levadura de fisión o en otra especie y se han transferido por ortología.
Sorprendentemente, casi el 20% de los proteomas eucariotas, desde la levadura hasta los humanos, no están caracterizados en términos de las vías y procesos en los que participan estas proteínas, [6] lo que lo convierte en uno de los grandes problemas sin resolver en biología . El papel que desempeñan estas proteínas en la biología aún no se ha descubierto en ninguna especie. Para ayudar a la investigación sobre estas proteínas desconocidas, PomBase mantiene un inventario de proteínas de levadura de fisión no caracterizadas. La lista de genes prioritarios no estudiados representa el subconjunto de genes de levadura de fisión no caracterizados que se conservan en el hombre, lo que la convierte en un objetivo de investigación de especial prioridad.
Co-curación comunitaria
Para complementar el trabajo del pequeño equipo de curadores profesionales de PomBase, los investigadores de levadura de fisión contribuyen con anotaciones directamente a PomBase a través de un innovador esquema de curación comunitaria, para el cual se ha desarrollado una herramienta de curación en línea, Canto [ 7] . La curación comunitaria es revisada por el personal de PomBase, y esto da como resultado anotaciones altamente precisas y curadas en conjunto de manera efectiva. [8]
PomBase mantiene una página de estadísticas de anotaciones.
Actualizaciones de la base de conocimientos
Actualizaciones de noticias en la página de inicio de PomBase
Publicaciones en la lista de correo de la comunidad de investigación
Actualizaciones de la base de datos de la NAR (Investigación de ácidos nucleicos)
Tweets (@PomBase)
Grupo de Facebook
Grupo de Linkedin
Documentación
Pombase proporciona documentación y una sección de preguntas frecuentes.
El uso de PomBase como herramienta de investigación se explora en el capítulo del libro "Bases de datos genómicas eucariotas" (Métodos y protocolos). [9] Los desarrollos y actualizaciones se describen en los documentos de la base de datos NAR. [10] [11] [2]
Para una descripción detallada del uso de S. pombe como organismo modelo, consulte la introducción a la genética [12].
Referencias
^ Rutherford, Kim M.; Lera-Ramírez, Manuel; Wood, Valerie (2024). "PomBase: un recurso global de datos biológicos básicos: crecimiento, colaboración y sostenibilidad". Genética . doi : 10.1093/genetics/iyae007 . PMID 38376816.
^ ab Lock, A; Rutherford, K; Harris, MA; Hayles, J; Oliver, SG; Bähler, J; Wood, V (13 de octubre de 2018). "PomBase 2018: la reimplementación impulsada por el usuario de la base de datos de levadura de fisión proporciona acceso rápido e intuitivo a información diversa e interconectada". Investigación de ácidos nucleicos . 47 (D1): D821–D827. doi :10.1093/nar/gky961. PMC 6324063 . PMID 30321395.
^ Wood, V; Carbon, S; Harris, MA; Lock, A; Engel, SR; Hill, DP; Van Auken, K; Attrill, H; Feuermann, M; Gaudet, P; Lovering, RC; Poux, S; Rutherford, KM; Mungall, CJ (septiembre de 2020). "Term Matrix: un nuevo sistema de control de calidad de anotación de ontologías genéticas basado en patrones de coanotación de términos de ontología". Open Biology . 10 (9): 200149. doi : 10.1098/rsob.200149 . PMC 7536087 . PMID 32875947.
^ Harris MA, Lock A, Bähler J, Oliver SG, Wood V (julio de 2013). "FYPO: La ontología del fenotipo de la levadura de fisión". Bioinformática . 29 (13): 1671–8. doi :10.1093/bioinformatics/btt266. PMC 3694669 . PMID 23658422.
^ Montecchi-Palazzi, L; Beavis, R; Binz, PA; Chalkley, RJ; Cottrell, J; Creasy, D; Shofstahl, J; Seymour, SL; Garavelli, JS (agosto de 2008). "El estándar de la comunidad PSI-MOD para la representación de datos de modificación de proteínas". Nature Biotechnology . 26 (8): 864–6. doi :10.1038/nbt0808-864. PMID 18688235. S2CID 205270043.
^ Wood, V; Lock, A; Harris, MA; Rutherford, K; Bähler, J; Oliver, SG (28 de febrero de 2019). "Oculto a simple vista: ¿qué queda por descubrir en el proteoma eucariota?". Open Biology . 9 (2): 180241. doi :10.1098/rsob.180241. PMC 6395881 . PMID 30938578.
^ Rutherford KM, Harris MA, Lock A, Oliver SG, Wood V (junio de 2014). "Canto: una herramienta en línea para la curación de literatura comunitaria". Bioinformática . 30 (12): 1791–2. doi :10.1093/bioinformatics/btu103. PMC 4058955 . PMID 24574118.
^ Lock, A; Harris, MA; Rutherford, K; Hayles, J; Wood, V (1 de enero de 2020). "Curación comunitaria en PomBase: permite a los expertos en levadura de fisión proporcionar anotaciones detalladas, estandarizadas y compartibles a partir de publicaciones de investigación". Base de datos: The Journal of Biological Databases and Curation . 2020 . doi :10.1093/database/baaa028. PMC 7192550 . PMID 32353878.
^ Lock, A; Rutherford, K; Harris, MA; Wood, V (2018). "PomBase: el recurso científico para la levadura de fisión". Bases de datos genómicas eucariotas . Métodos en biología molecular. Vol. 1757. págs. 49–68. doi :10.1007/978-1-4939-7737-6_4. ISBN978-1-4939-7736-9. PMC 6440643 . PMID 29761456.
^ Wood V, Harris MA, McDowall MD, Rutherford K, Vaughan BW, Staines DM, Aslett M, Lock A, Bähler J, Kersey PJ, Oliver SG (enero de 2012). "PomBase: un recurso en línea completo para la levadura de fisión". Nucleic Acids Res. 40 (número de la base de datos): D695–9. doi :10.1093/nar/gkr853. PMC 3245111. PMID 22039153 .
^ McDowall MD, Harris MA, Lock A, Rutherford K, Staines DM, Bähler J, Kersey PJ, Oliver SG, Wood V (enero de 2015). "PomBase 2015: actualizaciones de la base de datos de levadura de fisión". Nucleic Acids Res. 43 (número de la base de datos): D656–61. doi :10.1093/nar/gku1040. PMC 4383888. PMID 25361970 .
^ Hoffman CS, Wood V, Fantes PA (octubre de 2015). "Una levadura antigua para jóvenes genetistas: una introducción al sistema modelo Schizosaccharomyces pombe". Genética . 201 (2): 403–23. doi :10.1534/genetics.115.181503. PMC 4596657 . PMID 26447128.