Base de datos sobre la genética de Drosophilidae
FlyBase es una base de datos bioinformática en línea y el repositorio principal de datos genéticos y moleculares de la familia de insectos Drosophilidae . [1] Para la especie y el organismo modelo más estudiados , Drosophila melanogaster , se presenta una amplia gama de datos en diferentes formatos.
La información en FlyBase se origina de una variedad de fuentes que van desde proyectos genómicos a gran escala hasta la literatura de investigación primaria. Estos tipos de datos incluyen fenotipos mutantes ; caracterización molecular de alelos mutantes ; y otras desviaciones, mapas citológicos, patrones de expresión de tipo salvaje , imágenes anatómicas, construcciones e inserciones transgénicas, modelos genéticos a nivel de secuencia y clasificación molecular de funciones de productos genéticos. [2] Las herramientas de consulta permiten navegar por FlyBase a través de la secuencia de ADN o proteína, por nombre de gen o mutante, o a través de términos de las diversas ontologías utilizadas para capturar datos funcionales, fenotípicos y anatómicos. La base de datos ofrece varias herramientas de consulta diferentes para proporcionar un acceso eficiente a los datos disponibles y facilitar el descubrimiento de relaciones significativas dentro de la base de datos. [3] Los vínculos entre FlyBase y bases de datos externas, como BDGP [4] o modENCODE, [5] brindan oportunidades para una mayor exploración en otras bases de datos de organismos modelo y otros recursos de información biológica y molecular. [6] El proyecto FlyBase lo lleva a cabo un consorcio de investigadores de Drosophila y científicos informáticos de la Universidad de Harvard y la Universidad de Indiana en los Estados Unidos, y la Universidad de Cambridge en el Reino Unido.
FlyBase es una de las organizaciones que contribuyen a la Base de Datos de Organismos Modelo Genéricos (GMOD). [7]
A partir de 2022, [actualizar]la página de inicio de FlyBase solicitó una tarifa de acceso al sitio web de US$ 150,00 por persona por año, afirmando que "el NHGRI ha reducido la financiación de FlyBase en un 50%". [8]
Fondo
La Drosophila melanogaster ha sido un organismo experimental desde principios del siglo XX y, desde entonces, ha estado a la vanguardia de muchas áreas de investigación. [9] A medida que este campo de investigación se extendió y se volvió global, los investigadores que trabajaban en los mismos problemas necesitaban una forma de comunicarse y monitorear el progreso en el campo. Este nicho fue llenado inicialmente por boletines comunitarios como el Drosophila Information Service (DIS), que data de 1934, cuando el campo estaba comenzando a extenderse desde el laboratorio de Thomas Hunt Morgan . El material en estas páginas presentaba "catálogos" regulares de mutaciones y bibliografías de la literatura sobre la Drosophila. A medida que la infraestructura informática se desarrolló en los años 80 y 90, estos boletines cedieron y se fusionaron con listas de correo de Internet, y estas eventualmente se convirtieron en recursos y datos en línea. En 1992, los datos sobre la genética y genómica de D. melanogaster y especies relacionadas estaban disponibles electrónicamente a través de Internet a través de los grupos informáticos financiados FlyBase, BDGP (Berkeley Drosophila Genome Project) y EDGP (European Drosophila Genome Project). Estos grupos reconocieron que la mayoría de los tipos de datos del proyecto del genoma y de la comunidad se superponían. Decidieron que sería valioso presentar a la comunidad científica una visión integrada de los datos. En octubre de 1992, el Centro Nacional para la Investigación del Genoma Humano del NIH financió el proyecto FlyBase con el objetivo de diseñar, construir y publicar una base de datos de información genética y molecular sobre Drosophila melanogaster . FlyBase también recibe apoyo del Consejo de Investigación Médica de Londres. [10] En 1998, el consorcio FlyBase integró la información en un solo servidor de genómica de Drosophila. A partir de 2022, [actualizar]el proyecto FlyBase fue llevado a cabo por un consorcio de investigadores de Drosophila y científicos informáticos de la Universidad de Harvard , la Universidad de Cambridge (Reino Unido), la Universidad de Indiana y la Universidad de Nuevo México . [11]
Contenido
FlyBase contiene una anotación completa del genoma de Drosophila melanogaster que se actualiza varias veces al año. [12] También incluye una bibliografía de investigación sobre la genética de Drosophila en el último siglo que se puede buscar. La información sobre los investigadores actuales y un pedigrí parcial de las relaciones entre los investigadores actuales se puede buscar en función del registro del científico participante. [13] El sitio también proporciona una gran base de datos de imágenes que ilustran el genoma completo y varias películas que detallan la embriogénesis (ImageBrowser Archivado el 24 de marzo de 2007 en Wayback Machine ). Los dos principales afluentes de la base de datos son los grandes conjuntos de datos multiespecie depositados por el Consorcio de 12 Genomas de Drosophila (Clark et al 2007) y Crosby et al 2007. [14]
Estrategias de búsqueda: los informes genéticos de los doce genomas secuenciados de Drosophila están disponibles en FlyBase. Hay cuatro formas principales de explorar estos datos: archivos precomputados [15] BLAST, [16] Gbrowse, [17] y páginas de informes genéticos. Gbrowse y los archivos precomputados son para análisis de todo el genoma, bioinformática y genómica comparativa. BLAST y las páginas de informes genéticos son para un gen, proteína o región específicos de la especie.
Para buscar datos citológicos, hay dos herramientas principales disponibles. Utilice Cytosearch [18] para buscar genes o deficiencias mapeados citológicamente que no hayan sido mapeados molecularmente en la secuencia. Utilice Gbrowse para buscar secuencias mapeadas molecularmente, inserciones o sondas Affymetrix.
Hay dos herramientas de consulta principales en FlyBase. La primera herramienta de consulta principal se llama Jump to Gene (J2G). Se encuentra en la parte superior derecha de la barra de navegación azul en cada página de FlyBase. Esta herramienta es útil cuando sabes exactamente lo que estás buscando y quieres ir a la página de informe con esos datos. La segunda herramienta de consulta principal se llama QuickSearch. Se encuentra en la página de inicio de FlyBase. Esta herramienta es más útil cuando quieres buscar algo rápidamente de lo que quizás solo conozcas un poco. La búsqueda se puede realizar solo dentro de D. melanogaster o dentro de todas las especies. Se pueden buscar otros datos que no sean genes usando el menú 'clase de datos'.
Investigación relacionada
A continuación se ofrecen dos ejemplos de investigaciones relacionadas con FlyBase o que lo utilizan:
- El primero es un estudio de genes expresados de Toxoptera citricida alado (que significa "que tiene alas") , más comúnmente conocido como el pulgón marrón de los cítricos. El pulgón marrón de los cítricos, se considera el vector principal del virus de la tristeza de los cítricos , un patógeno grave que causa pérdidas a las industrias de cítricos en todo el mundo. La forma alada de este pulgón puede volar largas distancias con el viento, lo que le permite propagar el virus de la tristeza de los cítricos en las regiones de cultivo de cítricos. Para comprender mejor la biología del pulgón marrón de los cítricos y la aparición de genes expresados durante el desarrollo de las alas, los investigadores emprendieron un proyecto de secuenciación del extremo 5' a gran escala de clones de ADNc de pulgones alados. Proyectos similares de secuenciación de etiquetas de secuencia expresada (EST) a gran escala de otros insectos han proporcionado un vehículo para responder preguntas biológicas relacionadas con el desarrollo y la fisiología. Aunque existe una base de datos creciente en GenBank de EST de insectos, la mayoría son de Drosophila melanogaster, y relativamente pocos se derivan específicamente de pulgones. Los investigadores pudieron proporcionar un gran conjunto de datos de EST del pulgón pardo de los cítricos alado (alado) y comenzaron a analizar este valioso recurso. Pudieron hacer esto con la ayuda de la información sobre Drosophila melanogaster en FlyBase. La identidad de secuencia putativa se determinó utilizando búsquedas BLAST. Las coincidencias de secuencia con puntajes de valor E ≤ −10 se consideraron significativas y se categorizaron de acuerdo con el sistema de clasificación Gene Ontology (GO) basado en la anotación de las 5 coincidencias de "mejor resultado" en las búsquedas BLASTX. Todas las coincidencias de D. melanogaster se catalogaron utilizando FlyBase. Casi todas estas coincidencias de "mejor resultado" se caracterizaron con respecto a los genes anotados funcionalmente en D. melanogaster utilizando FlyBase. La información genética es crucial para avanzar en la comprensión de la biología de los pulgones y desempeñará un papel importante en el desarrollo de futuras estrategias de control no químicas basadas en genes contra estas plagas de insectos. [19]
- Mejora de la anotación de la ontología genética de Drosophila: Qué hacen los productos genéticos y dónde lo hacen son preguntas importantes para los biólogos. El proyecto Gene Ontology se estableció hace 13 años con el fin de resumir estos datos de manera consistente en diferentes bases de datos mediante el uso de un conjunto común de términos de vocabulario definidos. También codifican relaciones entre términos. El Gene Ontology Project es una importante iniciativa de bioinformática con el objetivo de estandarizar la representación de los atributos de los genes y productos genéticos en todas las especies y bases de datos. El proyecto también proporciona datos de anotación de productos genéticos de los miembros del consorcio GO. [20] FlyBase fue uno de los tres miembros fundadores del Consorcio de Ontología Genética. La anotación GO comprende al menos tres componentes: un término GO que describe la función molecular, el papel biológico o la ubicación subcelular; un "código de evidencia" que describe el tipo de análisis utilizado para respaldar el término GO; y una atribución a una referencia específica. La anotación GO es útil tanto para análisis a pequeña como a gran escala. Puede proporcionar una primera indicación de la naturaleza de un producto genético y, junto con los códigos de evidencia, apuntar directamente a artículos con datos experimentales pertinentes. Las prioridades actuales para la anotación son: homólogos de genes de enfermedades humanas, genes que están altamente conservados en todas las especies, genes involucrados en vías bioquímicas/de señalización y genes tópicos que han demostrado ser de interés significativo en publicaciones recientes. FlyBase ha estado contribuyendo con anotaciones GO al proyecto desde que comenzó en agosto de 2006. Las anotaciones GO aparecen en la página Gene Report en FlyBase. Los datos GO se pueden buscar en FlyBase utilizando TermLink y QueryBuilder. El GO es dinámico y puede cambiar a diario, por ejemplo, la adición de nuevos términos. Para mantenerse actualizado, FlyBase carga una nueva versión del GO cada una o dos versiones de FlyBase. El conjunto de anotaciones GO se envía al GOC al mismo tiempo que se lanza una nueva versión de FlyBase. [21]
Véase también
Notas y referencias
- ^ Thurmond, Jim; Goodman, Joshua L; Strelets, Victor B; Attrill, Helen; Gramates, L Sian; Marygold, Steven J; Matthews, Beverley B; Millburn, Gillian; Antonazzo, Giulia; Trovisco, Vitor; Kaufman, Thomas C; Calvi, Brian R; Perrimon, Norbert; Gelbart, Susan Russo; Agapite, Julie; Broll, Kris; Crosby, Lynn; Santos, Gilberto dos; Emmert, David; Gramates, L Sian; Falls, Kathleen; Jenkins, Victoria; Matthews, Beverley; Sutherland, Carol; Tabone, Christopher; Zhou, Pinglei; Zytkovicz, Mark; Brown, Nick; Antonazzo, Giulia; Attrill, Helen; Garapati, Phani; Holmes, Alex; Larkin, Aoife; Marygold, Steven; Millburn, Gillian; Pilgrim, Clare; Trovisco, Vitor; Urbano, Pepe; Kaufman, Thomas; Calvi, Brian; Czoch, Bryon; Goodman, Josh; Strelets, Victor; Thurmond, Jim; Cripps, Richard; Baker, Phillip (8 de enero de 2019). "FlyBase 2.0: la próxima generación". Investigación de ácidos nucleicos . 47 (D1): D759–D765. doi : 10.1093/nar/gky1003 . PMC 6323960 . PMID 30364959.
- ^ Crosby, Madeline A; et al. (2007). "FlyBase: Genomas por docena". Nucleic Acids Research . 35 (número de la base de datos). Oxford Journals: D486–D491. doi : 10.1093/nar/gkl827 . PMC 1669768 . PMID 17099233.
- ^ Wilson, RJ; Goodman, JL; Strelets, VB (2008). "FlyBase: integración y mejoras en las herramientas de consulta". Nucleic Acids Res . 36 (número de la base de datos): D588–93. doi :10.1093/nar/gkm930. PMC 2238994 . PMID 18160408.
- ^ BDGP
- ^ modENCODE
- ^ Drysdale, R (2008). "FlyBase: una base de datos para la comunidad de investigación de Drosophila". Drosophila . Methods Mol. Biol. Vol. 420. págs. 45–59. doi :10.1007/978-1-59745-583-1_3. ISBN 978-1-58829-817-1. Número de identificación personal 18641940.
- ^ Base de datos de organismos modelo genéricos (GMOD).
- ^ "Página de inicio". FlyBase . Consultado el 24 de abril de 2022 .
- ^ Pete Geiger (2002). "Introducción a la Drosophila Melanogaster". BIOLOGY.ARIZONA.EDU. Archivado desde el original el 2 de agosto de 2013.
- ^ Gelbart, WM; Crosby, M; Matthews, B; Rindone, WP; Chillemi, J; Russo Twombly, S; Emmert, D; Ashburner, M; Drysdale, RA; Whitfield, E; Millburn, GH; de Grey, A; Kaufman, T; Matthews, K; Gilbert, D; Strelets, V; Tolstoshev, C (1997). "FlyBase: una base de datos de Drosophila. El consorcio FlyBase". Nucleic Acids Res . 25 (1): 63–6. doi :10.1093/nar/25.1.63. PMC 146418 . PMID 9045212.
- ^ "FlyBase: Acerca de - Consorcio FlyBase". Wiki de Flybase . Consultado el 24 de abril de 2022 .
- ^ Drysdale, Rachel; Flybase Consortium (19 de julio de 2008). "FlyBase: una base de datos para la comunidad de investigación de Drosophila". En Dahmann, Christian (ed.). Drosophila . Métodos en biología molecular . Vol. 420. Totowa, Nueva Jersey, EE. UU.: Humana Press. págs. 45–59. doi :10.1007/978-1-59745-583-1_3. ISBN 978-1-58829-817-1. Número de identificación personal 18641940.
- ^ "Encuentra a una persona". Archivado desde el original el 25 de mayo de 2019.[ enlace muerto ]
- ^ Tweedie, Susan; Ashburner, Michael; Falls, Kathleen; Leyland, Paul; McQuilton, Peter; Marygold, Steven; Millburn, Gillian; Osumi-Sutherland, David; Schroeder, Andrew; Seal, Ruth; Zhang, Haiyan; El Consorcio FlyBase (1 de enero de 2009). "FlyBase: mejora de las anotaciones de ontología génica de Drosophila". Investigación de ácidos nucleicos . 37 (Base de datos). OUP : D555–D559. doi :10.1093/nar/gkn788. ISSN 0305-1048. PMC 2686450 . PMID 18948289. S2CID 332782.
- ^ Archivos precalculados
- ^ EXPLOSIÓN
- ^ Explorar
- ^ "Cytosearch". Archivado desde el original el 7 de octubre de 2011. Consultado el 24 de noviembre de 2011 .
- ^ Hunter, WB; Dang, PM; Bausher, MG; Chaparro, JX; McKendree, W; Shatters, RG; McKenzie, CL; Sinisterra, XH (2003). "Biología de los pulgones: genes expresados de Toxoptera citricida, el pulgón pardo de los cítricos". J. Insect Sci . 3 : 23. doi : 10.1093 /jis/3.1.23. PMC 524662. PMID 15841239.
- ^ "La ontología genética" . Consultado el 31 de mayo de 2017 .
- ^ Tweedie, Susan; et al. (2009). "FlyBase: mejora de las anotaciones de ontología génica de Drosophila". Nucleic Acids Research . 37 (número de la base de datos). Oxford Journals: D555–D559. doi :10.1093/nar/gkn788. PMC 2686450 . PMID 18948289.
Enlaces externos