Carbohydrate Structure Database ( CSDB ) es una base de datos curada gratuita y una plataforma de servicios en glicoinformática , lanzada en 2005 [2] por un grupo de científicos rusos del Instituto ND Zelinsky de Química Orgánica, Academia Rusa de Ciencias. CSDB almacena datos estructurales, taxonómicos, bibliográficos y espectroscópicos de RMN publicados sobre carbohidratos naturales y moléculas relacionadas con carbohidratos.
Descripción general
Los datos principales almacenados en CSDB son estructuras de carbohidratos de origen bacteriano, fúngico y vegetal. Cada estructura se asigna a un organismo y se proporciona con el enlace a la publicación científica correspondiente en la que se describió. Además de los datos estructurales, CSDB también almacena espectros de RMN , información sobre los métodos utilizados para descifrar una estructura particular y otros datos. [1] [3]
CSDB proporciona acceso a varias herramientas de investigación relacionadas con los carbohidratos:
Historia y financiación
Hasta 2015, las bases de datos de la estructura de carbohidratos bacterianos (BCSDB) y de la estructura de carbohidratos de plantas y hongos (PFCSDB) existían en paralelo. En 2015, se unieron en la única base de datos de la estructura de carbohidratos (CSDB). [1] El desarrollo y mantenimiento de la CSDB han sido financiados por el Centro Internacional de Ciencia y Tecnología (2005-2007), el programa de subvenciones del Presidente de la Federación Rusa (2005-2006), la Fundación Rusa para la Investigación Básica (2005-2007, 2012-2014, 2015-2017, 2018-2020), el Deutsches Krebsforschungszentrum (a corto plazo en 2006-2010) y la Fundación Rusa para la Ciencia (2018-2020).
Fuentes de datos y cobertura
Las principales fuentes de datos del CSDB son:
- Publicaciones científicas indexadas en bases de datos de citas dedicadas, incluidas NCBI Pubmed y Thomson Reuters Web Of Science (aproximadamente 18000 registros).
- Base de datos CCSD (Carbbank [13] ) (aprox. 3000 registros).
Los datos se seleccionan y se añaden a la CSDB de forma manual consultando publicaciones científicas originales. Los datos procedentes de otras bases de datos están sujetos a procedimientos de corrección de errores y aprobación. [14]
A partir de 2017, la cobertura de bacterias y arqueas es de aproximadamente el 80% de las estructuras de carbohidratos publicadas en la literatura científica [1] El lapso de tiempo entre la publicación de datos relativos y su depósito en la CSDB es de unos 18 meses. Las plantas están cubiertas hasta 1997 y los hongos hasta 2012. [15]
La CSDB no cubre datos del dominio animalia , excepto los metazoos unicelulares . Hay varias bases de datos dedicadas a los carbohidratos animales , por ejemplo, UniCarbKB [16] o GLYCOSCIENCES.de Archivado el 11 de febrero de 2021 en Wayback Machine . [17]
Se informa que CSDB es uno de los proyectos más grandes en glicoinformática . [18] [19] [20] [21] [22] [23] [24] Se emplea en estudios estructurales de carbohidratos naturales [25] [26] [27] y en la elaboración de perfiles glicolíticos. [28]
El contenido de CSDB se ha utilizado como fuente de datos en otros proyectos de glicoinformática . [29] [30] [31] [32]
Objetos depositados
- Estructuras moleculares de glicanos , glicopolímeros y glicoconjugados : estructura primaria, información de aglicones , grado de polimerización y clase de molécula. El ámbito estructural incluye moléculas compuestas por residuos ( monosacáridos , alditoles , aminoácidos , ácidos grasos , etc.) unidos por enlaces glucosídicos , éster, amídicos, cetales, fosfo- o sulfodiéster, en los que al menos un residuo es un monosacárido o su derivado.
- Bibliografía asociada a estructuras: datos de imprenta, palabras clave, resúmenes, identificadores en bases de datos bibliográficas
- Contexto biológico de las estructuras: taxón asociado , cepa , serogrupo , organismo hospedador, información sobre enfermedades. Los dominios cubiertos son: procariotas, plantas, hongos y metazoos unicelulares patógenos seleccionados . La base de datos contiene únicamente glicanos originados en estos dominios u obtenidos por modificación química de dichos glicanos.
- Espectros de RMN asignados y condiciones experimentales.
- Glicosiltransferasas asociadas a taxones: identificadores de genes y enzimas , estructuras completas, donadores y sustratos, métodos utilizados para comprobar la actividad enzimática, nivel de confiabilidad.
- Referencias a otras bases de datos
- Otros datos recogidos de publicaciones originales
- Mapas de conformación de disacáridos derivados de simulaciones de dinámica molecular .
Interrelación con otras bases de datos
CSDB está enlazado de forma cruzada con otras bases de datos de glicómica , [33] [34] como MonosaccharideDB, Glycosciences.DE , NCBI Pubmed, NCBI Taxonomy, catálogo NLM, Clasificación Internacional de Enfermedades 11, etc. Además de una notación nativa, CSDB Linear, [ 35] las estructuras se presentan en múltiples notaciones de carbohidratos (SNFG, [36] SweetDB, [37] GlycoCT, [38] WURCS, [39] GLYCAM, [40] etc.). CSDB se puede exportar como una fuente de Resource Description Framework (RDF) de acuerdo con la ontología GlycoRDF. [41] [42]
Enlaces externos
- Sitio web de la CSDB
- Ejemplos de uso de CSDB
- Documentación técnica del CSDB
- CSDB Lineal (notación de codificación de estructura)
- Bases de datos de carbohidratos registradas en la colección NAR
- Bases de datos de carbohidratos en la última década (lectura)
Referencias
- ^ abcd Toukach Ph.V.; Egorova KS (2016). "Base de datos de estructura de carbohidratos fusionada a partir de partes bacterianas, arqueales, vegetales y fúngicas". Investigación de ácidos nucleicos . 44 (D1): D1229–D1236. doi :10.1093/nar/gkv840. PMC 4702937 . PMID 26286194.
- ^ Toukach FV; Knirel YA (2005). "Nueva base de datos de estructuras de carbohidratos bacterianos". Glycoconjugate Journal . 22 (4–6): 216–217.
- ^ Harvey DJ (2015). "Análisis de carbohidratos y glicoconjugados mediante espectrometría de masas de desorción/ionización láser asistida por matriz: una actualización para 2011-2012". Reseñas de espectrometría de masas . 36 (3): 255–422. doi :10.1002/mas.21471. PMID 26270629.
- ^ Kapaev RR; Egorova KS; Toukach Ph.V. (2014). "Esquema de generalización de la estructura de carbohidratos para la simulación basada en bases de datos de observables experimentales, como desplazamientos químicos de RMN". Journal of Chemical Information and Modeling . 54 (9): 2594–2611. doi :10.1021/ci500267u. PMID 25020143.
- ^ Kapaev RR; Toukach Ph.V. (2015). "Esquema mejorado de generalización de la estructura de carbohidratos para simulaciones de RMN de 1H y 13C ". Química analítica . 87 (14): 7006–7010. doi :10.1021/acs.analchem.5b01413. PMID 26087011.
- ^ Kapaev RR; Toukach Ph.V. (2016). "Simulación de espectros de RMN 2D de carbohidratos utilizando el software GODDESS". Revista de información y modelado químico . 56 (6): 1100–1104. doi :10.1021/acs.jcim.6b00083. PMID 27227420.
- ^ Kapaev RR; Toukach Ph.V. (2018). "GRASS: elucidación de la estructura de sacáridos basada en RMN semiautomatizada". Bioinformática . 34 (6): 957–963. doi : 10.1093/bioinformatics/btx696 . PMID 29092007.
- ^ ab Egorova KS; Kondakova AN; Toukach Ph.V. (2015). "Base de datos de estructura de carbohidratos: herramientas para el análisis estadístico de glicomas bacterianos, vegetales y fúngicos". Base de datos . 2015 : ID bav073. doi :10.1093/database/bav073. PMC 4559136 . PMID 26337239.
- ^ Herget S.; Toukach Ph.V.; Ranzinger R.; Hull WE; Knirel Y.; von der Lieth C.-W. (2008). "Análisis estadístico de la base de datos de la estructura de carbohidratos bacterianos (BCSDB): características y diversidad de carbohidratos bacterianos en comparación con glicanos de mamíferos". BMC Structural Biology . 8 : ID 35. doi : 10.1186/1472-6807-8-35 . PMC 2543016 . PMID 18694500.
- ^ Chernyshov IY; Toukach Ph.V. (2018). "REStLESS: Traducción automática de secuencias de glicanos desde la notación basada en residuos a SMILES y coordenadas atómicas". Bioinformática . 34 (15): 2679–2681. doi : 10.1093/bioinformatics/bty168 . PMID 29547883.
- ^ Toukach Ph.V.; Egorova KS (2017). "CSDB_GT: una nueva base de datos curada sobre glicosiltransferasas". Glicobiología . 27 (4): 285–290. doi : 10.1093/glycob/cww137 . PMID 28011601.
- ^ Egorova KS; Knirel YA; Toukach Ph.V. (2019). "Expansión de la base de datos de glicosiltransferasa CSDB_GT con Escherichia coli". Glicobiología . 29 (4): 285–287. doi :10.1093/glycob/cwz006. PMID 30759212.
- ^ Doubet S.; Albersheim P. (1992). "CarbBank". Glicobiología . 2 (6): 505–507. doi : 10.1093/glycob/2.6.505 . PMID 1472756.
- ^ Egorova KS; Toukach Ph.V. (2012). "Análisis crítico de la calidad de los datos del CCSD". Revista de información y modelado químico . 52 (11): 2812–2814. doi :10.1021/ci3002815. PMID 23025661.
- ^ Egorova KS; Toukach Ph.V. (2013). "Expansión de la cobertura de la base de datos de estructura de carbohidratos (CSDB)". Investigación de carbohidratos . 389 : 112–114. doi :10.1016/j.carres.2013.10.009. PMID 24680503.
- ^ Campbell MP; Packer NH (2016). "UniCarbKB: Nuevas características de la base de datos para integrar la abundancia de la estructura de los glicanos, los datos de la glicoproteómica composicional y las asociaciones de enfermedades". Biochimica et Biophysica Acta (BBA) - Temas generales . 1860 (8): 1669–1675. doi :10.1016/j.bbagen.2016.02.016. PMID 26940363.
- ^ Lütteke T.; Bohne-Lang A.; Loss A.; Goetz T.; Frank M.; von der Lieth C.-W. (2006). "GLYCOSCIENCES.de: un portal de Internet para apoyar la investigación en glicómica y glicobiología". Glicobiología . 16 (5): 71R–81R. doi : 10.1093/glycob/cwj049 . PMID 16239495.
- ^ Rigden DJ; Fernández-Suárez XM; Galperin MY (2016). "El número de la base de datos de 2016 de Nucleic Acids Research y una colección de bases de datos de biología molecular actualizada". Nucleic Acids Research . 44 (D1): D1–D6. doi :10.1093/nar/gkv1356. PMC 4702933 . PMID 26740669.
- ^ Aoki-Kinoshita KF (2013). "Uso de bases de datos y recursos web para la investigación glicómica". Molecular & Cellular Proteomics . 12 (4): 1036–1045. doi : 10.1074/mcp.R112.026252 . PMC 3617328 . PMID 23325765.
- ^ Frank M.; Schloissnig S. (2010). "Bioinformática y modelado molecular en glicobiología". Ciencias de la vida celular y molecular . 67 (16): 2749–2772. doi :10.1007/s00018-010-0352-4. PMC 2912727 . PMID 20364395.
- ^ Artemenko NV; McDonald AG; Davey GP; Rudd PM (2012). "Bases de datos y herramientas en glicobiología". Proteínas terapéuticas . Métodos en biología molecular. Vol. 899. págs. 325–350. doi :10.1007/978-1-61779-921-1_21. ISBN 978-1-61779-920-4. Número de identificación personal 22735963.
- ^ Lütteke T. (2012). "El uso de la glicoinformática en la glicoquímica". Beilstein Journal of Organic Chemistry . 8 : 915–929. doi :10.3762/bjoc.8.104. PMC 3388882 . PMID 23015842.
- ^ Zhulin IB (2015). "Bases de datos para microbiólogos". Revista de bacteriología . 197 (15): 2458–2467. doi :10.1128/JB.00330-15. PMC 4505447 . PMID 26013493.
- ^ Yamada K.; Kakehi K. (2011). "Avances recientes en el análisis de carbohidratos para uso biomédico". Revista de análisis farmacéutico y biomédico . 55 (4): 702–727. doi :10.1016/j.jpba.2011.02.003. PMID 21382683.
- ^ Fontana C.; Zaccheus M.; Weintraub A.; Ansaruzzaman M.; Widmalm G. (2016). "Estudios estructurales de un polisacárido de la cepa AN-16000 de Vibrio parahaemolyticus". Investigación de carbohidratos . 432 : 41–49. doi :10.1016/j.carres.2016.06.004. PMID 27392309. S2CID 23129802.
- ^ Potekhina NV; Shashkov AS; Senchenkova SN; Dorofeeva LV; Evtushenko LI (2012). "Estructura del polímero de hexasacárido 1-fosfato de la pared celular VKM Ac-1979(T) de Arthrobacter uratoxydans". Biochemistry (Moscú) . 77 (11): 1294–1302. doi :10.1134/S0006297912110089. PMID 23240567. S2CID 9699031.
- ^ Chapot-Chartier MP; Vinogradov E.; Sadovskaya I.; Andre G.; Mistou MY; Trieu-Cuot P.; Furlan S.; Bidnenko E.; Courtin P.; Péchoux C.; Hols P.; Dufrêne YF; Kulakauskas S. (2010). "La superficie celular de Lactococcus lactis está cubierta por una película protectora de polisacárido". Journal of Biological Chemistry . 285 (14): 10464–10471. doi : 10.1074/jbc.M109.082958 . PMC 2856253 . PMID 20106971.
- ^ Walsh I.; Zhao S.; Campbell M.; Taron CH; Rudd PM (2016). "Perfiles cuantitativos de glicanos y glicopéptidos: una perspectiva informática". Current Opinion in Structural Biology . 40 : 70–80. doi :10.1016/j.sbi.2016.07.022. PMID 27522273.
- ^ Ranzinger R.; York WS (2015). "GlycomeDB". Glycoinformatics . Métodos en biología molecular. Vol. 1273. págs. 109-124. doi :10.1007/978-1-4939-2343-4_8. ISBN 978-1-4939-2342-7. Número de identificación personal 25753706.
- ^ Ranzinger R.; Herget S.; von der Lieth C.-W.; Frank M. (2011). "GlycomeDB - una base de datos unificada para estructuras de carbohidratos". Nucleic Acids Research . 39 (número de base de datos): D373-376. doi :10.1093/nar/gkq1014. PMC 3013643 . PMID 21045056.
- ^ Aoki-Kinoshita KF; et al. (2016). "GlyTouCan 1.0 - El repositorio internacional de estructuras de glicanos". Investigación de ácidos nucleicos . 44 (D1): D1237-1242. doi :10.1093/nar/gkv1041. PMC 4702779. PMID 26476458 .
- ^ Campbell MP; Ranzinger R.; Lütteke T.; Mariethoz J.; Hayes CA.; Zhang J.; Akune Y.; Aoki-Kinoshita KF; Damerell D.; Carta G.; York WS; Haslam SM; Narimatsu H.; Rudd PM; Karlsson NG; Packer NH; Lisacek F. (2014). "Cajas de herramientas para un estudio estandarizado y sistemático de glicanos". BMC Bioinformatics . 15 (Supl 1): Supl 1:S9. doi : 10.1186/1471-2105-15-S1-S9 . PMC 4016020 . PMID 24564482.
- ^ Ranzinger R.; Herget S.; Wetter T.; von der Lieth C.-W. (2008). "GlycomeDB - integración de bases de datos de estructuras de carbohidratos de acceso abierto". BMC Bioinformatics . 9 : ID 384. doi : 10.1186/1471-2105-9-384 . PMC 2567997 . PMID 18803830.
- ^ Toukach Ph.V.; Joshi H.; Ranzinger R.; Knirel Y.; von der Lieth C.-W. (2007). "Compartir recursos digitales relacionados con carbohidratos distribuidos en todo el mundo: conexión en línea de la base de datos de estructura de carbohidratos bacterianos y GLYCOSCIENCES.de". Nucleic Acids Research . 35 (número de la base de datos): D280–D286. doi :10.1093/nar/gkl883. PMC 1899093 . PMID 17202164.
- ^ Toukach Ph.V.; Egorova KS (2020). "Nuevas características de CSDB Linear, en comparación con otras notaciones de carbohidratos". Revista de información y modelado químico . 60 (3): 1276–1289. doi :10.1021/acs.jcim.9b00744. PMID 31790229. S2CID 226214957.
- ^ Varki A.; et al. (2015). "Nomenclatura de símbolos para representaciones gráficas de glicanos". Glicobiología . 25 (12): 1323–1324. doi :10.1093/glycob/cwv091. PMC 4643639 . PMID 26543186.
- ^ Loss A.; Bunsmann P.; Bohne A.; Loss A.; Schwarzer E.; Lang E.; von der Lieth C.-W. (2002). "SWEET-DB: un intento de crear colecciones de datos anotados para carbohidratos". Nucleic Acids Research . 30 (1): 405–408. doi :10.1093/nar/30.1.405. PMC 99123 . PMID 11752350.
- ^ Herget S.; Ranzinger R.; Maass K.; von der Lieth C.-W. (2008). "GlycoCT - un formato de secuencia unificador para carbohidratos". Investigación de carbohidratos . 343 (12): 2162–2171. doi :10.1016/j.carres.2008.03.011. PMID 18436199.
- ^ Tanaka K.; Aoki-Kinoshita KF; Kotera M.; Sawaki H.; Tsuchiya S.; Fujita N.; Shikanai T.; Kato M.; Kawano S.; Yamada I.; Narimatsu H. (2014). "WURCS: la representación única de Web3 de estructuras de carbohidratos". Revista de información y modelado químico . 54 (6): 1558-1566. doi : 10.1021/ci400571e . PMID 24897372.
- ^ Kirschner KN; Yongye AB; Tschampel SM; González-Outeiriño J.; Daniels CR; Foley BL; Woods RJ (2008). "GLYCAM06: un campo de fuerza biomolecular generalizable. Carbohidratos". Revista de Química Computacional . 29 (4): 622–655. doi :10.1002/jcc.20820. PMC 4423547 . PMID 17849372.
- ^ Ranzinger R.; Aoki-Kinoshita KF; diputado Campbell; Kawano S.; Lütteke T.; Okuda S.; Shinmachi D.; Shikanai T.; Sawaki H.; Toukach Ph.V.; Matsubara M.; Yamada I.; Narimatsu H. (2015). "GlycoRDF: una ontología para estandarizar datos de Glycomics en RDF". Bioinformática . 31 (6): 919–925. doi : 10.1093/bioinformática/btu732. PMC 4380026 . PMID 25388145.
- ^ Aoki-Kinoshita KF; Bolleman J.; diputado Campbell; Kawano S.; Kim J.; Lütteke T.; Matsubara M.; Okuda S.; Ranzinger R.; Sawaki H.; Shikanai T.; Shinmachi D.; Suzuki Y.; Toukach Ph.V.; Yamada I.; Empacador NH; Narimatsu H. (2013). "Introducción de datos de glucómica en la Web Semántica". Revista de Semántica Biomédica . 4 (1): ID 39. doi : 10.1186/2041-1480-4-39 . PMC 4177142 . PMID 24280648.