stringtranslate.com

Base de datos de la estructura de los carbohidratos

Carbohydrate Structure Database ( CSDB ) es una base de datos curada gratuita y una plataforma de servicios en glicoinformática , lanzada en 2005 [2] por un grupo de científicos rusos del Instituto ND Zelinsky de Química Orgánica, Academia Rusa de Ciencias. CSDB almacena datos estructurales, taxonómicos, bibliográficos y espectroscópicos de RMN publicados sobre carbohidratos naturales y moléculas relacionadas con carbohidratos.

Descripción general

Los datos principales almacenados en CSDB son estructuras de carbohidratos de origen bacteriano, fúngico y vegetal. Cada estructura se asigna a un organismo y se proporciona con el enlace a la publicación científica correspondiente en la que se describió. Además de los datos estructurales, CSDB también almacena espectros de RMN , información sobre los métodos utilizados para descifrar una estructura particular y otros datos. [1] [3] CSDB proporciona acceso a varias herramientas de investigación relacionadas con los carbohidratos:

Historia y financiación

Hasta 2015, las bases de datos de la estructura de carbohidratos bacterianos (BCSDB) y de la estructura de carbohidratos de plantas y hongos (PFCSDB) existían en paralelo. En 2015, se unieron en la única base de datos de la estructura de carbohidratos (CSDB). [1] El desarrollo y mantenimiento de la CSDB han sido financiados por el Centro Internacional de Ciencia y Tecnología (2005-2007), el programa de subvenciones del Presidente de la Federación Rusa (2005-2006), la Fundación Rusa para la Investigación Básica (2005-2007, 2012-2014, 2015-2017, 2018-2020), el Deutsches Krebsforschungszentrum (a corto plazo en 2006-2010) y la Fundación Rusa para la Ciencia (2018-2020).

Fuentes de datos y cobertura

Las principales fuentes de datos del CSDB son:

Los datos se seleccionan y se añaden a la CSDB de forma manual consultando publicaciones científicas originales. Los datos procedentes de otras bases de datos están sujetos a procedimientos de corrección de errores y aprobación. [14] A partir de 2017, la cobertura de bacterias y arqueas es de aproximadamente el 80% de las estructuras de carbohidratos publicadas en la literatura científica [1] El lapso de tiempo entre la publicación de datos relativos y su depósito en la CSDB es de unos 18 meses. Las plantas están cubiertas hasta 1997 y los hongos hasta 2012. [15] La CSDB no cubre datos del dominio animalia , excepto los metazoos unicelulares . Hay varias bases de datos dedicadas a los carbohidratos animales , por ejemplo, UniCarbKB [16] o GLYCOSCIENCES.de Archivado el 11 de febrero de 2021 en Wayback Machine . [17]

Se informa que CSDB es uno de los proyectos más grandes en glicoinformática . [18] [19] [20] [21] [22] [23] [24] Se emplea en estudios estructurales de carbohidratos naturales [25] [26] [27] y en la elaboración de perfiles glicolíticos. [28] El contenido de CSDB se ha utilizado como fuente de datos en otros proyectos de glicoinformática . [29] [30] [31] [32]

Objetos depositados

Interrelación con otras bases de datos

CSDB está enlazado de forma cruzada con otras bases de datos de glicómica , [33] [34] como MonosaccharideDB, Glycosciences.DE , NCBI Pubmed, NCBI Taxonomy, catálogo NLM, Clasificación Internacional de Enfermedades 11, etc. Además de una notación nativa, CSDB Linear, [ 35] las estructuras se presentan en múltiples notaciones de carbohidratos (SNFG, [36] SweetDB, [37] GlycoCT, [38] WURCS, [39] GLYCAM, [40] etc.). CSDB se puede exportar como una fuente de Resource Description Framework (RDF) de acuerdo con la ontología GlycoRDF. [41] [42]

Enlaces externos

Referencias

  1. ^ abcd Toukach Ph.V.; Egorova KS (2016). "Base de datos de estructura de carbohidratos fusionada a partir de partes bacterianas, arqueales, vegetales y fúngicas". Investigación de ácidos nucleicos . 44 (D1): D1229–D1236. doi :10.1093/nar/gkv840. PMC  4702937 . PMID  26286194.
  2. ^ Toukach FV; Knirel YA (2005). "Nueva base de datos de estructuras de carbohidratos bacterianos". Glycoconjugate Journal . 22 (4–6): 216–217.
  3. ^ Harvey DJ (2015). "Análisis de carbohidratos y glicoconjugados mediante espectrometría de masas de desorción/ionización láser asistida por matriz: una actualización para 2011-2012". Reseñas de espectrometría de masas . 36 (3): 255–422. doi :10.1002/mas.21471. PMID  26270629.
  4. ^ Kapaev RR; Egorova KS; Toukach Ph.V. (2014). "Esquema de generalización de la estructura de carbohidratos para la simulación basada en bases de datos de observables experimentales, como desplazamientos químicos de RMN". Journal of Chemical Information and Modeling . 54 (9): 2594–2611. doi :10.1021/ci500267u. PMID  25020143.
  5. ^ Kapaev RR; Toukach Ph.V. (2015). "Esquema mejorado de generalización de la estructura de carbohidratos para simulaciones de RMN de 1H y 13C ". Química analítica . 87 (14): 7006–7010. doi :10.1021/acs.analchem.5b01413. PMID  26087011.
  6. ^ Kapaev RR; Toukach Ph.V. (2016). "Simulación de espectros de RMN 2D de carbohidratos utilizando el software GODDESS". Revista de información y modelado químico . 56 (6): 1100–1104. doi :10.1021/acs.jcim.6b00083. PMID  27227420.
  7. ^ Kapaev RR; Toukach Ph.V. (2018). "GRASS: elucidación de la estructura de sacáridos basada en RMN semiautomatizada". Bioinformática . 34 (6): 957–963. doi : 10.1093/bioinformatics/btx696 . PMID  29092007.
  8. ^ ab Egorova KS; Kondakova AN; Toukach Ph.V. (2015). "Base de datos de estructura de carbohidratos: herramientas para el análisis estadístico de glicomas bacterianos, vegetales y fúngicos". Base de datos . 2015 : ID bav073. doi :10.1093/database/bav073. PMC 4559136 . PMID  26337239. 
  9. ^ Herget S.; Toukach Ph.V.; Ranzinger R.; Hull WE; Knirel Y.; von der Lieth C.-W. (2008). "Análisis estadístico de la base de datos de la estructura de carbohidratos bacterianos (BCSDB): características y diversidad de carbohidratos bacterianos en comparación con glicanos de mamíferos". BMC Structural Biology . 8 : ID 35. doi : 10.1186/1472-6807-8-35 . PMC 2543016 . PMID  18694500. 
  10. ^ Chernyshov IY; Toukach Ph.V. (2018). "REStLESS: Traducción automática de secuencias de glicanos desde la notación basada en residuos a SMILES y coordenadas atómicas". Bioinformática . 34 (15): 2679–2681. doi : 10.1093/bioinformatics/bty168 . PMID  29547883.
  11. ^ Toukach Ph.V.; Egorova KS (2017). "CSDB_GT: una nueva base de datos curada sobre glicosiltransferasas". Glicobiología . 27 (4): 285–290. doi : 10.1093/glycob/cww137 . PMID  28011601.
  12. ^ Egorova KS; Knirel YA; Toukach Ph.V. (2019). "Expansión de la base de datos de glicosiltransferasa CSDB_GT con Escherichia coli". Glicobiología . 29 (4): 285–287. doi :10.1093/glycob/cwz006. PMID  30759212.
  13. ^ Doubet S.; Albersheim P. (1992). "CarbBank". Glicobiología . 2 (6): 505–507. doi : 10.1093/glycob/2.6.505 . PMID  1472756.
  14. ^ Egorova KS; Toukach Ph.V. (2012). "Análisis crítico de la calidad de los datos del CCSD". Revista de información y modelado químico . 52 (11): 2812–2814. doi :10.1021/ci3002815. PMID  23025661.
  15. ^ Egorova KS; Toukach Ph.V. (2013). "Expansión de la cobertura de la base de datos de estructura de carbohidratos (CSDB)". Investigación de carbohidratos . 389 : 112–114. doi :10.1016/j.carres.2013.10.009. PMID  24680503.
  16. ^ Campbell MP; Packer NH (2016). "UniCarbKB: Nuevas características de la base de datos para integrar la abundancia de la estructura de los glicanos, los datos de la glicoproteómica composicional y las asociaciones de enfermedades". Biochimica et Biophysica Acta (BBA) - Temas generales . 1860 (8): 1669–1675. doi :10.1016/j.bbagen.2016.02.016. PMID  26940363.
  17. ^ Lütteke T.; Bohne-Lang A.; Loss A.; Goetz T.; Frank M.; von der Lieth C.-W. (2006). "GLYCOSCIENCES.de: un portal de Internet para apoyar la investigación en glicómica y glicobiología". Glicobiología . 16 (5): 71R–81R. doi : 10.1093/glycob/cwj049 . PMID  16239495.
  18. ^ Rigden DJ; Fernández-Suárez XM; Galperin MY (2016). "El número de la base de datos de 2016 de Nucleic Acids Research y una colección de bases de datos de biología molecular actualizada". Nucleic Acids Research . 44 (D1): D1–D6. doi :10.1093/nar/gkv1356. PMC 4702933 . PMID  26740669. 
  19. ^ Aoki-Kinoshita KF (2013). "Uso de bases de datos y recursos web para la investigación glicómica". Molecular & Cellular Proteomics . 12 (4): 1036–1045. doi : 10.1074/mcp.R112.026252 . PMC 3617328 . PMID  23325765. 
  20. ^ Frank M.; Schloissnig S. (2010). "Bioinformática y modelado molecular en glicobiología". Ciencias de la vida celular y molecular . 67 (16): 2749–2772. doi :10.1007/s00018-010-0352-4. PMC 2912727 . PMID  20364395. 
  21. ^ Artemenko NV; McDonald AG; Davey GP; Rudd PM (2012). "Bases de datos y herramientas en glicobiología". Proteínas terapéuticas . Métodos en biología molecular. Vol. 899. págs. 325–350. doi :10.1007/978-1-61779-921-1_21. ISBN 978-1-61779-920-4. Número de identificación personal  22735963.
  22. ^ Lütteke T. (2012). "El uso de la glicoinformática en la glicoquímica". Beilstein Journal of Organic Chemistry . 8 : 915–929. doi :10.3762/bjoc.8.104. PMC 3388882 . PMID  23015842. 
  23. ^ Zhulin IB (2015). "Bases de datos para microbiólogos". Revista de bacteriología . 197 (15): 2458–2467. doi :10.1128/JB.00330-15. PMC 4505447 . PMID  26013493. 
  24. ^ Yamada K.; Kakehi K. (2011). "Avances recientes en el análisis de carbohidratos para uso biomédico". Revista de análisis farmacéutico y biomédico . 55 (4): 702–727. doi :10.1016/j.jpba.2011.02.003. PMID  21382683.
  25. ^ Fontana C.; Zaccheus M.; Weintraub A.; Ansaruzzaman M.; Widmalm G. (2016). "Estudios estructurales de un polisacárido de la cepa AN-16000 de Vibrio parahaemolyticus". Investigación de carbohidratos . 432 : 41–49. doi :10.1016/j.carres.2016.06.004. PMID  27392309. S2CID  23129802.
  26. ^ Potekhina NV; Shashkov AS; Senchenkova SN; Dorofeeva LV; Evtushenko LI (2012). "Estructura del polímero de hexasacárido 1-fosfato de la pared celular VKM Ac-1979(T) de Arthrobacter uratoxydans". Biochemistry (Moscú) . 77 (11): 1294–1302. doi :10.1134/S0006297912110089. PMID  23240567. S2CID  9699031.
  27. ^ Chapot-Chartier MP; Vinogradov E.; Sadovskaya I.; Andre G.; Mistou MY; Trieu-Cuot P.; Furlan S.; Bidnenko E.; Courtin P.; Péchoux C.; Hols P.; Dufrêne YF; Kulakauskas S. (2010). "La superficie celular de Lactococcus lactis está cubierta por una película protectora de polisacárido". Journal of Biological Chemistry . 285 (14): 10464–10471. doi : 10.1074/jbc.M109.082958 . PMC 2856253 . PMID  20106971. 
  28. ^ Walsh I.; Zhao S.; Campbell M.; Taron CH; Rudd PM (2016). "Perfiles cuantitativos de glicanos y glicopéptidos: una perspectiva informática". Current Opinion in Structural Biology . 40 : 70–80. doi :10.1016/j.sbi.2016.07.022. PMID  27522273.
  29. ^ Ranzinger R.; York WS (2015). "GlycomeDB". Glycoinformatics . Métodos en biología molecular. Vol. 1273. págs. 109-124. doi :10.1007/978-1-4939-2343-4_8. ISBN 978-1-4939-2342-7. Número de identificación personal  25753706.
  30. ^ Ranzinger R.; Herget S.; von der Lieth C.-W.; Frank M. (2011). "GlycomeDB - una base de datos unificada para estructuras de carbohidratos". Nucleic Acids Research . 39 (número de base de datos): D373-376. doi :10.1093/nar/gkq1014. PMC 3013643 . PMID  21045056. 
  31. ^ Aoki-Kinoshita KF; et al. (2016). "GlyTouCan 1.0 - El repositorio internacional de estructuras de glicanos". Investigación de ácidos nucleicos . 44 (D1): D1237-1242. doi :10.1093/nar/gkv1041. PMC 4702779. PMID  26476458 . 
  32. ^ Campbell MP; Ranzinger R.; Lütteke T.; Mariethoz J.; Hayes CA.; Zhang J.; Akune Y.; Aoki-Kinoshita KF; Damerell D.; Carta G.; York WS; Haslam SM; Narimatsu H.; Rudd PM; Karlsson NG; Packer NH; Lisacek F. (2014). "Cajas de herramientas para un estudio estandarizado y sistemático de glicanos". BMC Bioinformatics . 15 (Supl 1): Supl 1:S9. doi : 10.1186/1471-2105-15-S1-S9 . PMC 4016020 . PMID  24564482. 
  33. ^ Ranzinger R.; Herget S.; Wetter T.; von der Lieth C.-W. (2008). "GlycomeDB - integración de bases de datos de estructuras de carbohidratos de acceso abierto". BMC Bioinformatics . 9 : ID 384. doi : 10.1186/1471-2105-9-384 . PMC 2567997 . PMID  18803830. 
  34. ^ Toukach Ph.V.; Joshi H.; Ranzinger R.; Knirel Y.; von der Lieth C.-W. (2007). "Compartir recursos digitales relacionados con carbohidratos distribuidos en todo el mundo: conexión en línea de la base de datos de estructura de carbohidratos bacterianos y GLYCOSCIENCES.de". Nucleic Acids Research . 35 (número de la base de datos): D280–D286. doi :10.1093/nar/gkl883. PMC 1899093 . PMID  17202164. 
  35. ^ Toukach Ph.V.; Egorova KS (2020). "Nuevas características de CSDB Linear, en comparación con otras notaciones de carbohidratos". Revista de información y modelado químico . 60 (3): 1276–1289. doi :10.1021/acs.jcim.9b00744. PMID  31790229. S2CID  226214957.
  36. ^ Varki A.; et al. (2015). "Nomenclatura de símbolos para representaciones gráficas de glicanos". Glicobiología . 25 (12): 1323–1324. doi :10.1093/glycob/cwv091. PMC 4643639 . PMID  26543186. 
  37. ^ Loss A.; Bunsmann P.; Bohne A.; Loss A.; Schwarzer E.; Lang E.; von der Lieth C.-W. (2002). "SWEET-DB: un intento de crear colecciones de datos anotados para carbohidratos". Nucleic Acids Research . 30 (1): 405–408. doi :10.1093/nar/30.1.405. PMC 99123 . PMID  11752350. 
  38. ^ Herget S.; Ranzinger R.; Maass K.; von der Lieth C.-W. (2008). "GlycoCT - un formato de secuencia unificador para carbohidratos". Investigación de carbohidratos . 343 (12): 2162–2171. doi :10.1016/j.carres.2008.03.011. PMID  18436199.
  39. ^ Tanaka K.; Aoki-Kinoshita KF; Kotera M.; Sawaki H.; Tsuchiya S.; Fujita N.; Shikanai T.; Kato M.; Kawano S.; Yamada I.; Narimatsu H. (2014). "WURCS: la representación única de Web3 de estructuras de carbohidratos". Revista de información y modelado químico . 54 (6): 1558-1566. doi : 10.1021/ci400571e . PMID  24897372.
  40. ^ Kirschner KN; Yongye AB; Tschampel SM; González-Outeiriño J.; Daniels CR; Foley BL; Woods RJ (2008). "GLYCAM06: un campo de fuerza biomolecular generalizable. Carbohidratos". Revista de Química Computacional . 29 (4): 622–655. doi :10.1002/jcc.20820. PMC 4423547 . PMID  17849372. 
  41. ^ Ranzinger R.; Aoki-Kinoshita KF; diputado Campbell; Kawano S.; Lütteke T.; Okuda S.; Shinmachi D.; Shikanai T.; Sawaki H.; Toukach Ph.V.; Matsubara M.; Yamada I.; Narimatsu H. (2015). "GlycoRDF: una ontología para estandarizar datos de Glycomics en RDF". Bioinformática . 31 (6): 919–925. doi : 10.1093/bioinformática/btu732. PMC 4380026 . PMID  25388145. 
  42. ^ Aoki-Kinoshita KF; Bolleman J.; diputado Campbell; Kawano S.; Kim J.; Lütteke T.; Matsubara M.; Okuda S.; Ranzinger R.; Sawaki H.; Shikanai T.; Shinmachi D.; Suzuki Y.; Toukach Ph.V.; Yamada I.; Empacador NH; Narimatsu H. (2013). "Introducción de datos de glucómica en la Web Semántica". Revista de Semántica Biomédica . 4 (1): ID 39. doi : 10.1186/2041-1480-4-39 . PMC 4177142 . PMID  24280648.