stringtranslate.com

Banco de datos de proteínas

El Protein Data Bank ( PDB ) [1] es una base de datos para datos estructurales tridimensionales de grandes moléculas biológicas, como proteínas y ácidos nucleicos . Los datos, obtenidos normalmente mediante cristalografía de rayos X , espectroscopia de RMN o, cada vez más, microscopía crioelectrónica , y presentados por biólogos y bioquímicos de todo el mundo, son de libre acceso en Internet a través de los sitios web de sus organizaciones miembros (PDBe, [2] PDBj, [3] RCSB, [4] y BMRB [5] ). El PDB está supervisado por una organización llamada Worldwide Protein Data Bank , wwPDB.

El PDB es clave en áreas de la biología estructural , como la genómica estructural . La mayoría de las principales revistas científicas y algunas agencias de financiación exigen ahora que los científicos envíen sus datos estructurales al PDB. Muchas otras bases de datos utilizan estructuras de proteínas depositadas en el PDB. Por ejemplo, SCOP y CATH clasifican estructuras de proteínas, mientras que PDBsum proporciona una descripción gráfica de las entradas de PDB utilizando información de otras fuentes, como Gene Ontology . [6] [7]

Historia

Dos fuerzas convergieron para iniciar el PDB: una colección pequeña pero creciente de conjuntos de datos de estructuras de proteínas determinados por difracción de rayos X; y la pantalla de gráficos moleculares recientemente disponible (1968), Brookhaven RAster Display (BRAD), para visualizar estas estructuras de proteínas en 3-D. En 1969, con el patrocinio de Walter Hamilton en el Laboratorio Nacional Brookhaven , Edgar Meyer ( Universidad Texas A&M ) comenzó a escribir software para almacenar archivos de coordenadas atómicas en un formato común para que estuvieran disponibles para evaluación geométrica y gráfica. En 1971, uno de los programas de Meyer, SEARCH, permitió a los investigadores acceder de forma remota a información de la base de datos para estudiar estructuras de proteínas fuera de línea. [8] SEARCH fue fundamental para permitir la creación de redes, marcando así el comienzo funcional del PDB.

El Protein Data Bank se anunció en octubre de 1971 en Nature New Biology [9] como una empresa conjunta entre el Cambridge Crystallographic Data Center , Reino Unido, y el Brookhaven National Laboratory, Estados Unidos.

Tras la muerte de Hamilton en 1973, Tom Koetzle asumió la dirección del PDB durante los siguientes 20 años. En enero de 1994, Joel Sussman, del Instituto Weizmann de Ciencias de Israel , fue nombrado director del PDB. En octubre de 1998, [10] el PDB fue transferido al Laboratorio de Investigación en Bioinformática Estructural (RCSB); [11] la transferencia se completó en junio de 1999. La nueva directora fue Helen M. Berman de la Universidad Rutgers (una de las instituciones gestoras de la RCSB, la otra es el Centro de Supercomputación de San Diego en UC San Diego ). [12] En 2003, con la formación del wwPDB, el PDB se convirtió en una organización internacional. Los miembros fundadores son PDBe (Europa), [2] RCSB (EE.UU.) y PDBj (Japón). [3] La BMRB [5] se unió en 2006. Cada uno de los cuatro miembros de wwPDB puede actuar como centro de depósito, procesamiento de datos y distribución de datos del PDB. El procesamiento de datos se refiere al hecho de que el personal de wwPDB revisa y anota cada entrada enviada. [13] A continuación, se comprueba automáticamente la verosimilitud de los datos (el código fuente [14] de este software de validación se ha puesto a disposición del público sin coste alguno).

Contenido

Ejemplos de estructuras de proteínas del PDB (creadas con UCSF Chimera)
Tasa de determinación de la estructura de proteínas por método y año. MX = cristalografía macromolecular , 3DEM = Microscopía Electrónica 3D . [15]

La base de datos del PDB se actualiza semanalmente ( UTC +0 miércoles), junto con su lista de existencias. [16] A 10 de enero de 2023 , el AP estaba compuesto por:

162.041 estructuras en el PDB tienen un archivo de factor de estructura .
11.242 estructuras cuentan con un expediente de restricción por RMN.
5.774 estructuras del PDB cuentan con expediente de turnos químicos .
13.388 estructuras en el PDB tienen un archivo de mapa 3DEM depositado en EM Data Bank

La mayoría de las estructuras se determinan mediante difracción de rayos X, pero aproximadamente el 7% de las estructuras se determinan mediante RMN de proteínas . Cuando se utiliza la difracción de rayos X se obtienen aproximaciones de las coordenadas de los átomos de la proteína, mientras que mediante la RMN se estima la distancia entre pares de átomos de la proteína. La conformación final de la proteína se obtiene a partir de RMN resolviendo un problema de geometría de distancias . A partir de 2013, se determina un número cada vez mayor de proteínas mediante microscopía crioelectrónica .

Para estructuras PDB determinadas por difracción de rayos X que tienen un archivo de factor de estructura, se puede ver su mapa de densidad electrónica. Los datos de dichas estructuras pueden consultarse en los tres sitios web del PDB.

Históricamente, el número de estructuras en el PDB ha crecido a un ritmo aproximadamente exponencial, con 100 estructuras registradas en 1982, 1.000 estructuras en 1993, 10.000 en 1999, 100.000 en 2014 y 200.000 en enero de 2023. [17] [18]

Formato de archivo

El formato de archivo utilizado inicialmente por el PDB se llamó formato de archivo PDB. El formato original estaba restringido por el ancho de las tarjetas perforadas de computadora a 80 caracteres por línea. Alrededor de 1996, se introdujo gradualmente el formato de "archivo de información cristalográfica macromolecular", mmCIF, que es una extensión del formato CIF . mmCIF se convirtió en el formato estándar para el archivo PDB en 2014. [19] En 2019, la wwPDB anunció que las deposiciones para Los métodos cristalográficos solo se aceptarían en formato mmCIF. [20]

En 2005 se describió una versión XML de PDB, llamada PDBML. [21] Los archivos de estructura se pueden descargar en cualquiera de estos tres formatos, aunque un número cada vez mayor de estructuras no se ajustan al formato PDB heredado. Los archivos individuales se descargan fácilmente en paquetes de gráficos desde URL de Internet :

" 4hhb" es el identificador de PDB. Cada estructura publicada en PDB recibe un identificador alfanumérico de cuatro caracteres, su PDB ID. (Este no es un identificador único para biomoléculas, porque varias estructuras para la misma molécula, en diferentes entornos o conformaciones, pueden estar contenidas en PDB con diferentes ID de PDB).

Ver los datos

Los archivos de estructura se pueden ver utilizando uno de varios programas informáticos gratuitos y de código abierto , incluidos Jmol , Pymol , VMD , Molstar y Rasmol . Otros programas shareware no gratuitos incluyen ICM-Browser, [22] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [23] StarBiochem [24] (un visor molecular interactivo basado en Java con búsqueda integrada de banco de datos de proteínas), Sirius y VisProt3DS [25] (una herramienta para visualización de proteínas en vista estereoscópica 3D en anaglifo y otros modos), y Discovery Studio . El sitio web de RCSB PDB contiene una lista extensa de programas de visualización de moléculas y complementos de navegador web, tanto gratuitos como comerciales.

Ver también

Referencias

  1. ^ wwPDB, Consorcio (2019). "Protein Data Bank: el archivo global único para datos de estructuras macromoleculares 3D". Ácidos nucleicos Res . 47 (D1): 520–528. doi : 10.1093/nar/gky949. PMC 6324056 . PMID  30357364. 
  2. ^ ab "PDBe inicio <Nodo <EMBL-EBI". pdbe.org .
  3. ^ ab "Banco de datos de proteínas de Japón - PDB Japón - PDBj". pdbj.org .
  4. ^ Banco, datos de proteínas RCSB. "RCSB PDB: página de inicio". rcsb.org .
  5. ^ ab "Banco de Resonancia Magnética Biológica". bmrb.wisc.edu .
  6. ^ Berman, HM (enero de 2008). "El Banco de Datos de Proteínas: una perspectiva histórica" ​​(PDF) . Acta Crystallographica Sección A. A64 (1): 88–95. doi : 10.1107/S0108767307035623 . PMID  18156675.
  7. ^ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (diciembre de 1997). "PDBsum: una base de datos basada en la web de resúmenes y análisis de todas las estructuras de PDB". Tendencias Bioquímica. Ciencia . 22 (12): 488–90. doi :10.1016/S0968-0004(97)01140-7. PMID  9433130.
  8. ^ Meyer EF (1997). "Los primeros años del Banco de Datos de Proteínas". Ciencia de las proteínas . Prensa de la Universidad de Cambridge. 6 (7): 1591-1597. doi :10.1002/pro.5560060724. PMC 2143743 . PMID  9232661. 
  9. ^ "Banco de datos de proteínas". Naturaleza Nueva Biología . 233 . 1971. doi : 10.1038/newbio233223b0 .
  10. ^ Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (enero de 2000). "El banco de datos de proteínas". Ácidos nucleicos Res . 28 (1): 235–242. doi :10.1093/nar/28.1.235. PMC 102472 . PMID  10592235. 
  11. ^ "Colaboratorio de Investigación en Bioinformática Estructural". RCSB.org . Colaboratorio de Investigación en Bioinformática Estructural. Archivado desde el original el 5 de febrero de 2007.
  12. ^ "Archivo de boletines RCSB PDB". Banco de datos de proteínas RCSB.
  13. ^ Curry E, Freitas A, O'Riáin S (2010). "El papel de la conservación de datos impulsada por la comunidad para las empresas". En D. Wood (ed.). Vinculación de datos empresariales . Boston: Springer Estados Unidos. págs. 25–47. ISBN 978-1-441-97664-2.
  14. ^ "Suite de validación de PDB". sw-tools.pdb.org .
  15. ^ Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD y col. (consorcio wwPDB) (enero de 2019). "Protein Data Bank: el archivo global único para datos de estructuras macromoleculares 3D". Investigación de ácidos nucleicos . 47 (D1): D520–D528. doi : 10.1093/nar/gky949. PMC 6324056 . PMID  30357364. 
  16. ^ "Desglose de las tenencias actuales del PDB". RCSB. Archivado desde el original el 4 de julio de 2007 . Consultado el 2 de julio de 2007 .
  17. ^ Luego (2014). "Datos concretos: no ha sido poca cosa para el banco de datos de proteínas seguir siendo relevante para 100.000 estructuras". Naturaleza . 509 (7500): 260.doi : 10.1038 /509260a . PMID  24834514.
  18. ^ Banco de datos de proteínas. "Estadísticas del PDB: crecimiento general de estructuras liberadas por año". www.rcsb.org . Consultado el 12 de enero de 2023 .
  19. ^ "wwPDB: formatos de archivo y PDB". www.wwpdb.org . Consultado el 1 de abril de 2020 .
  20. ^ wwPDB.org. "wwPDB: Noticias de 2019". www.wwpdb.org .
  21. ^ Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (abril de 2005). "PDBML: la representación de datos de estructura macromolecular de archivo en XML". Bioinformática . 21 (7): 988–992. doi : 10.1093/bioinformática/bti082 . PMID  15509603.
  22. ^ "Navegador ICM". Molsoft LLC . Consultado el 6 de abril de 2013 .
  23. ^ "Visor PDB suizo". Instituto Suizo de Bioinformática . Consultado el 6 de abril de 2013 .
  24. ^ "ESTRELLA: Bioquímica - Inicio". web.mit.edu .
  25. ^ "VisProt3DS". Sistemas moleculares Ltd. Consultado el 6 de abril de 2013 .

enlaces externos