Base de datos de información química
PubChem es una base de datos de moléculas químicas y sus actividades frente a ensayos biológicos . El sistema es mantenido por el Centro Nacional de Información Biotecnológica (NCBI), un componente de la Biblioteca Nacional de Medicina , que forma parte de los Institutos Nacionales de Salud de los Estados Unidos (NIH). Se puede acceder a PubChem de forma gratuita a través de una interfaz de usuario web . Se pueden descargar de forma gratuita millones de estructuras de compuestos y conjuntos de datos descriptivos a través de FTP . PubChem contiene múltiples descripciones de sustancias y moléculas pequeñas con menos de 100 átomos y 1000 enlaces. Más de 80 proveedores de bases de datos contribuyen a la creciente base de datos PubChem. [2]
Historia
PubChem se lanzó en 2004 como un componente del Programa de Bibliotecas Moleculares (MLP) del NIH. A partir de noviembre de 2015, PubChem contiene más de 150 millones de descripciones de sustancias proporcionadas por depositantes, 60 millones de estructuras químicas únicas y 225 millones de resultados de pruebas de actividad biológica (de más de 1 millón de experimentos de ensayo realizados en más de 2 millones de moléculas pequeñas que cubren casi 10.000 secuencias de proteínas diana únicas que corresponden a más de 5.000 genes). También contiene ensayos de detección de interferencia de ARN (ARNi) que se dirigen a más de 15.000 genes. [3]
En agosto de 2018, PubChem contiene 247,3 millones de descripciones de sustancias y 96,5 millones de estructuras químicas únicas, aportadas por 629 fuentes de datos de 40 países. También contiene 237 millones de resultados de pruebas de bioactividad de 1,25 millones de ensayos biológicos, que abarcan más de 10 000 secuencias de proteínas objetivo. [4]
A partir de 2020, con la integración de datos de más de 100 nuevas fuentes, PubChem contiene más de 293 millones de descripciones de sustancias proporcionadas por depositantes, 111 millones de estructuras químicas únicas y 271 millones de puntos de datos de bioactividad de 1,2 millones de experimentos de ensayos biológicos. [5]
Bases de datos
PubChem consta de tres bases de datos primarias que crecen de forma dinámica. A partir del 5 de noviembre de 2020 (la cantidad de ensayos biológicos no ha cambiado):
- Compuestos, 111 millones de entradas [5] (frente a 94 millones de entradas en 2017 [4] ), contiene compuestos químicos puros y caracterizados. [6]
- Sustancias, 293 millones de entradas [5] (frente a 236 millones de entradas en 2017 [7] y 163 millones en septiembre de 2014 [8] ), contiene también mezclas, extractos , complejos y sustancias no caracterizadas.
- BioAssay, resultados de bioactividad de 1,25 millones [9] (frente a 6000 en septiembre de 2014 [10] ) de programas de detección de alto rendimiento con varios millones de valores.
Búsqueda
Es posible buscar en las bases de datos una amplia gama de propiedades, incluidas la estructura química, los fragmentos de nombres, la fórmula química , el peso molecular , XLogP y el número de donantes y aceptores de enlaces de hidrógeno .
PubChem contiene su propio editor de moléculas en línea con soporte para SMILES /SMARTS e InChI que permite la importación y exportación de todos los formatos de archivos químicos comunes para buscar estructuras y fragmentos.
Cada resultado proporciona información sobre sinónimos, propiedades químicas, estructura química (incluidas cadenas SMILES e InChI), bioactividad y enlaces a compuestos estructuralmente relacionados y otras bases de datos del NCBI como PubMed .
En el formulario de búsqueda de texto, se puede buscar en los campos de la base de datos añadiendo el nombre del campo entre corchetes al término de búsqueda. Un rango numérico se representa con dos números separados por dos puntos. Los términos de búsqueda y los nombres de los campos no distinguen entre mayúsculas y minúsculas. Se pueden utilizar paréntesis y los operadores lógicos AND, OR y NOT. Se supone que se utiliza AND si no se utiliza ningún operador.
Ejemplo ( Regla de cinco de Lipinski ):
0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]
Campos de base de datos
Véase también
- Base de datos química
- CAS Common Chemistry, dirigido por la Sociedad Química Estadounidense
- Base de datos de toxicogenómica comparativa , administrada por la Universidad Estatal de Carolina del Norte
- ChEMBL , dirigido por el Instituto Europeo de Bioinformática
- ChemSpider , dirigido por la Real Sociedad de Química del Reino Unido
- DrugBank , administrado por la Universidad de Alberta
- IUPAC - dirigida por la Unión Internacional de Química Pura y Aplicada (IUPAC) con sede en Suiza
- Moltable, administrado por el Laboratorio Químico Nacional de la India
- PubChem, administrado por el Instituto Nacional de Salud de EE. UU.
- BindingDB , administrado por la Universidad de California, San Diego
- SCRIPDB , administrado por la Universidad de Toronto, Canadá
- Centro Nacional de Información Biotecnológica (NCBI), dirigido por el Instituto Nacional de Salud de EE. UU.
- Entrez - dirigido por el Instituto Nacional de Salud de EE. UU.
- GenBank , administrado por el Instituto Nacional de Salud de EE. UU.
Referencias
- ^ Kim, Sunghwan; Thiessen, Paul A.; Cheng, Tiejun; Zhang, Jian; Gindulyte, Asta; Bolton, Evan E. (9 de agosto de 2019). "PUG-View: acceso programático a anotaciones químicas integradas en PubChem". Revista de quimioinformática . 11 (1): 56. doi : 10.1186/s13321-019-0375-2 . PMC 6688265 . PMID 31399858.
- ^ "Información de fuentes de PubChem". El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica.
- ^ Kim, Sunghwan; Thiessen, Paul A.; Cheng, Tiejun; Yu, Bo; Shoemaker, Benjamin A.; Wang, Jiyao; Bolton, Evan E.; Wang, Yanli; Bryant, Stephen H. (2016). "Información bibliográfica en PubChem: asociaciones entre registros de PubChem y artículos científicos". Journal of Cheminformatics . 8 : Artículo 32. doi : 10.1186/s13321-016-0142-6 . PMC 4901473 . PMID 27293485.
- ^ ab "Resultados de la búsqueda para todos los compuestos" . Consultado el 28 de enero de 2016 .
- ^ abc Kim, Sunghwan; Chen, Jie; Cheng, Tiejun; Gindulyte, Asta; Él, Jia; Él, Siqian; Li, Qingliang; Zapatero, Benjamín A; Thiessen, Paul A; Yu, Bo; Zaslavsky, Leonid; Zhang, Jian; Bolton, Evan E (8 de enero de 2021). "PubChem en 2021: nuevo contenido de datos e interfaces web mejoradas". Investigación de ácidos nucleicos . 49 (D1): D1388 – D1395. doi : 10.1093/nar/gkaa971 . PMC 7778930 . PMID 33151290.
- ^ "all[filt] - Resultados de compuestos de PubChem". The PubChem Project . EE. UU.: Centro Nacional de Información Biotecnológica . Consultado el 7 de enero de 2011 .
- ^ "all[filt] - Resultados de sustancias de PubChem". The PubChem Project . EE. UU.: Centro Nacional de Información Biotecnológica . Consultado el 28 de enero de 2016 .
- ^ "all[filt] - Resultados de sustancias de PubChem". The PubChem Project . EE. UU.: Centro Nacional de Información Biotecnológica . Consultado el 7 de enero de 2011 .
- ^ "all[filt] - PubChem BioAssay Results". El Proyecto PubChem . EE. UU.: Centro Nacional de Información Biotecnológica . Consultado el 28 de enero de 2016 .
- ^ "all[filt] - PubChem BioAssay Results". El Proyecto PubChem . EE. UU.: Centro Nacional de Información Biotecnológica . Consultado el 7 de enero de 2011 .
- ^ Cheng T (noviembre de 2007). "Cálculo de coeficientes de partición octanol-agua guiando un modelo aditivo con conocimiento". Revista de información y modelado químico . 47 (6): 2140–2148. doi :10.1021/ci700257y. PMID 17985865.
Enlaces externos