ChEMBL o ChEMBLdb es una base de datos química curada manualmente de moléculas bioactivas con propiedades inductoras de fármacos. [1] Es mantenida por el Instituto Europeo de Bioinformática (EBI), del Laboratorio Europeo de Biología Molecular ( EMBL ), con sede en el Wellcome Trust Genome Campus , Hinxton, Reino Unido.
La base de datos, conocida originalmente como StARlite, fue desarrollada por una empresa de biotecnología llamada Inpharmatica Ltd., posteriormente adquirida por Galapagos NV . Los datos fueron adquiridos para EMBL en 2008 con una adjudicación de The Wellcome Trust , [2] lo que dio como resultado la creación del grupo de quimiogenómica ChEMBL en EMBL-EBI, dirigido por John Overington. [3] [4]
La base de datos ChEMBL contiene datos de bioactividad de compuestos frente a fármacos diana. La bioactividad se expresa en Ki, Kd, IC50 y EC50. [5] Los datos se pueden filtrar y analizar para desarrollar bibliotecas de cribado de compuestos para la identificación de candidatos durante el descubrimiento de fármacos. [6]
La versión 2 de ChEMBL (ChEMBL_02) se lanzó en enero de 2010, e incluye 2,4 millones de mediciones de bioensayos que cubren 622.824 compuestos, incluidos 24.000 productos naturales. Esto se obtuvo a partir de la selección de más de 34.000 publicaciones en doce revistas de química médica . La cobertura de datos de bioactividad disponibles de ChEMBL ha crecido hasta convertirse en "la más completa jamás vista en una base de datos pública". [3] En octubre de 2010 se lanzó la versión 8 de ChEMBL (ChEMBL_08), con más de 2,97 millones de mediciones de bioensayos que cubren 636.269 compuestos. [7]
En ChEMBL_10 se agregaron los ensayos confirmatorios de PubChem , con el fin de integrar datos que sean comparables al tipo y clase de datos contenidos en ChEMBL. [8]
Se puede acceder a ChEMBLdb a través de una interfaz web o descargarse mediante el protocolo de transferencia de archivos . Está formateado de manera que sea compatible con la minería de datos computarizada e intenta estandarizar las actividades entre diferentes publicaciones para permitir el análisis comparativo. [1] ChEMBL también está integrado en otros recursos de química a gran escala, incluidos PubChem y el sistema ChemSpider de la Royal Society of Chemistry .
Además de la base de datos, el grupo ChEMBL ha desarrollado herramientas y recursos para la minería de datos. [9] Entre ellos se incluye Kinase SARfari, un banco de trabajo de quimiogenómica integrado centrado en las quinasas . El sistema incorpora y vincula datos de secuencia, estructura, compuestos y cribado .
GPCR SARfari es un banco de trabajo similar centrado en GPCR , y ChEMBL-Neglected Tropical Diseases (ChEMBL-NTD) es un repositorio de acceso abierto para la detección primaria y los datos de química medicinal dirigidos a las enfermedades tropicales endémicas de las regiones en desarrollo de África, Asia y las Américas. El objetivo principal de ChEMBL-NTD es proporcionar un archivo y centro de distribución permanente y de libre acceso para los datos depositados. [3]
En julio de 2012 se publicó un nuevo servicio de datos sobre la malaria , patrocinado por Medicines for Malaria Venture (MMV), y dirigido a investigadores de todo el mundo. Los datos de este servicio incluyen compuestos del conjunto de pruebas Malaria Box, así como otros datos sobre la malaria donados que se encuentran en ChEMBL-NTD.
myChEMBL, la máquina virtual ChEMBL, se lanzó en octubre de 2013 para permitir a los usuarios acceder a una infraestructura quimioinformática completa, gratuita y fácil de instalar.
En diciembre de 2013, las operaciones de la base de datos de informática de patentes de SureChem se transfirieron a EMBL-EBI. En un acrónimo, SureChem pasó a llamarse SureChEMBL.
En 2014 se introdujo el nuevo recurso ADME SARfari: una herramienta para predecir y comparar objetivos ADME entre especies. [10]