La similitud química (o similitud molecular ) se refiere a la similitud de elementos químicos , moléculas o compuestos químicos con respecto a cualidades estructurales o funcionales, es decir, el efecto que el compuesto químico tiene sobre los compañeros de reacción en entornos inorgánicos o biológicos. Los efectos biológicos y, por lo tanto, también la similitud de efectos, generalmente se cuantifican utilizando la actividad biológica de un compuesto. En términos generales, la función puede estar relacionada con la actividad química de los compuestos (entre otros).
La noción de similitud química (o similitud molecular ) es uno de los conceptos más importantes en quimioinformática . [1] [2] Desempeña un papel importante en los enfoques modernos para predecir las propiedades de los compuestos químicos, diseñar productos químicos con un conjunto predefinido de propiedades y, especialmente, en la realización de estudios de diseño de fármacos mediante el cribado de grandes bases de datos que contienen estructuras de productos químicos disponibles (o potencialmente disponibles). Estos estudios se basan en el principio de propiedad similar de Johnson y Maggiora, que establece: los compuestos similares tienen propiedades similares . [1]
La similitud química suele describirse como una medida inversa de la distancia en el espacio de descriptores. Ejemplos de medidas de distancia inversa son los núcleos moleculares , que miden la similitud estructural de los compuestos químicos. [3]
El cribado virtual basado en similitud [4] (un tipo de cribado virtual basado en ligandos) supone que todos los compuestos de una base de datos que son similares a un compuesto de consulta tienen una actividad biológica similar. Aunque esta hipótesis no siempre es válida, [5] muy a menudo el conjunto de compuestos recuperados se enriquece considerablemente con activos. [6] Para lograr una alta eficacia del cribado basado en similitud de bases de datos que contienen millones de compuestos, las estructuras moleculares suelen representarse mediante cribado molecular (claves estructurales) o mediante huellas dactilares moleculares de tamaño fijo o variable . Los cribado molecular y las huellas dactilares pueden contener información tanto 2D como 3D. Sin embargo, las huellas dactilares 2D, que son un tipo de descriptores de fragmentos binarios, dominan en esta área. Las claves estructurales basadas en fragmentos, como las claves MDL, [7] son suficientemente buenas para manejar bases de datos químicas de tamaño pequeño y mediano, mientras que el procesamiento de bases de datos grandes se realiza con huellas dactilares que tienen una densidad de información mucho mayor. Los ejemplos más conocidos son las huellas dactilares Daylight basadas en fragmentos, [8] BCI, [9] y UNITY 2D (Tripos [10] ). La medida de similitud más popular para comparar estructuras químicas representadas por medio de huellas dactilares es el coeficiente T de Tanimoto (o Jaccard) . Por lo general, se considera que dos estructuras son similares si T > 0,85 (para huellas dactilares Daylight). Sin embargo, es un error común pensar que una similitud de T > 0,85 refleja bioactividades similares en general ("el mito de 0,85"). [11]
El concepto de similitud química se puede ampliar para considerar la teoría de redes de similitud química , donde las propiedades descriptivas de la red y la teoría de grafos se pueden aplicar para analizar un gran espacio químico , estimar la diversidad química y predecir el objetivo del fármaco . Recientemente, también se han desarrollado redes de similitud química 3D basadas en la conformación de ligando 3D, que se pueden utilizar para identificar ligandos que saltan de andamiaje.