El análisis de pares moleculares emparejados ( MMPA ) es un método en quimioinformática que compara las propiedades de dos moléculas que difieren solo por una única transformación química, como la sustitución de un átomo de hidrógeno por uno de cloro. Estos pares de compuestos se conocen como pares moleculares emparejados (MMP). Debido a que la diferencia estructural entre las dos moléculas es pequeña, cualquier cambio observado experimentalmente en una propiedad física o biológica entre el par molecular emparejado se puede interpretar más fácilmente. El término fue acuñado por primera vez por Kenny y Sadowski en el libro Chemoinformatics in Drug Discovery . [1]
Los MMP pueden definirse como un par de moléculas que difieren en un único cambio puntual menor (véase la figura 1). Los pares moleculares emparejados (MMP) se utilizan ampliamente en la química médica para estudiar los cambios en las propiedades de los compuestos, que incluyen la actividad biológica , la toxicidad, los riesgos ambientales y mucho más, que están asociados con modificaciones estructurales bien definidas. Los cambios puntuales en los pares de moléculas se denominan transformación química o transformación molecular. Cada par molecular está asociado con una transformación particular. Un ejemplo de transformación es el reemplazo de un grupo funcional por otro. Más específicamente, la transformación molecular puede definirse como el reemplazo de un fragmento molecular que tiene uno, dos o tres puntos de unión con otro fragmento. La transformación molecular útil en un contexto específico se denomina transformaciones "significativas". Por ejemplo, una transformación puede disminuir o aumentar sistemáticamente una propiedad deseada de los compuestos químicos. Las transformaciones que afectan a una propiedad/actividad particular en un sentido estadísticamente significativo se denominan transformaciones significativas. La transformación se considera significativa si aumenta el valor de la propiedad "más a menudo" de lo que lo disminuye o viceversa. Por lo tanto, la distribución de pares crecientes y decrecientes debe ser significativamente diferente de la distribución binomial ("sin efecto") con un valor p particular (generalmente 0,05).
El análisis basado en MMP es un método atractivo para el análisis computacional porque se pueden generar algorítmicamente y permiten asociar modificaciones estructurales definidas a nivel de pares de compuestos con cambios en las propiedades químicas, incluida la actividad biológica. [2] [3] [4]
El MMPA es bastante útil en el campo de los estudios de modelado de la relación cuantitativa estructura-actividad (QSAR). Uno de los problemas de los modelos QSAR es que son difíciles de interpretar de una manera químicamente significativa. Si bien puede ser bastante fácil interpretar modelos de regresión lineal simples, los algoritmos más poderosos como las redes neuronales y las máquinas de vectores de soporte son similares a "cajas negras", que brindan predicciones que no se pueden interpretar fácilmente. [5] Este problema socava la aplicabilidad del modelo QSAR para ayudar al químico medicinal a tomar la decisión. Si se predice que el compuesto será activo contra algún microorganismo, ¿cuáles son los factores impulsores de su actividad? O si se predice que será inactivo, ¿cómo se puede modular su actividad? La naturaleza de caja negra del modelo QSAR le impide abordar estas cuestiones cruciales. El uso de MMP predichas permite interpretar modelos e identificar qué MMP aprendió el modelo. [6] Las MMP, que no fueron reproducidas por el modelo, podrían corresponder a errores experimentales o deficiencias del modelo (descriptores inapropiados, muy pocos datos, etc.). [ cita requerida ]
El análisis de MMP (pares moleculares emparejados) puede ser muy útil para comprender el mecanismo de acción. Un químico farmacéutico podría estar particularmente interesado en el "acantilado de actividad". El acantilado de actividad es una modificación estructural menor que cambia significativamente la actividad del objetivo. [ cita requerida ]
Los acantilados de actividad son pares o grupos de compuestos que son muy similares en sus estructuras pero que tienen grandes diferencias en potencia hacia el mismo objetivo. [7] Los acantilados de actividad recibieron gran atención en la química computacional y el descubrimiento de fármacos, ya que representan una discontinuidad en la relación estructura-actividad (SAR). [7] Esta discontinuidad también indica un alto contenido de información SAR, porque pequeños cambios químicos en el conjunto de compuestos similares conducen a grandes cambios en la actividad. La evaluación de los acantilados de actividad requiere una consideración cuidadosa de los criterios de similitud y diferencia de potencia. [8] [9] [10]
Los análisis de pares moleculares coincidentes (MMPA) se pueden clasificar en dos tipos: MMPA supervisado y no supervisado.
En la MMPA supervisada, las transformaciones químicas están predefinidas, luego se encuentran los compuestos emparejados correspondientes dentro del conjunto de datos y se calcula el cambio en el punto final para cada transformación. [ cita requerida ]
También conocidas como MMPA automatizadas. Se utiliza un algoritmo de aprendizaje automático para encontrar todos los pares coincidentes posibles en un conjunto de datos según un conjunto de reglas predefinidas. Esto da como resultado una cantidad mucho mayor de pares coincidentes y transformaciones únicas, que normalmente se filtran durante el proceso para identificar aquellas transformaciones que corresponden a cambios estadísticamente significativos en la propiedad en cuestión con una cantidad razonable de pares coincidentes. [ cita requerida ]
En este caso, en lugar de considerar el par de moléculas que difieren solo en un punto, se considera una serie de más de dos moléculas que difieren en un solo punto. El concepto de series moleculares coincidentes fue introducido por Wawer y Bajorath. [11] Se sostiene que es más probable que las series coincidentes más largas muestren una transformación molecular preferida, mientras que los pares coincidentes muestran solo una pequeña preferencia. [12]
La aplicación del MMPA en grandes bases de datos químicas para optimizar la potencia de los ligandos es problemática porque una misma transformación estructural puede aumentar o disminuir o no afectar la potencia de diferentes compuestos en el conjunto de datos. La selección de una transformación significativa práctica a partir de un conjunto de datos de moléculas es un problema complejo en el MMPA. Además, el efecto de una transformación molecular particular puede depender significativamente del contexto químico de las transformaciones. [13] [14]
Además de esto, el MMPA puede presentar algunas limitaciones en términos de recursos computacionales, especialmente cuando se trabaja con bases de datos de compuestos con una gran cantidad de enlaces rompibles. Además, más átomos en la parte variable de la molécula también conducen a problemas de explosión combinatoria. Para lidiar con esto, la cantidad de enlaces rompibles y la cantidad de átomos en la parte variable se pueden usar para prefiltrar la base de datos.