En el campo del modelado molecular , el acoplamiento es un método que predice la orientación preferida de una molécula con respecto a una segunda cuando un ligando y una diana se unen entre sí para formar un complejo estable . [1] El conocimiento de la orientación preferida, a su vez, se puede utilizar para predecir la fuerza de asociación o la afinidad de unión entre dos moléculas utilizando, por ejemplo, funciones de puntuación .
Las asociaciones entre moléculas biológicamente relevantes como proteínas , péptidos , ácidos nucleicos , carbohidratos y lípidos desempeñan un papel central en la transducción de señales . Además, la orientación relativa de los dos socios que interactúan puede afectar el tipo de señal producida (p. ej., agonismo versus antagonismo ). Por lo tanto, el acoplamiento es útil para predecir tanto la intensidad como el tipo de señal producida.
El acoplamiento molecular es uno de los métodos más utilizados en el diseño de fármacos basado en la estructura , debido a su capacidad para predecir la conformación de unión de ligandos de moléculas pequeñas al sitio de unión objetivo apropiado . La caracterización del comportamiento de unión juega un papel importante en el diseño racional de fármacos , así como para dilucidar procesos bioquímicos fundamentales. [2] [3]
Se puede pensar en el acoplamiento molecular como un problema de “cerradura y llave” , en el que se quiere encontrar la orientación relativa correcta de la “llave” que abrirá la “cerradura” (en qué parte de la superficie de la cerradura está el orificio de la llave, en qué dirección girar la llave después de insertarla, etc.). En este caso, se puede considerar a la proteína como la “cerradura” y al ligando como una “llave”. El acoplamiento molecular puede definirse como un problema de optimización, que describiría la orientación de "mejor ajuste" de un ligando que se une a una proteína de interés particular. Sin embargo, dado que tanto el ligando como la proteína son flexibles, una analogía de "mano a mano" es más apropiada que la de "llave y candado" . [4] Durante el curso del proceso de acoplamiento, el ligando y la proteína ajustan su conformación para lograr un "mejor ajuste" general y este tipo de ajuste conformacional que da como resultado la unión general se denomina "ajuste inducido" . [5]
La investigación sobre acoplamiento molecular se centra en la simulación computacional del proceso de reconocimiento molecular . Su objetivo es lograr una conformación optimizada tanto para la proteína como para el ligando y una orientación relativa entre la proteína y el ligando de modo que se minimice la energía libre del sistema general.
Dos enfoques son particularmente populares dentro de la comunidad de acoplamiento molecular.
Ambos enfoques tienen ventajas significativas, así como algunas limitaciones. Estos se describen a continuación.
Los métodos de coincidencia geométrica/complementariedad de forma describen la proteína y el ligando como un conjunto de características que los hacen acoplables. [10] Estas características pueden incluir descriptores de superficie molecular /superficie complementaria. En este caso, la superficie molecular del receptor se describe en términos de su área superficial accesible al disolvente y la superficie molecular del ligando se describe en términos de su descripción de superficie coincidente. La complementariedad entre las dos superficies equivale a la descripción de coincidencia de formas que puede ayudar a encontrar la postura complementaria de acoplamiento de las moléculas objetivo y ligando. Otro enfoque consiste en describir las características hidrofóbicas de la proteína utilizando giros en los átomos de la cadena principal. Otro enfoque más es utilizar una técnica de descriptor de forma de Fourier. [11] [12] [13] Mientras que los enfoques basados en la complementariedad de formas suelen ser rápidos y robustos, generalmente no pueden modelar los movimientos o cambios dinámicos en las conformaciones de ligando/proteína con precisión, aunque desarrollos recientes permiten que estos métodos investiguen la flexibilidad del ligando. Los métodos de complementariedad de formas pueden escanear rápidamente varios miles de ligandos en cuestión de segundos y realmente determinar si pueden unirse al sitio activo de la proteína y, por lo general, son escalables incluso para interacciones proteína-proteína. También son mucho más susceptibles a los enfoques basados en farmacóforos , ya que utilizan descripciones geométricas de los ligandos para encontrar una unión óptima.
Simular el proceso de acoplamiento es mucho más complicado. En este enfoque, la proteína y el ligando están separados por cierta distancia física, y el ligando encuentra su posición en el sitio activo de la proteína después de una cierta cantidad de "movimientos" en su espacio conformacional. Los movimientos incorporan transformaciones de cuerpos rígidos, como traslaciones y rotaciones, así como cambios internos en la estructura del ligando, incluidas rotaciones en ángulos de torsión. Cada uno de estos movimientos en el espacio de conformación del ligando induce un coste energético total del sistema. Por tanto, la energía total del sistema se calcula después de cada movimiento.
La ventaja obvia de la simulación de acoplamiento es que la flexibilidad del ligando se incorpora fácilmente, mientras que las técnicas de complementariedad de forma deben utilizar métodos ingeniosos para incorporar flexibilidad en los ligandos. Además, modela con mayor precisión la realidad, mientras que las técnicas complementarias de formas son más bien una abstracción.
Claramente, la simulación es computacionalmente costosa y tiene que explorar un gran panorama energético. Las técnicas basadas en cuadrículas, los métodos de optimización y el aumento de la velocidad de las computadoras han hecho que la simulación de acoplamiento sea más realista.
Para realizar una pantalla de acoplamiento, el primer requisito es una estructura de la proteína de interés. Por lo general, la estructura se ha determinado mediante una técnica biofísica como
pero también puede derivar de la construcción de modelos de homología . Esta estructura proteica y una base de datos de ligandos potenciales sirven como entradas para un programa de acoplamiento. El éxito de un programa de acoplamiento depende de dos componentes: el algoritmo de búsqueda y la función de puntuación .
En teoría, el espacio de búsqueda consta de todas las orientaciones y conformaciones posibles de la proteína emparejada con el ligando. Sin embargo, en la práctica con los recursos computacionales actuales, es imposible explorar exhaustivamente el espacio de búsqueda; esto implicaría enumerar todas las posibles distorsiones de cada molécula (las moléculas son dinámicas y existen en un conjunto de estados conformacionales) y todas las posibles orientaciones rotacionales y traslacionales de el ligando en relación con la proteína en un nivel dado de granularidad . La mayoría de los programas de acoplamiento en uso tienen en cuenta todo el espacio conformacional del ligando (ligando flexible) y varios intentan modelar un receptor de proteína flexible. Cada "instantánea" de la pareja se denomina pose . [14]
Se han aplicado diversas estrategias de búsqueda conformacional al ligando y al receptor. Éstas incluyen:
Se pueden generar conformaciones del ligando en ausencia del receptor y posteriormente acoplarlo [15] o se pueden generar conformaciones sobre la marcha en presencia de la cavidad de unión del receptor, [16] o con total flexibilidad rotacional de cada ángulo diédrico. utilizando acoplamiento basado en fragmentos. [17] La evaluación de la energía del campo de fuerza se utiliza con mayor frecuencia para seleccionar conformaciones energéticamente razonables, [18] pero también se han utilizado métodos basados en el conocimiento. [19]
Los péptidos son moléculas muy flexibles y de tamaño relativamente grande, lo que hace que modelar su flexibilidad sea una tarea desafiante. Se desarrollaron varios métodos para permitir un modelado eficiente de la flexibilidad de los péptidos durante el acoplamiento proteína-péptido. [20]
La capacidad computacional ha aumentado dramáticamente durante la última década, haciendo posible el uso de métodos más sofisticados y computacionalmente intensivos en el diseño de fármacos asistido por computadora. Sin embargo, abordar la flexibilidad de los receptores en las metodologías de acoplamiento sigue siendo un tema espinoso. [21] La principal razón detrás de esta dificultad es el gran número de grados de libertad que deben considerarse en este tipo de cálculos. Sin embargo, descuidarlo en algunos de los casos puede conducir a malos resultados de acoplamiento en términos de predicción de la postura de enlace. [22]
A menudo se utilizan múltiples estructuras estáticas determinadas experimentalmente para la misma proteína en diferentes conformaciones para emular la flexibilidad del receptor. [23] Alternativamente, se pueden buscar bibliotecas de rotámeros de cadenas laterales de aminoácidos que rodean la cavidad de unión para generar conformaciones de proteínas alternativas pero energéticamente razonables. [24] [25]
Los programas de acoplamiento generan una gran cantidad de posibles posiciones de ligando, algunas de las cuales pueden rechazarse inmediatamente debido a choques con la proteína. El resto se evalúa utilizando alguna función de puntuación, que toma una pose como entrada y devuelve un número que indica la probabilidad de que la pose represente una interacción de unión favorable y clasifica un ligando en relación con otro.
La mayoría de las funciones de puntuación son campos de fuerza de mecánica molecular basados en la física que estiman la energía de la postura dentro del sitio de unión. Las diversas contribuciones a la vinculación se pueden escribir como una ecuación aditiva:
Los componentes consisten en efectos solventes, cambios conformacionales en la proteína y el ligando, energía libre debido a interacciones proteína-ligando, rotaciones internas, energía de asociación del ligando y el receptor para formar un único complejo y energía libre debido a cambios en los modos vibratorios. [26] Una energía baja (negativa) indica un sistema estable y, por lo tanto, una probable interacción vinculante.
Los enfoques alternativos utilizan funciones de puntuación modificadas para incluir restricciones basadas en interacciones proteína-ligando clave conocidas, [27] o potenciales basados en el conocimiento derivados de interacciones observadas en grandes bases de datos de estructuras proteína-ligando (por ejemplo, el Protein Data Bank ). [28]
Existe una gran cantidad de estructuras de cristalografía de rayos X para complejos entre proteínas y ligandos de alta afinidad, pero comparativamente menos para ligandos de baja afinidad, ya que estos últimos complejos tienden a ser menos estables y, por lo tanto, más difíciles de cristalizar. Las funciones de puntuación entrenadas con estos datos pueden acoplar correctamente ligandos de alta afinidad, pero también proporcionarán conformaciones acopladas plausibles para ligandos que no se unen. Esto produce un gran número de resultados falsos positivos , es decir, ligandos que se predice que se unirán a la proteína que en realidad no lo hacen cuando se colocan juntos en un tubo de ensayo.
Una forma de reducir el número de falsos positivos es recalcular la energía de las posturas con mayor puntuación utilizando técnicas (potencialmente) más precisas pero computacionalmente más intensivas, como los métodos de Born generalizado o Poisson-Boltzmann . [9]
La interdependencia entre la función de muestreo y puntuación afecta la capacidad de acoplamiento para predecir posturas plausibles o afinidades de unión para nuevos compuestos. Por lo tanto, generalmente se requiere una evaluación de un protocolo de atraque (cuando se dispone de datos experimentales) para determinar su capacidad predictiva. La evaluación del atraque se puede realizar utilizando diferentes estrategias, tales como:
La precisión del acoplamiento [30] [31] representa una medida para cuantificar la idoneidad de un programa de acoplamiento racionalizando la capacidad de predecir la postura correcta de un ligando con respecto a la observada experimentalmente. [32]
Las pantallas de acoplamiento también se pueden evaluar mediante el enriquecimiento de ligandos anotados de aglutinantes conocidos de entre una gran base de datos de moléculas “ señuelo ” presuntamente no vinculantes. [29] De esta manera, el éxito de una pantalla de acoplamiento se evalúa por su capacidad para enriquecer el pequeño número de compuestos activos conocidos en los primeros puestos de una pantalla entre un número mucho mayor de moléculas señuelo en la base de datos. El área bajo la curva de características operativas del receptor (ROC) se usa ampliamente para evaluar su desempeño.
Los resultados de las pantallas de acoplamiento están sujetos a validación farmacológica (por ejemplo, IC50 , mediciones de afinidad o potencia ). Sólo los estudios prospectivos constituyen una prueba concluyente de la idoneidad de una técnica para un objetivo particular. [33] En el caso de los receptores acoplados a proteína G (GPCR), que son objetivos de más del 30% de los medicamentos comercializados, el acoplamiento molecular condujo al descubrimiento de más de 500 ligandos de GPCR. [34]
El potencial de los programas de acoplamiento para reproducir modos de unión determinados por cristalografía de rayos X puede evaluarse mediante una variedad de conjuntos de puntos de referencia de acoplamiento.
Para moléculas pequeñas, existen varios conjuntos de datos de referencia para el acoplamiento y la detección virtual, por ejemplo, Astex Diverse Set que consiste en estructuras cristalinas de rayos X de ligandos de proteínas de alta calidad [35] o el Directorio de señuelos útiles (DUD) para la evaluación del rendimiento de la detección virtual. [29]
Las Lecciones para la evaluación de la eficiencia del acoplamiento y la puntuación (LEADS-PEP) pueden evaluar el potencial de los programas de acoplamiento para reproducir modos de unión de péptidos . [36]
Una interacción de unión entre un ligando de molécula pequeña y una proteína enzimática puede dar como resultado la activación o inhibición de la enzima. Si la proteína es un receptor, la unión del ligando puede provocar agonismo o antagonismo . El acoplamiento se utiliza más comúnmente en el campo del diseño de fármacos ; la mayoría de los fármacos son pequeñas moléculas orgánicas y el acoplamiento se puede aplicar a:
Servicio de Internet que calcula el sitio, la geometría y la energía de pequeñas moléculas que interactúan con proteínas.