stringtranslate.com

Acoplamiento macromolecular

El acoplamiento macromolecular es el modelado computacional de la estructura cuaternaria de complejos formados por dos o más macromoléculas biológicas que interactúan . Los complejos proteína -proteína son los objetivos más comúnmente intentados en este tipo de modelización, seguidos por los complejos proteína- ácido nucleico .

El objetivo final del acoplamiento es la predicción de la estructura tridimensional del complejo macromolecular de interés tal como ocurriría en un organismo vivo. El acoplamiento en sí solo produce estructuras candidatas plausibles. Estos candidatos deben clasificarse utilizando métodos como funciones de puntuación para identificar las estructuras que tienen más probabilidades de ocurrir en la naturaleza.

El término "acoplamiento" se originó a finales de la década de 1970, con un significado más restringido; entonces, "acoplar" significaba refinar un modelo de una estructura compleja optimizando la separación entre los interactuantes pero manteniendo fijas sus orientaciones relativas. Más tarde, se permitió que variaran las orientaciones relativas de los socios que interactuaban en el modelado, pero la geometría interna de cada uno de los socios se mantuvo fija. Este tipo de modelado a veces se denomina "acoplamiento rígido". Con mayores aumentos en el poder computacional, fue posible modelar los cambios en la geometría interna de los socios que interactúan que pueden ocurrir cuando se forma un complejo. Este tipo de modelado se denomina "acoplamiento flexible".

Fondo

Las funciones biológicas de la mayoría de las proteínas, caracterizadas por las otras macromoléculas con las que interactúan , se conocen, en el mejor de los casos, de forma incompleta. Incluso aquellas proteínas que participan en un proceso biológico bien estudiado (por ejemplo, el ciclo de Krebs ) pueden tener compañeros de interacción inesperados o funciones que no están relacionadas con ese proceso.

En los casos de interacciones proteína-proteína conocidas, surgen otras preguntas. Se sabe que las enfermedades genéticas (p. ej., fibrosis quística ) son causadas por proteínas mal plegadas o mutadas , y existe el deseo de comprender qué interacciones proteína-proteína anómalas, si las hay, puede causar una mutación determinada. En un futuro lejano, se podrán diseñar proteínas para realizar funciones biológicas, y será esencial determinar las posibles interacciones de dichas proteínas.

Para cualquier conjunto de proteínas, las siguientes preguntas pueden ser de interés, desde el punto de vista de la tecnología o la historia natural:

Si se unen,

Si no se unen,

En última instancia, se prevé que el acoplamiento proteína-proteína solucione todos estos problemas. Además, dado que los métodos de acoplamiento pueden basarse en principios puramente físicos , se pueden acoplar incluso proteínas de función desconocida (o que se han estudiado relativamente poco). El único requisito previo es que su estructura molecular se haya determinado experimentalmente o pueda estimarse mediante una técnica de predicción de la estructura de las proteínas .

Las interacciones proteína-ácido nucleico ocupan un lugar destacado en la célula viva. Los factores de transcripción , que regulan la expresión genética , y las polimerasas , que catalizan la replicación , están compuestos de proteínas, y el material genético con el que interactúan está compuesto de ácidos nucleicos. El modelado de complejos de proteína y ácido nucleico presenta algunos desafíos únicos, como se describe a continuación.

Historia

En la década de 1970, el modelado complejo giraba en torno a identificar manualmente características en las superficies de los interactuantes e interpretar las consecuencias para la unión, la función y la actividad; Todos los programas de computadora se usaban típicamente al final del proceso de modelado, para discriminar entre las relativamente pocas configuraciones que quedaban después de que se habían impuesto todas las restricciones heurísticas. El primer uso de las computadoras fue en un estudio sobre la interacción de la hemoglobina en las fibras falciformes . [1] A esto le siguió en 1978 el trabajo sobre el complejo tripsina - BPTI . [2] Las computadoras discriminaban entre modelos buenos y malos utilizando una función de puntuación que recompensaba un área de interfaz grande y pares de moléculas en contacto pero que no ocupaban el mismo espacio. La computadora utilizó una representación simplificada de las proteínas que interactúan, con un centro de interacción para cada residuo. Se identificaron a mano interacciones electrostáticas favorables , incluidos los enlaces de hidrógeno . [3]

A principios de la década de 1990, se determinaron más estructuras de complejos y la potencia computacional disponible aumentó sustancialmente. Con el surgimiento de la bioinformática , la atención se centró en el desarrollo de técnicas generalizadas que pudieran aplicarse a un conjunto arbitrario de complejos a un costo computacional aceptable. Se preveía que los nuevos métodos se aplicarían incluso en ausencia de pistas filogenéticas o experimentales; cualquier conocimiento previo específico aún podría introducirse en la etapa de elección entre los modelos de salida de mayor clasificación, o enmarcarse como entrada si el algoritmo lo contemplara. En 1992 se publicó el método de correlación, [4] un algoritmo que utilizaba la transformada rápida de Fourier para proporcionar una escalabilidad enormemente mejorada para evaluar la complementariedad de formas aproximadas en modelos de cuerpo rígido. En 1997 se amplió para incluir la electrostática básica. [5]

En 1996 se publicaron los resultados del primer ensayo ciego, [6] en el que seis grupos de investigación intentaron predecir la estructura compleja de la beta-lactamasa TEM-1 con la proteína inhibidora de la beta-lactamasa (BLIP). El ejercicio puso de relieve la necesidad de adaptarse al cambio conformacional y la dificultad de discriminar entre conformadores. También sirvió como prototipo para la serie de evaluaciones CAPRI, que debutó en 2001. [ cita necesaria ]

Atraque de cuerpo rígidovs. acoplamiento flexible

Si los ángulos de enlace, las longitudes de enlace y los ángulos de torsión de los componentes no se modifican en ninguna etapa de la generación compleja, se conoce como acoplamiento de cuerpo rígido . Un tema de especulación es si el acoplamiento con cuerpos rígidos es lo suficientemente bueno para la mayoría de los acoplamientos. Cuando se produce un cambio conformacional sustancial dentro de los componentes en el momento de la formación del complejo, el acoplamiento de cuerpo rígido es inadecuado. Sin embargo, calificar todos los cambios conformacionales posibles es prohibitivamente costoso en tiempo de computadora. Los procedimientos de acoplamiento que permiten cambios conformacionales, o procedimientos de acoplamiento flexibles , deben seleccionar inteligentemente un pequeño subconjunto de posibles cambios conformacionales para su consideración.

Métodos

El atraque exitoso requiere dos criterios:

Para muchas interacciones, se conoce el sitio de unión en una o más de las proteínas que se van a acoplar. Éste es el caso de los anticuerpos y de los inhibidores competitivos . En otros casos, la evidencia mutagénica o filogenética puede sugerir fuertemente un sitio de unión . También se pueden descartar a priori configuraciones en las que las proteínas se interpenetran intensamente .

Después de realizar exclusiones basadas en conocimientos previos o choques estereoquímicos , el espacio restante de posibles estructuras complejas debe muestrearse de manera exhaustiva, uniforme y con una cobertura suficiente para garantizar un impacto cercano. Cada configuración debe calificarse con una medida que sea capaz de clasificar una estructura casi correcta por encima de al menos 100.000 alternativas. Esta es una tarea computacional intensiva y se han desarrollado una variedad de estrategias.

Métodos de espacio recíproco

Cada una de las proteínas se puede representar como una red cúbica simple. Luego, para la clase de puntuaciones que son convoluciones discretas , las configuraciones relacionadas entre sí mediante la traducción de una proteína mediante un vector reticular exacto se pueden calificar casi simultáneamente aplicando el teorema de convolución . [4] Es posible construir funciones de puntuación razonables, aunque aproximadas, similares a las de convolución, que representen la aptitud estereoquímica y electrostática.

Los métodos de espacio recíproco se han utilizado ampliamente por su capacidad para evaluar un enorme número de configuraciones. Pierden su ventaja de velocidad si se introducen cambios de torsión. Otro inconveniente es que es imposible hacer un uso eficiente de los conocimientos previos. La pregunta también sigue siendo si las convoluciones son una clase de función de puntuación demasiado limitada para identificar el mejor complejo de manera confiable.

Métodos de Montecarlo

En Monte Carlo , una configuración inicial se refina tomando pasos aleatorios que se aceptan o rechazan en función de su mejora inducida en la puntuación (ver el criterio de Metropolis ), hasta que se haya intentado una cierta cantidad de pasos. El supuesto es que la convergencia hacia la mejor estructura debe ocurrir a partir de una gran clase de configuraciones iniciales, de las cuales sólo es necesario considerar una. Las configuraciones iniciales se pueden muestrear de forma aproximada y se puede ahorrar mucho tiempo de cálculo. Debido a la dificultad de encontrar una función de puntuación que discrimine altamente la configuración correcta y que también converja a la configuración correcta desde la distancia, se ha propuesto el uso de dos niveles de refinamiento, con diferentes funciones de puntuación. [7] La ​​torsión se puede introducir de forma natural en Monte Carlo como una propiedad adicional de cada movimiento aleatorio.

No se garantiza que los métodos de Monte Carlo busquen exhaustivamente, por lo que se puede perder la mejor configuración incluso utilizando una función de puntuación que, en teoría, la identificaría. No se ha establecido firmemente qué tan grave es el problema para el atraque.

Evaluación

Funciones de puntuación

Para encontrar una puntuación que constituya una base coherente para seleccionar la mejor configuración, se llevan a cabo estudios sobre un punto de referencia estándar (ver más abajo) de casos de interacción proteína-proteína. Las funciones de puntuación se evalúan según el rango que asignan a la mejor estructura (idealmente, la mejor estructura debería ocupar el puesto 1) y según su cobertura (la proporción de casos de referencia para los cuales logran un resultado aceptable). Los tipos de puntuaciones estudiadas incluyen:

Es habitual crear puntuaciones híbridas combinando una o más categorías anteriores en una suma ponderada cuyas ponderaciones se optimizan en los casos del punto de referencia. Para evitar sesgos, los casos de referencia utilizados para optimizar las ponderaciones no deben superponerse con los casos utilizados para realizar la prueba final de la puntuación.

El objetivo final del acoplamiento proteína-proteína es seleccionar la solución de clasificación ideal de acuerdo con un esquema de puntuación que también daría una idea de la afinidad del complejo. Tal desarrollo impulsaría la ingeniería de proteínas in silico , el diseño de fármacos asistido por computadora y/o la anotación de alto rendimiento de qué proteínas se unen o no (anotación del interactoma ). Se han propuesto varias funciones de puntuación para la predicción de afinidad de unión/energía libre. [7] [8] [9] [10] [11] Sin embargo, se ha descubierto que la correlación entre las afinidades de unión determinadas experimentalmente y las predicciones de nueve funciones de puntuación comúnmente utilizadas es casi ortogonal (R 2 ~ 0). [12] También se observó que algunos componentes de los algoritmos de puntuación pueden mostrar una mejor correlación con las energías de enlace experimentales que la puntuación completa, lo que sugiere que se podría obtener un rendimiento significativamente mejor combinando las contribuciones apropiadas de diferentes algoritmos de puntuación. Los métodos experimentales para la determinación de afinidades de unión son: resonancia de plasmón superficial (SPR), transferencia de energía por resonancia de Förster , técnicas basadas en radioligandos , calorimetría de titulación isotérmica (ITC), termoforesis a microescala (MST) o mediciones espectroscópicas y otras técnicas de fluorescencia. La información textual de artículos científicos puede proporcionar pistas útiles para la puntuación. [13]

Puntos de referencia

Se ha desarrollado un punto de referencia de 84 interacciones proteína-proteína con estructuras complejas conocidas para probar métodos de acoplamiento. [14] El conjunto se elige para cubrir una amplia gama de tipos de interacción y para evitar características repetidas, como el perfil de las familias estructurales de los interactuantes según la base de datos SCOP . Los elementos de referencia se clasifican en tres niveles de dificultad (el más difícil contiene el mayor cambio en la conformación de la columna vertebral). El punto de referencia de acoplamiento proteína-proteína contiene ejemplos de complejos enzima-inhibidor, antígeno-anticuerpo y homomultiméricos.

La última versión del punto de referencia de acoplamiento proteína-proteína consta de 230 complejos. [15] Un punto de referencia de acoplamiento proteína-ADN consta de 47 casos de prueba. [16] Se seleccionó un punto de referencia de acoplamiento de proteína-ARN como un conjunto de datos de 45 casos de prueba no redundantes [17] con complejos resueltos únicamente mediante cristalografía de rayos X , así como un conjunto de datos ampliado de 71 casos de prueba con estructuras derivadas del modelado de homología como Bueno. [18] El punto de referencia de proteína-ARN se ha actualizado para incluir más estructuras resueltas mediante cristalografía de rayos X y ahora consta de 126 casos de prueba. [19] Los puntos de referencia tienen un conjunto de datos combinado de 209 complejos. [20]

Un punto de referencia de afinidad de unión se ha basado en el punto de referencia de acoplamiento proteína-proteína. [12] Se incluyen 81 complejos proteína-proteína con afinidades experimentales conocidas; estos complejos abarcan más de 11 órdenes de magnitud en términos de afinidad. Cada entrada del punto de referencia incluye varios parámetros bioquímicos asociados con los datos experimentales, junto con el método utilizado para determinar la afinidad. Este punto de referencia se utilizó para evaluar hasta qué punto las funciones de puntuación también podrían predecir las afinidades de los complejos macromoleculares.

Este punto de referencia fue revisado por pares y ampliado significativamente. [21] El nuevo conjunto es diverso en términos de las funciones biológicas que representa, con complejos que involucran proteínas G y dominios extracelulares del receptor, así como complejos antígeno/anticuerpo, enzima/inhibidor y enzima/sustrato. También es diverso en términos de la afinidad de los socios entre sí, con K d oscilando entre 10 −5 y 10 −14 M. Nueve pares de entradas representan complejos estrechamente relacionados que tienen una estructura similar, pero una afinidad muy diferente, cada uno par que comprende un conjunto afín y un conjunto no afín. Al estar disponibles las estructuras libres de las proteínas componentes, se pueden evaluar los cambios de conformación. Son significativos en la mayoría de los complejos y con frecuencia se observan grandes movimientos o transiciones de desorden a orden. El conjunto se puede utilizar para comparar modelos biofísicos que apuntan a relacionar la afinidad con la estructura en las interacciones proteína-proteína, teniendo en cuenta los reactivos y los cambios de conformación que acompañan a la reacción de asociación, en lugar de solo el producto final. [21]

La evaluación CAPRI

La Evaluación Crítica de la Predicción de Interacciones [22] es una serie continua de eventos en los que investigadores de toda la comunidad intentan acoplar las mismas proteínas proporcionadas por los evaluadores. Las rondas se realizan aproximadamente cada 6 meses. Cada ronda contiene entre uno y seis complejos proteína-proteína diana cuyas estructuras se han determinado experimentalmente recientemente. Las coordenadas y están en manos de los evaluadores en privado, con la cooperación de los biólogos estructurales que las determinaron. La evaluación de las presentaciones es doble ciego .

CAPRI atrae un alto nivel de participación (37 grupos participaron en todo el mundo en la séptima ronda) y un alto nivel de interés de la comunidad biológica en general. Aunque los resultados de CAPRI tienen poca significación estadística debido al pequeño número de objetivos en cada ronda, el papel de CAPRI en la estimulación del discurso es significativo. (La evaluación CASP es un ejercicio similar en el campo de la predicción de la estructura de proteínas).

Ver también

Referencias

  1. ^ Levinthal C, Wodak SJ, Kahn P, Dadivanian AK (1975). "Interacciones de hemoglobina en fibras falciformes: I. Enfoques teóricos de los contactos moleculares". Procedimientos de la Academia Nacional de Ciencias . 72 (4): 1330-1334. Código bibliográfico : 1975PNAS...72.1330L. doi : 10.1073/pnas.72.4.1330 . PMC  432527 . PMID  1055409.
  2. ^ Wodak SJ, Janin J (1978). "Análisis informático de interacciones proteína-proteína". Revista de biología molecular . 124 (2): 323–342. doi :10.1016/0022-2836(78)90302-9. PMID  712840.
  3. ^ Wodak SJ, De Crombrugghe M, Janin J (1987). "Estudios informáticos de interacciones entre macromoléculas". Avances en Biofísica y Biología Molecular . 49 (1): 29–63. doi : 10.1016/0079-6107(87)90008-3 . PMID  3310103.
  4. ^ ab Katchalski-Katzir E, Shariv I, Eisenstein M, Friesem AA, Aflalo C, Vakser IA (1992). "Reconocimiento de superficies moleculares: determinación del ajuste geométrico entre proteínas y sus ligandos mediante técnicas de correlación". Proc. Nacional. Acad. Ciencia. EE.UU . 89 (6): 2195–2199. Código bibliográfico : 1992PNAS...89.2195K. doi : 10.1073/pnas.89.6.2195 . PMC 48623 . PMID  1549581. 
  5. ^ Gabb HA, Jackson RM, Sternberg MJ (septiembre de 1997). "Modelado del acoplamiento de proteínas mediante complementariedad de formas, electrostática e información bioquímica". J. Mol. Biol . 272 (1): 106–120. doi :10.1006/jmbi.1997.1203. PMID  9299341.
  6. ^ Strynadka NC, Eisenstein M, Katchalski-Katzir E, Shoichet BK, Kuntz ID, Abagyan R, Totrov M, Janin J, Cherfils J, Zimmerman F, Olson A, Duncan B, Rao M, Jackson R, Sternberg M, James MN (1996). "Los programas de acoplamiento molecular predicen con éxito la unión de una proteína inhibidora de beta-lactamasa a la beta-lactamasa TEM-1". Naturaleza Biología estructural y molecular . 3 (3): 233–239. doi :10.1038/nsb0396-233. PMID  8605624. S2CID  40212654.
  7. ^ ab Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Acoplamiento proteína-proteína con optimización simultánea del desplazamiento del cuerpo rígido y conformaciones de la cadena lateral". J. Mol. Biol . 331 (1): 281–299. doi :10.1016/S0022-2836(03)00670-3. PMID  12875852.
  8. ^ Camacho CJ, Vajda S (2008). "Acoplamiento de proteínas a lo largo de vías de asociación fluidas". Procedimientos de la Academia Nacional de Ciencias . 98 (19): 10636–10641. doi : 10.1073/pnas.181147798 . PMC 58518 . PMID  11517309. 
  9. ^ Camacho CJ, Vajda S (2007). "Detección in silico de efectos mutacionales sobre la afinidad del inhibidor enzimático-proteico: un enfoque basado en el acoplamiento". Biología estructural BMC . 7 : 37. doi : 10.1186/1472-6807-7-37 . PMC 1913526 . PMID  17559675. 
  10. ^ Zhang C, Liu S, Zhu Q, Zhou Y (2005). "Una función energética basada en el conocimiento para complejos proteína-ligando, proteína-proteína y proteína-ADN". Revista de Química Medicinal . 48 (7): 2325–2335. doi :10.1021/jm049314d. PMID  15801826.
  11. ^ Esmaielbeiki R, Nebel JC (2014). "Puntuación de conformaciones de acoplamiento utilizando interfaces de proteínas predichas". Bioinformática BMC . 15 : 171. doi : 10.1186/1471-2105-15-171 . PMC 4057934 . PMID  24906633. 
  12. ^ ab Kastritis PL, Bonvin AM (mayo de 2010). "¿Están las funciones de puntuación en el acoplamiento proteína-proteína listas para predecir interactomas? Pistas de un nuevo punto de referencia de afinidad de unión". J. Proteoma Res . 9 (5): 2216–2225. doi :10.1021/pr9009854. hdl : 1874/202590 . PMID  20329755.
  13. ^ Badal, VD, Kundrotas, PJ, Vakser, IA (2018). "Procesamiento del lenguaje natural en minería de textos para modelado estructural de complejos proteicos". Bioinformática BMC . 19 (1): 84. doi : 10.1186/s12859-018-2079-4 . PMC 5838950 . PMID  29506465. 
  14. ^ Mintseris J, Wiehe K, Pierce B, Anderson R, Chen R, Janin J, Weng Z (2005). "Benchmark 2.0 de acoplamiento proteína-proteína: una actualización". Proteínas . 60 (2): 214–216. doi :10.1002/prot.20560. PMID  15981264. S2CID  24049376.
  15. ^ Vreven T, Moal IH, Vangone A, Pierce BG, Kastritis PL, Torchala M, Chaleil R, Jiménez-García B, Bates PA, Fernandez-Recio J, Bonvin AM, Weng Z (septiembre de 2015). "Actualizaciones de los puntos de referencia de interacción integrada proteína-proteína: Docking Benchmark versión 5 y Affinity Benchmark versión 2". Revista de biología molecular . 427 (19): 3031–41. doi :10.1016/j.jmb.2015.07.016. PMC 4677049 . PMID  26231283. 
  16. ^ van Dijk M, Bonvin AM (agosto de 2008). "Un punto de referencia de acoplamiento proteína-ADN". Investigación de ácidos nucleicos . 36 (14): e88. doi : 10.1093/nar/gkn386. PMC 2504314 . PMID  18583363. 
  17. ^ Barik A, CN, PM, Bahadur RP (julio de 2012). "Un punto de referencia de acoplamiento proteína-ARN (I): casos no redundantes". Proteínas . 80 (7): 1866–71. doi :10.1002/prot.24083. PMID  22488669. S2CID  437472.
  18. ^ Pérez-Cano L, Jiménez-García B, Fernández-Recio J (julio de 2012). "Un punto de referencia de acoplamiento proteína-ARN (II): conjunto ampliado a partir de datos de modelado experimental y de homología". Proteínas . 80 (7): 1872–82. doi :10.1002/prot.24075. PMID  22488990. S2CID  20322388.
  19. ^ Nithin C, Mukherjee S, Bahadur RP (noviembre de 2016). "Un punto de referencia de acoplamiento de proteína-ARN no redundante versión 2.0". Proteínas . 85 (2): 256–267. doi :10.1002/prot.25211. PMID  27862282. S2CID  26814049.
  20. ^ Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. (25 de agosto de 2018). "Herramientas bioinformáticas y puntos de referencia para el acoplamiento computacional y la predicción de estructuras 3D de complejos de ARN-proteína". Genes . 9 (9): 432. doi : 10.3390/genes9090432 . PMC 6162694 . PMID  30149645. 
  21. ^ ab Kastritis PL, Moal IH, Hwang H, Weng Z, Bates PA, Bonvin AM, Janin J (marzo de 2011). "Un punto de referencia basado en la estructura para la afinidad de unión entre proteínas". Ciencia de las proteínas . 20 (3): 482–491. doi :10.1002/pro.580. PMC 3064828 . PMID  21213247. 
  22. ^ Janin J, Henrick K, Moult J, Eyck LT, Sternberg MJ, Vajda S, Vakser I, Wodak SJ (2003). "CAPRI: una evaluación crítica de las interacciones predichas". Proteínas . 52 (1): 2–9. CiteSeerX 10.1.1.461.3355 . doi :10.1002/prot.10381. PMID  12784359. S2CID  31489448.