El método de campo medio autoconsistente (SCMF) es una adaptación de la teoría del campo medio utilizada en la predicción de la estructura de proteínas para determinar el empaquetamiento óptimo de la cadena lateral de aminoácidos dada una estructura proteica fija . [1] Es más rápido pero menos preciso que la eliminación sin salida y generalmente se utiliza en situaciones donde la proteína de interés es demasiado grande para que el problema sea manejable por DEE. [2]
Al igual que la eliminación sin salida, el método SCMF explora el espacio conformacional discretizando los ángulos diedros de cada cadena lateral en un conjunto de rotámeros para cada posición en la secuencia de la proteína. El método desarrolla iterativamente una descripción probabilística de la población relativa de cada posible rotámero en cada posición, y la probabilidad de una estructura dada se define como una función de las probabilidades de sus componentes individuales de rotámero.
Los requisitos básicos para una implementación efectiva del SCMF son:
El proceso generalmente se inicializa con una distribución de probabilidad uniforme sobre los rotámeros, es decir, si hay rotámeros en la posición en la proteína, entonces la probabilidad de cualquier rotámero individual es . La conversión entre energías y probabilidades generalmente se logra a través de la distribución de Boltzmann , que introduce un factor de temperatura (lo que hace que el método sea apto para el recocido simulado ). Las temperaturas más bajas aumentan la probabilidad de converger a una única solución, en lugar de a una pequeña subpoblación de soluciones.
La energía de un rotámero individual depende de la energía del "campo medio" de las otras posiciones, es decir, en cada otra posición, la contribución energética de cada rotámero es proporcional a su probabilidad. Para una proteína de longitud con rotámeros por residuo, la energía en la iteración actual se describe mediante la siguiente expresión. Nótese que, para mayor claridad, la energía del campo medio en la iteración se denota por , mientras que las energías precalculadas se denotan por , y la probabilidad de un rotámero dado se denota por .
Estas energías de campo medio se utilizan para actualizar las probabilidades a través de la ley de Boltzmann:
donde es la constante de Boltzmann y es el factor de temperatura.
Aunque no es necesario calcular la energía del sistema para llevar a cabo el método SCMF, resulta útil conocer las energías generales de los resultados convergidos. La energía del sistema consta de dos sumas:
donde los sumandos se definen como:
La convergencia perfecta del método SCMF daría como resultado una probabilidad de 1 para exactamente un rotámero en cada posición de la proteína, y una probabilidad de cero para todos los demás rotámeros en cada posición. La convergencia a una solución única requiere probabilidades cercanas a 1 para exactamente un rotámero en cada posición. En la práctica, especialmente cuando se utilizan temperaturas más altas, el algoritmo identifica en cambio una pequeña cantidad de rotámeros de alta probabilidad en cada posición, lo que permite enumerar las energías relativas de las conformaciones resultantes (basándose en las energías precalculadas, no en las derivadas de la aproximación de campo medio). Una forma de mejorar la convergencia es ejecutar nuevamente a una temperatura más baja utilizando las probabilidades calculadas a partir de una ejecución anterior a temperatura más alta.
A diferencia de la eliminación sin salida, no se garantiza que SCMF converja en la solución óptima. Sin embargo, es determinista (es decir, convergerá a la misma solución cada vez dadas las mismas condiciones iniciales), a diferencia de las alternativas que dependen del análisis de Monte Carlo. En comparación con DEE, que garantiza encontrar la solución óptima, SCMF es más rápido pero menos preciso en general; es significativamente mejor para identificar conformaciones correctas de la cadena lateral en el núcleo de la proteína que para identificar conformaciones correctas de la superficie [3] . Las restricciones de empaquetamiento geométrico son menos restrictivas en la superficie y, por lo tanto, proporcionan menos límites a la búsqueda conformacional.