La solvatación implícita (a veces denominada solvatación continua ) es un método para representar el solvente como un medio continuo en lugar de moléculas de solvente individuales "explícitas", que se utiliza con mayor frecuencia en simulaciones de dinámica molecular y en otras aplicaciones de la mecánica molecular . El método se aplica a menudo para estimar la energía libre de las interacciones soluto - solvente en procesos estructurales y químicos, como el plegamiento o las transiciones conformacionales de proteínas , ADN , ARN y polisacáridos , la asociación de macromoléculas biológicas con ligandos o el transporte de fármacos a través de membranas biológicas .
El modelo de solvatación implícita se justifica en líquidos, donde el potencial de fuerza media se puede aplicar para aproximar el comportamiento promedio de muchas moléculas de disolventes altamente dinámicas. Sin embargo, las interfaces y los interiores de las membranas biológicas o las proteínas también se pueden considerar como medios con propiedades dieléctricas o de solvatación específicas . Estos medios no son necesariamente uniformes, ya que sus propiedades se pueden describir mediante diferentes funciones analíticas, como los “perfiles de polaridad” de las bicapas lipídicas . [1]
Existen dos tipos básicos de métodos de disolventes implícitos: los modelos basados en áreas superficiales accesibles (ASA) que fueron históricamente los primeros, y los más recientes modelos de electrostática continua, aunque son posibles diversas modificaciones y combinaciones de los diferentes métodos. El método de área superficial accesible (ASA) se basa en relaciones lineales experimentales entre la energía libre de transferencia de Gibbs y el área superficial de una molécula de soluto . [2] Este método opera directamente con la energía libre de solvatación , a diferencia de la mecánica molecular o los métodos electrostáticos que incluyen solo el componente entálpico de la energía libre. La representación continua del disolvente también mejora significativamente la velocidad computacional y reduce los errores en el promedio estadístico que surgen del muestreo incompleto de las conformaciones del disolvente, [3] de modo que los paisajes energéticos obtenidos con disolvente implícito y explícito son diferentes. [4] Aunque el modelo de disolvente implícito es útil para simulaciones de biomoléculas, este es un método aproximado con ciertas limitaciones y problemas relacionados con la parametrización y el tratamiento de los efectos de ionización .
La energía libre de solvatación de una molécula de soluto en el método basado en ASA más simple viene dada por:
donde es el área superficial accesible del átomo i , y es el parámetro de solvatación del átomo i , es decir, una contribución a la energía libre de solvatación del átomo particular i por unidad de superficie. Los parámetros de solvatación necesarios para diferentes tipos de átomos ( carbono (C), nitrógeno (N), oxígeno (O), azufre (S), etc.) se determinan generalmente mediante un ajuste de mínimos cuadrados de las energías libres de transferencia calculadas y experimentales para una serie de compuestos orgánicos . Las energías experimentales se determinan a partir de coeficientes de partición de estos compuestos entre diferentes soluciones o medios utilizando concentraciones molares estándar de los solutos. [5] [6]
Cabe destacar que la energía de solvatación es la energía libre necesaria para transferir una molécula de soluto de un solvente al vacío (fase gaseosa). Esta energía puede complementar la energía intramolecular en el vacío calculada en mecánica molecular . Por lo tanto, los parámetros de solvatación atómica necesarios se derivaron inicialmente de los datos de partición agua-gas. [7] Sin embargo, las propiedades dieléctricas de las proteínas y las bicapas lipídicas son mucho más similares a las de los solventes no polares que al vacío. Por lo tanto, se han derivado parámetros más nuevos a partir de los coeficientes de partición octanol-agua [8] u otros datos similares. Dichos parámetros en realidad describen la energía de transferencia entre dos medios condensados o la diferencia de dos energías de solvatación.
La ecuación de Poisson-Boltzmann (PB) describe el entorno electrostático de un soluto en un solvente que contiene iones . Puede escribirse en unidades cgs como:
o (en mks ):
donde representa el dieléctrico dependiente de la posición, representa el potencial electrostático, representa la densidad de carga del soluto, representa la concentración del ion i a una distancia de infinito del soluto, es la valencia del ion, q es la carga de un protón, k es la constante de Boltzmann , T es la temperatura y es un factor para la accesibilidad dependiente de la posición de la posición r a los iones en solución (a menudo se establece en 1 uniformemente). Si el potencial no es grande, la ecuación se puede linealizar para resolverse de manera más eficiente. [9]
Aunque esta ecuación tiene una sólida justificación teórica, su cálculo sin aproximaciones es costoso desde el punto de vista computacional. Se han desarrollado varios solucionadores numéricos de ecuaciones de Poisson-Boltzmann de diversa generalidad y eficiencia, [10] [11] [12] incluida una aplicación con una plataforma de hardware informático especializada. [13] Sin embargo, el rendimiento de los solucionadores de ecuaciones de Poisson-Boltzmann todavía no es igual al de la aproximación de Born generalizada más utilizada. [14]
El modelo de Born generalizado (GB) es una aproximación a la ecuación exacta (linealizada) de Poisson-Boltzmann. Se basa en modelar el soluto como un conjunto de esferas cuya constante dieléctrica interna difiere de la del disolvente externo. El modelo tiene la siguiente forma funcional:
dónde
y
donde es la permitividad del espacio libre , es la constante dieléctrica del solvente que se está modelando, es la carga electrostática en la partícula i , es la distancia entre las partículas i y j , y es una cantidad (con la dimensión de longitud) denominada radio de Born efectivo . [15] El radio de Born efectivo de un átomo caracteriza su grado de enterramiento dentro del soluto; cualitativamente puede considerarse como la distancia desde el átomo hasta la superficie molecular. La estimación precisa de los radios de Born efectivos es fundamental para el modelo GB. [16]
El modelo de Born generalizado (GB) aumentado con el término de área superficial accesible al solvente hidrofóbico (SA) es GBSA. Es una de las combinaciones de modelos de solvente implícito más utilizadas. El uso de este modelo en el contexto de la mecánica molecular se denomina MM/GBSA. Aunque se ha demostrado que esta formulación identifica con éxito los estados nativos de péptidos cortos con estructura terciaria bien definida , [17] los conjuntos conformacionales producidos por los modelos GBSA en otros estudios difieren significativamente de los producidos por solvente explícito y no identifican el estado nativo de la proteína. [4] En particular, los puentes salinos están sobreestabilizados, posiblemente debido a un apantallamiento electrostático insuficiente, y se observó una población de hélices alfa mayor que la nativa . También se han desarrollado variantes del modelo GB para aproximarse al entorno electrostático de las membranas, que han tenido cierto éxito en el plegamiento de las hélices transmembrana de las proteínas de membrana integrales . [18]
Otra posibilidad es utilizar estrategias rápidas ad hoc para estimar la energía libre de solvatación. Una primera generación de solventes implícitos rápidos se basa en el cálculo de un área superficial accesible al solvente por átomo. Para cada grupo de tipos de átomos, un parámetro diferente escala su contribución a la solvatación (el "modelo basado en ASA" descrito anteriormente). [19]
Se implementa otra estrategia para el campo de fuerza CHARMM 19 y se denomina EEF1. [20] EEF1 se basa en una exclusión de solvente con forma gaussiana. La energía libre de solvatación es
La energía libre de solvatación de referencia de i corresponde a una molécula pequeña elegida adecuadamente en la que el grupo i está esencialmente expuesto por completo al disolvente. La integral es sobre el volumen V j del grupo j y la suma es sobre todos los grupos j alrededor de i . EEF1 utiliza además un dieléctrico dependiente de la distancia (no constante), y las cadenas laterales iónicas de las proteínas se neutralizan simplemente. Es solo un 50% más lento que una simulación de vacío. Este modelo se amplió posteriormente con el efecto hidrofóbico y se denominó Charmm19/SASA. [21]
Es posible incluir una capa o esfera de moléculas de agua alrededor del soluto y modelar el volumen con un solvente implícito. Este enfoque es propuesto por MJ Frisch y colaboradores [22] y por otros autores. [23] [24] Por ejemplo, en la referencia [23] el solvente en masa se modela con un enfoque de Born generalizado y el método de múltiples cuadrículas utilizado para interacciones de partículas Coulombianas por pares. Se informa que es más rápido que una simulación de solvente explícita completa con el método de suma de Ewald (PME) de malla de partículas de cálculo electrostático. Hay una variedad de métodos híbridos disponibles capaces de acceder y adquirir información sobre la solvatación. [25]
Modelos como PB y GB permiten estimar la energía libre electrostática media pero no tienen en cuenta los efectos (en su mayoría) entrópicos que surgen de las restricciones impuestas por el soluto en la organización de las moléculas de agua o solvente. Esto se denomina efecto hidrofóbico y es un factor importante en el proceso de plegamiento de proteínas globulares con núcleos hidrofóbicos . Los modelos de solvatación implícita pueden ampliarse con un término que tenga en cuenta el efecto hidrofóbico. La forma más popular de hacerlo es tomando el área de superficie accesible al solvente (SASA) como un indicador de la extensión del efecto hidrofóbico. La mayoría de los autores ubican la extensión de este efecto entre 5 y 45 cal/(Å 2 mol). [26] Nótese que esta área de superficie pertenece al soluto, mientras que el efecto hidrofóbico es principalmente de naturaleza entrópica a temperaturas fisiológicas y ocurre en el lado del solvente.
Los modelos de solventes implícitos, como PB, GB y SASA, carecen de la viscosidad que imparten las moléculas de agua al colisionar aleatoriamente e impedir el movimiento de los solutos a través de su repulsión de van der Waals. En muchos casos, esto es deseable porque hace que el muestreo de configuraciones y espacio de fases sea mucho más rápido. Esta aceleración significa que se visitan más configuraciones por unidad de tiempo simulada, además de cualquier aceleración de CPU que se logre en comparación con el solvente explícito. Sin embargo, puede conducir a resultados engañosos cuando la cinética es lo que interesa.
La viscosidad se puede volver a sumar utilizando la dinámica de Langevin en lugar de la mecánica hamiltoniana y eligiendo una constante de amortiguamiento apropiada para el solvente particular. [27] En simulaciones bimoleculares prácticas, a menudo se puede acelerar la búsqueda conformacional significativamente (hasta 100 veces en algunos casos) utilizando una frecuencia de colisión mucho menor . [28] También se ha realizado un trabajo reciente para desarrollar termostatos basados en la hidrodinámica fluctuante para tener en cuenta la transferencia de momento a través del solvente y las fluctuaciones térmicas relacionadas. [29] Sin embargo, se debe tener en cuenta que la tasa de plegamiento de las proteínas no depende linealmente de la viscosidad para todos los regímenes. [30]
Los enlaces de hidrógeno soluto-disolvente en la primera capa de solvatación son importantes para la solubilidad de las moléculas orgánicas y, especialmente, de los iones . Su contribución energética promedio se puede reproducir con un modelo de disolvente implícito. [31] [32]
Todos los modelos de solvatación implícita se basan en la idea simple de que los átomos no polares de un soluto tienden a agruparse o a ocupar medios no polares, mientras que los grupos polares y cargados del soluto tienden a permanecer en el agua. Sin embargo, es importante equilibrar adecuadamente las contribuciones de energía opuestas de los diferentes tipos de átomos. A lo largo de los años se han discutido e investigado varios puntos importantes.
Se ha observado que la solución húmeda de 1-octanol es una mala aproximación de las proteínas o las membranas biológicas porque contiene ~2 M de agua, y que el ciclohexano sería una aproximación mucho mejor. [33] La investigación de las barreras de permeabilidad pasiva para diferentes compuestos a través de las bicapas lipídicas condujo a la conclusión de que el 1,9-decadieno puede servir como una buena aproximación del interior de la bicapa, [34] mientras que el 1-octanol fue una aproximación muy pobre. [35] Un conjunto de parámetros de solvatación derivados para el interior de la proteína a partir de datos de ingeniería de proteínas también fue diferente de la escala del octanol: fue cercano a la escala del ciclohexano para átomos no polares, pero intermedio entre las escalas del ciclohexano y el octanol para átomos polares. [36] Por lo tanto, se deben aplicar diferentes parámetros de solvatación atómica para modelar el plegamiento de proteínas y la unión proteína-membrana. Esta cuestión sigue siendo controvertida. La idea original del método era derivar todos los parámetros de solvatación directamente de los coeficientes de partición experimentales de las moléculas orgánicas, lo que permite el cálculo de la energía libre de solvatación. Sin embargo, algunos de los modelos electrostáticos desarrollados recientemente utilizan valores ad hoc de 20 o 40 cal/(Å 2 mol) para todos los tipos de átomos. Las interacciones “hidrofóbicas” inexistentes de los átomos polares se ven anuladas por grandes penalizaciones de energía electrostática en dichos modelos.
Estrictamente hablando, los modelos basados en ASA solo deben aplicarse para describir la solvatación , es decir, la energía de transferencia entre medios líquidos o uniformes. Es posible expresar las energías de interacción de van der Waals en el estado sólido en unidades de energía superficial. Esto se hizo a veces para interpretar la ingeniería de proteínas y la energía de unión de ligandos , [37] lo que conduce a un parámetro de "solvatación" para el carbono alifático de ~40 cal/(Å 2 mol), [38] que es 2 veces mayor que ~20 cal/(Å 2 mol) obtenido para la transferencia de agua a hidrocarburos líquidos, porque los parámetros derivados de dicho ajuste representan la suma de la energía hidrofóbica (es decir, 20 cal/Å 2 mol) y la energía de las atracciones de van der Waals de los grupos alifáticos en el estado sólido, que corresponde a la entalpía de fusión de los alcanos . [36] Desafortunadamente, el modelo simplificado basado en ASA no puede capturar las interacciones dependientes de la distancia "específicas" entre diferentes tipos de átomos en el estado sólido que son responsables de la agrupación de átomos con polaridades similares en las estructuras de proteínas y cristales moleculares. Los parámetros de tales interacciones interatómicas, junto con los parámetros de solvatación atómica para el interior de la proteína, se han derivado aproximadamente de los datos de ingeniería de proteínas . [36] El modelo de solvatación implícita se rompe cuando las moléculas de disolvente se asocian fuertemente con las cavidades de unión en una proteína, de modo que la proteína y las moléculas de disolvente forman un cuerpo sólido continuo. [39] Por otro lado, este modelo se puede aplicar con éxito para describir la transferencia desde el agua a la bicapa lipídica fluida . [40]
Se necesitan más pruebas para evaluar el rendimiento de diferentes modelos de solvatación implícita y conjuntos de parámetros. A menudo se prueban solo para un pequeño conjunto de moléculas con una estructura muy simple, como las hélices alfa (α) hidrofóbicas y anfifílicas. Este método rara vez se probó para cientos de estructuras de proteínas. [40]
La ionización de grupos cargados se ha descuidado en los modelos electrostáticos continuos de solvatación implícita, así como en la mecánica molecular estándar y la dinámica molecular . La transferencia de un ion del agua a un medio no polar con una constante dieléctrica de ~3 (bicapa lipídica) o de 4 a 10 (interior de las proteínas) cuesta una energía significativa, como se desprende de la ecuación de Born y de los experimentos. Sin embargo, dado que los residuos proteicos cargados son ionizables, simplemente pierden sus cargas en el entorno no polar, lo que cuesta relativamente poco a pH neutro: ~4 a 7 kcal/mol para los residuos de aminoácidos Asp, Glu, Lys y Arg , según la ecuación de Henderson-Hasselbalch , ΔG = 2,3RT (pH - pK) . De hecho, se han observado los bajos costes energéticos de tales efectos de ionización para mutantes proteicos con residuos ionizables enterrados. [41] y péptidos α-helicoidales hidrófobos en membranas con un único residuo ionizable en el medio. [42] Sin embargo, todos los métodos electrostáticos, como PB, GB o GBSA, suponen que los grupos ionizables permanecen cargados en los entornos no polares, lo que conduce a una energía electrostática sobreestimada groseramente. En los modelos basados en el área de superficie accesibles más simples , este problema se trató utilizando diferentes parámetros de solvatación para átomos cargados o la ecuación de Henderson-Hasselbalch con algunas modificaciones. [40] Sin embargo, incluso el último enfoque no resuelve el problema. Los residuos cargados pueden permanecer cargados incluso en el entorno no polar si están involucrados en pares de iones intramoleculares y enlaces de hidrógeno. Por lo tanto, las penalizaciones energéticas pueden sobreestimarse incluso utilizando la ecuación de Henderson-Hasselbalch. Se han desarrollado métodos teóricos más rigurosos que describen tales efectos de ionización, [43] y hay esfuerzos en curso para incorporar tales métodos en los modelos de solvatación implícita. [44]