La solvatación implícita (a veces denominada solvatación continua ) es un método para representar el disolvente como un medio continuo en lugar de moléculas de disolvente "explícitas" individuales, y se utiliza con mayor frecuencia en simulaciones de dinámica molecular y en otras aplicaciones de la mecánica molecular . El método se aplica a menudo para estimar la energía libre de las interacciones soluto - disolvente en procesos estructurales y químicos, como el plegamiento o las transiciones conformacionales de proteínas , ADN , ARN y polisacáridos , la asociación de macromoléculas biológicas con ligandos o el transporte de fármacos a través de membranas biológicas. .
El modelo de solvatación implícita se justifica en líquidos, donde el potencial de la fuerza media se puede aplicar para aproximar el comportamiento promedio de muchas moléculas de solventes altamente dinámicas. Sin embargo, las interfaces y los interiores de membranas biológicas o proteínas también pueden considerarse medios con propiedades dieléctricas o de solvatación específicas . Estos medios no son necesariamente uniformes, ya que sus propiedades pueden describirse mediante diferentes funciones analíticas, como los "perfiles de polaridad" de las bicapas lipídicas . [1]
Hay dos tipos básicos de métodos solventes implícitos: modelos basados en áreas de superficie accesible (ASA) que fueron históricamente los primeros, y modelos electrostáticos continuos más recientes, aunque son posibles varias modificaciones y combinaciones de los diferentes métodos. El método del área de superficie accesible (ASA) se basa en relaciones lineales experimentales entre la energía libre de transferencia de Gibbs y el área de superficie de una molécula de soluto . [2] Este método opera directamente con energía libre de solvatación , a diferencia de la mecánica molecular o los métodos electrostáticos que incluyen solo el componente entálpico de energía libre. La representación continua del solvente también mejora significativamente la velocidad computacional y reduce los errores en el promedio estadístico que surgen del muestreo incompleto de las conformaciones del solvente, [3] de modo que los paisajes energéticos obtenidos con el solvente implícito y explícito son diferentes. [4] Aunque el modelo de solvente implícito es útil para simulaciones de biomoléculas, este es un método aproximado con ciertas limitaciones y problemas relacionados con la parametrización y el tratamiento de los efectos de ionización .
La energía libre de solvatación de una molécula de soluto en el método más simple basado en ASA viene dada por:
donde es el área de superficie accesible del átomo i , y es el parámetro de solvatación del átomo i , es decir, una contribución a la energía libre de solvatación del átomo particular i por unidad de superficie. Los parámetros de solvatación necesarios para diferentes tipos de átomos ( carbono (C), nitrógeno (N), oxígeno (O), azufre (S), etc.) generalmente se determinan mediante un ajuste de mínimos cuadrados de las energías libres de transferencia calculadas y experimentales para una serie de compuestos orgánicos . Las energías experimentales se determinan a partir de los coeficientes de partición de estos compuestos entre diferentes soluciones o medios utilizando concentraciones molares estándar de los solutos. [5] [6]
En particular, la energía de solvatación es la energía libre necesaria para transferir una molécula de soluto de un disolvente al vacío (fase gaseosa). Esta energía puede complementar la energía intramolecular en el vacío calculada en mecánica molecular . Por lo tanto, los parámetros de solvatación atómica necesarios se derivaron inicialmente de los datos de partición agua-gas. [7] Sin embargo, las propiedades dieléctricas de las proteínas y las bicapas lipídicas son mucho más similares a las de los disolventes no polares que al vacío. Por tanto, se han derivado parámetros más nuevos a partir de los coeficientes de partición octanol-agua [8] u otros datos similares. En realidad, estos parámetros describen la transferencia de energía entre dos medios condensados o la diferencia de dos energías de solvatación.
La ecuación de Poisson-Boltzmann (PB) describe el entorno electrostático de un soluto en un disolvente que contiene iones . Se puede escribir en unidades cgs como:
o (en mks ):
donde representa el dieléctrico dependiente de la posición, representa el potencial electrostático, representa la densidad de carga del soluto, representa la concentración del ion i a una distancia del infinito del soluto, es la valencia del ion, q es la carga de a protón, k es la constante de Boltzmann , T es la temperatura y es un factor para la accesibilidad dependiente de la posición de la posición r a los iones en solución (a menudo establecida uniformemente en 1). Si el potencial no es grande, la ecuación se puede linealizar para resolverla de manera más eficiente. [9]
Aunque esta ecuación tiene una sólida justificación teórica, su cálculo sin aproximaciones es costoso desde el punto de vista computacional. Se han desarrollado varios solucionadores numéricos de ecuaciones de Poisson-Boltzmann de diversa generalidad y eficiencia, [10] [11] [12] incluida una aplicación con una plataforma de hardware informático especializada. [13] Sin embargo, el rendimiento de los solucionadores de PB aún no es igual al de la aproximación de Born generalizada más comúnmente utilizada. [14]
El modelo de Born Generalizado (GB) es una aproximación a la ecuación exacta (linealizada) de Poisson-Boltzmann. Se basa en modelar el soluto como un conjunto de esferas cuya constante dieléctrica interna difiere de la del disolvente externo. El modelo tiene la siguiente forma funcional:
dónde
y
donde es la permitividad del espacio libre , es la constante dieléctrica del solvente que se está modelando, es la carga electrostática en la partícula i , es la distancia entre las partículas i y j , y es una cantidad (con la dimensión de longitud) denominada Born efectivo radio . [15] El radio de Born efectivo de un átomo caracteriza su grado de enterramiento dentro del soluto; cualitativamente se puede considerar como la distancia entre el átomo y la superficie molecular. La estimación precisa de los radios de Born efectivos es fundamental para el modelo GB. [dieciséis]
El modelo de Born Generalizado (GB) aumentado con el término de área de superficie accesible (SA) a solvente hidrofóbico es GBSA. Se encuentra entre las combinaciones de modelos de disolventes implícitos más utilizadas. El uso de este modelo en el contexto de la mecánica molecular se denomina MM/GBSA. Aunque se ha demostrado que esta formulación identifica con éxito los estados nativos de péptidos cortos con estructura terciaria bien definida , [17] los conjuntos conformacionales producidos por los modelos GBSA en otros estudios difieren significativamente de los producidos por disolvente explícito y no identifican los estados nativos de la proteína. estado. [4] En particular, los puentes salinos están sobreestabilizados, posiblemente debido a una protección electrostática insuficiente, y se observó una población de hélices alfa mayor que la nativa . También se han desarrollado variantes del modelo GB para aproximar el entorno electrostático de las membranas, que han tenido cierto éxito en el plegado de las hélices transmembrana de proteínas integrales de membrana . [18]
Otra posibilidad es utilizar estrategias rápidas ad hoc para estimar la energía libre de solvatación. Una primera generación de disolventes implícitos rápidos se basa en el cálculo de una superficie accesible al disolvente por átomo. Para cada grupo de tipos de átomos, un parámetro diferente escala su contribución a la solvatación ("modelo basado en ASA" descrito anteriormente). [19]
Se implementa otra estrategia para el campo de fuerza CHARMM 19 y se llama EEF1. [20] EEF1 se basa en una exclusión de disolventes en forma gaussiana. La energía libre de solvatación es
La energía libre de solvatación de referencia de i corresponde a una molécula pequeña adecuadamente elegida en la que el grupo i está esencialmente completamente expuesto al disolvente. La integral es sobre el volumen V j del grupo j y la suma es sobre todos los grupos j alrededor de i . EEF1 utiliza además un dieléctrico dependiente de la distancia (no constante), y las cadenas laterales iónicas de las proteínas simplemente se neutralizan. Es sólo un 50% más lento que una simulación de vacío. Este modelo fue posteriormente ampliado con el efecto hidrofóbico y llamado Charmm19/SASA. [21]
Es posible incluir una capa o esfera de moléculas de agua alrededor del soluto y modelar la masa con un disolvente implícito. Este enfoque lo proponen MJ Frisch et al. [22] y otros autores. [23] [24] Por ejemplo en la Ref. [23] el disolvente a granel se modela con un enfoque de Born generalizado y el método de rejillas múltiples utilizado para las interacciones de partículas de pares de Coulombic. Se informa que es más rápido que una simulación de solvente explícita y completa con el método de cálculo electrostático de suma de Ewald (PME) de malla de partículas. Existe una variedad de métodos híbridos disponibles capaces de acceder y adquirir información sobre solvatación. [25]
Modelos como PB y GB permiten la estimación de la energía libre electrostática media, pero no tienen en cuenta los efectos (en su mayoría) entrópicos que surgen de las restricciones impuestas por los solutos a la organización de las moléculas de agua o disolvente. Esto se denomina efecto hidrofóbico y es un factor importante en el proceso de plegamiento de proteínas globulares con núcleos hidrofóbicos . Los modelos de solvatación implícita pueden ampliarse con un término que tenga en cuenta el efecto hidrofóbico. La forma más popular de hacerlo es tomando el área de superficie accesible al disolvente (SASA) como indicador del alcance del efecto hidrofóbico. La mayoría de los autores sitúan el alcance de este efecto entre 5 y 45 cal/(Å 2 mol). [26] Tenga en cuenta que esta área de superficie pertenece al soluto, mientras que el efecto hidrofóbico es principalmente de naturaleza entrópica a temperaturas fisiológicas y ocurre en el lado del solvente.
Los modelos de disolventes implícitos como PB, GB y SASA carecen de la viscosidad que imparten las moléculas de agua al chocar aleatoriamente e impedir el movimiento de los solutos a través de su repulsión de Van der Waals. En muchos casos, esto es deseable porque hace que el muestreo de configuraciones y espacio de fases sea mucho más rápido. Esta aceleración significa que se visitan más configuraciones por unidad de tiempo simulada, además de cualquier aceleración de la CPU que se logre en comparación con el solvente explícito. Sin embargo, puede conducir a resultados engañosos cuando la cinética es de interés.
La viscosidad se puede recuperar utilizando la dinámica de Langevin en lugar de la mecánica hamiltoniana y eligiendo una constante de amortiguación adecuada para el disolvente en particular. [27] En simulaciones bimoleculares prácticas, a menudo se puede acelerar la búsqueda conformacional significativamente (hasta 100 veces en algunos casos) utilizando una frecuencia de colisión mucho más baja . [28] También se han realizado trabajos recientes para desarrollar termostatos basados en hidrodinámica fluctuante para tener en cuenta la transferencia de impulso a través del disolvente y las fluctuaciones térmicas relacionadas. [29] Sin embargo, se debe tener en cuenta que la tasa de plegamiento de las proteínas no depende linealmente de la viscosidad para todos los regímenes. [30]
Los enlaces de hidrógeno soluto-disolvente en la primera capa de solvatación son importantes para la solubilidad de las moléculas orgánicas y especialmente de los iones . Su contribución energética promedio se puede reproducir con un modelo solvente implícito. [31] [32]
Todos los modelos de solvatación implícitos se basan en la simple idea de que los átomos no polares de un soluto tienden a agruparse u ocupar medios no polares, mientras que los grupos polares y cargados del soluto tienden a permanecer en agua. Sin embargo, es importante equilibrar adecuadamente las contribuciones energéticas opuestas de los diferentes tipos de átomos. A lo largo de los años se han discutido e investigado varios puntos importantes.
Se ha observado que la solución húmeda de 1-octanol es una mala aproximación de las proteínas o membranas biológicas porque contiene ~2 M de agua, y que el ciclohexano sería una aproximación mucho mejor. [33] La investigación de las barreras de permeabilidad pasiva para diferentes compuestos a través de las bicapas lipídicas llevó a la conclusión de que el 1,9-decadieno puede servir como una buena aproximación del interior de la bicapa, [34] mientras que el 1-octanol fue una aproximación muy pobre. [35] Un conjunto de parámetros de solvatación derivados para el interior de la proteína a partir de datos de ingeniería de proteínas también era diferente de la escala de octanol: estaba cerca de la escala de ciclohexano para los átomos no polares, pero era intermedio entre las escalas de ciclohexano y octanol para los átomos polares. [36] Por lo tanto, se deben aplicar diferentes parámetros de solvatación atómica para modelar el plegamiento de proteínas y la unión proteína-membrana. Esta cuestión sigue siendo controvertida. La idea original del método era derivar todos los parámetros de solvatación directamente de los coeficientes de partición experimentales de moléculas orgánicas, lo que permite calcular la energía libre de solvatación. Sin embargo, algunos de los modelos electrostáticos desarrollados recientemente utilizan valores ad hoc de 20 o 40 cal/(Å 2 mol) para todos los tipos de átomos. En tales modelos, las interacciones “hidrófobas” inexistentes de los átomos polares quedan anuladas por grandes penalizaciones de energía electrostática.
Estrictamente hablando, los modelos basados en ASA sólo deberían aplicarse para describir la solvatación , es decir, la energía de transferencia entre medios líquidos o uniformes. Es posible expresar las energías de interacción de Van der Waals en estado sólido en unidades de energía superficial. Esto se hizo a veces para interpretar la ingeniería de proteínas y la energía de unión de ligandos , [37] lo que conduce a un parámetro de “solvatación” para el carbono alifático de ~40 cal/(Å 2 mol), [38] que es 2 veces mayor que ~20 cal/ (Å 2 mol) obtenido para la transferencia de agua a hidrocarburos líquidos, porque los parámetros derivados de dicho ajuste representan la suma de la energía hidrófoba (es decir, 20 cal/Å 2 mol) y la energía de las atracciones de Van der Waals de los grupos alifáticos en el sólido. estado, que corresponde a la entalpía de fusión de los alcanos . [36] Desafortunadamente, el modelo simplificado basado en ASA no puede capturar las interacciones "específicas" dependientes de la distancia entre diferentes tipos de átomos en el estado sólido que son responsables de la agrupación de átomos con polaridades similares en estructuras de proteínas y cristales moleculares. Los parámetros de tales interacciones interatómicas, junto con los parámetros de solvatación atómica para el interior de la proteína, se han derivado aproximadamente de datos de ingeniería de proteínas . [36] El modelo de solvatación implícita se rompe cuando las moléculas de disolvente se asocian fuertemente con las cavidades de unión en una proteína, de modo que la proteína y las moléculas de disolvente forman un cuerpo sólido continuo. [39] Por otro lado, este modelo se puede aplicar con éxito para describir la transferencia del agua a la bicapa lipídica fluida . [40]
Se necesitan más pruebas para evaluar el rendimiento de diferentes modelos de solvatación implícita y conjuntos de parámetros. A menudo se prueban sólo para un pequeño conjunto de moléculas con estructura muy simple, como las hélices alfa (α) hidrofóbicas y anfifílicas. Este método rara vez se probó en cientos de estructuras proteicas. [40]
La ionización de grupos cargados se ha descuidado en los modelos electrostáticos continuos de solvatación implícita, así como en la mecánica molecular y la dinámica molecular estándar . La transferencia de un ion del agua a un medio no polar con una constante dieléctrica de ~3 (bicapa lipídica) o de 4 a 10 (interior de las proteínas) cuesta una cantidad significativa de energía, como se desprende de la ecuación de Born y de los experimentos. Sin embargo, dado que los residuos de proteínas cargados son ionizables, simplemente pierden sus cargas en el ambiente no polar, lo que cuesta relativamente poco en el pH neutro : ~4 a 7 kcal/mol para los residuos de aminoácidos Asp, Glu, Lys y Arg , según a la ecuación de Henderson-Hasselbalch , ΔG = 2,3RT (pH - pK) . De hecho, se han observado los bajos costos energéticos de tales efectos de ionización para mutantes de proteínas con residuos ionizables enterrados. [41] y péptidos hidrofóbicos de hélice α en membranas con un único residuo ionizable en el medio. [42] Sin embargo, todos los métodos electrostáticos, como PB, GB o GBSA, suponen que los grupos ionizables permanecen cargados en entornos no polares, lo que conduce a una energía electrostática enormemente sobreestimada. En los modelos accesibles más simples basados en el área de superficie , este problema se trató utilizando diferentes parámetros de solvatación para átomos cargados o la ecuación de Henderson-Hasselbalch con algunas modificaciones. [40] Sin embargo, ni siquiera este último enfoque resuelve el problema. Los residuos cargados pueden permanecer cargados incluso en un entorno no polar si están involucrados en pares de iones intramoleculares y enlaces de hidrógeno. Por tanto, las penalizaciones energéticas pueden sobreestimarse incluso utilizando la ecuación de Henderson-Hasselbalch. Se han desarrollado métodos teóricos más rigurosos que describen tales efectos de ionización [43] y se están realizando esfuerzos para incorporar dichos métodos en los modelos de solvatación implícitos. [44]