En biología computacional , los cálculos de p K a de proteínas se utilizan para estimar los valores de p K a de los aminoácidos tal como existen dentro de las proteínas . Estos cálculos complementan los valores de p K a informados para los aminoácidos en su estado libre y se utilizan con frecuencia en los campos del modelado molecular , la bioinformática estructural y la biología computacional .
Los valores pK a de las cadenas laterales de aminoácidos desempeñan un papel importante en la definición de las características dependientes del pH de una proteína. La dependencia del pH de la actividad mostrada por las enzimas y la dependencia del pH de la estabilidad de la proteína , por ejemplo, son propiedades que están determinadas por los valores pK a de las cadenas laterales de aminoácidos.
Los valores de p K a de una cadena lateral de aminoácidos en solución se suelen inferir a partir de los valores de p K a de compuestos modelo (compuestos que son similares a las cadenas laterales de aminoácidos). Véase Aminoácidos para conocer los valores de p K a de todas las cadenas laterales de aminoácidos inferidos de esa manera. También existen numerosos estudios experimentales que han arrojado esos valores, por ejemplo, mediante el uso de espectroscopia de RMN .
La siguiente tabla enumera los valores p K a del modelo que se utilizan a menudo en el cálculo de p K a de una proteína y contiene una tercera columna basada en estudios de proteínas. [1]
Cuando una proteína se pliega, los aminoácidos titulables de la proteína se transfieren de un entorno similar a una solución a un entorno determinado por la estructura tridimensional de la proteína. Por ejemplo, en una proteína desplegada, un ácido aspártico normalmente se encuentra en un entorno que expone la cadena lateral titulable al agua. Cuando la proteína se pliega, el ácido aspártico podría encontrarse enterrado en lo profundo del interior de la proteína sin exposición al disolvente.
Además, en la proteína plegada, el ácido aspártico estará más cerca de otros grupos titulables en la proteína y también interactuará con cargas permanentes (por ejemplo, iones) y dipolos en la proteína. Todos estos efectos alteran el valor p K a de la cadena lateral del aminoácido, y los métodos de cálculo de p K a generalmente calculan el efecto del entorno proteico en el valor p K a del modelo de una cadena lateral de aminoácidos. [2] [3] [4] [5]
Por lo general, los efectos del entorno proteico sobre el valor p K a del aminoácido se dividen en efectos independientes del pH y efectos dependientes del pH. Los efectos independientes del pH (desolvatación, interacciones con cargas permanentes y dipolos) se suman al valor p K a del modelo para obtener el valor p K a intrínseco . Los efectos dependientes del pH no se pueden sumar de la misma manera sencilla y deben tenerse en cuenta mediante la suma de Boltzmann, iteraciones de Tanford-Roxby u otros métodos.
La interacción de los valores p K a intrínsecos de un sistema con las energías de interacción electrostática entre grupos titulables puede producir efectos bastante espectaculares, como curvas de titulación no Henderson-Hasselbalch e incluso efectos de titulación inversa. [6]
La imagen de la derecha muestra un sistema teórico formado por tres residuos ácidos. Un grupo muestra un evento de titulación inversa (grupo azul).
Hay varios paquetes de software y servidores web disponibles para el cálculo de los valores de p K a de la proteína .
Algunos métodos se basan en soluciones de la ecuación de Poisson-Boltzmann (PBE), a menudo denominadas métodos basados en FDPB ( FDPB significa " ecuación de Poisson-Boltzmann de diferencias finitas "). La PBE es una modificación de la ecuación de Poisson que incorpora una descripción del efecto de los iones del disolvente en el campo electrostático alrededor de una molécula.
El servidor web H++, [7] el servidor web pKD, [8] MCCE2, Karlsberg+, [ enlace muerto ] PETIT y GMCT utilizan el método FDPB para calcular los valores p K a de las cadenas laterales de aminoácidos.
Los métodos basados en FDPB calculan el cambio en el valor pK a de una cadena lateral de aminoácidos cuando dicha cadena lateral se mueve desde un estado hipotético completamente solvatado a su posición en la proteína. Para realizar dicho cálculo, se necesitan métodos teóricos que puedan calcular el efecto del interior de la proteína en el valor pK a y el conocimiento de los valores pKa de las cadenas laterales de aminoácidos en sus estados completamente solvatados. [2] [3] [4] [5]
Li, Robertson y Jensen han desarrollado un conjunto de reglas empíricas que relacionan la estructura de las proteínas con los valores p K a de los residuos ionizables. [9] Estas reglas forman la base del programa accesible en la web denominado PROPKA para realizar predicciones rápidas de los valores p K a . Tan KP et al. publicaron recientemente un programa empírico de predicción de p K a con el servidor web en línea DEPTH. [10]
Los métodos de dinámica molecular para calcular los valores p K a permiten incluir una flexibilidad total de la molécula titulada. [11] [12] [13]
Los métodos basados en dinámica molecular suelen ser mucho más costosos computacionalmente y no necesariamente más precisos para predecir valores de p K a que los enfoques basados en la ecuación de Poisson-Boltzmann . También se puede lograr una flexibilidad conformacional limitada dentro de un enfoque de electrostática continua, por ejemplo, para considerar rotámeros de cadenas laterales de múltiples aminoácidos. Además, los campos de fuerza moleculares comúnmente utilizados actualmente no tienen en cuenta la polarizabilidad electrónica, que podría ser una propiedad importante para determinar las energías de protonación.
A partir de la titulación del grupo protonable , se puede leer el llamado p K a 1 ⁄ 2 que es igual al valor de pH donde el grupo está medio protonado (es decir, cuando el 50% de dichos grupos estarían protonados). El p K a 1 ⁄ 2 es igual al p K a de Henderson-Hasselbalch (p KHm
un) si la curva de titulación sigue la ecuación de Henderson–Hasselbalch . [14] La mayoría de los métodos de cálculo de p K a suponen silenciosamente que todas las curvas de titulación tienen forma de Henderson–Hasselbalch, y los valores de p K a en los programas de cálculo de p K a se determinan a menudo de esta manera. En el caso general de múltiples sitios protonables interactuantes, el valor de p K a 1 ⁄ 2 no es termodinámicamente significativo. Por el contrario, el valor de p K a de Henderson–Hasselbalch se puede calcular a partir de la energía libre de protonación mediante
y por tanto a su vez está relacionado con la energía libre de protonación del sitio a través de
La energía libre de protonación se puede calcular en principio a partir de la probabilidad de protonación del grupo ⟨ x ⟩ (pH) que se puede leer en su curva de titulación.
Las curvas de titulación se pueden calcular dentro de un enfoque de electrostática continua con métodos analíticos formalmente exactos pero más elaborados o métodos de Monte Carlo (MC) , o métodos aproximados inexactos pero rápidos. Los métodos MC que se han utilizado para calcular curvas de titulación [15] son Metropolis MC [16] [17] o Wang–Landau MC . [18] Los métodos aproximados que utilizan un enfoque de campo medio para calcular curvas de titulación son el método de Tanford–Roxby y los híbridos de este método que combinan un tratamiento de mecánica estadística exacta dentro de grupos de sitios que interactúan fuertemente con un tratamiento de campo medio de interacciones entre grupos. [19] [20] [21] [22] [23]
En la práctica, puede ser difícil obtener energías libres de protonación estadísticamente convergentes y precisas a partir de curvas de titulación si ⟨ x ⟩ está cerca de un valor de 1 o 0. En este caso, se pueden utilizar varios métodos de cálculo de energía libre para obtener la energía libre de protonación [15] como Metropolis MC sesgado, [24] perturbación de energía libre , [25] [26] integración termodinámica , [27] [28] [29] el método de trabajo de no equilibrio [30] o el método de relación de aceptación de Bennett . [31]
Nótese que el p KHm
unEl valor depende en general del valor del pH. [32]
Esta dependencia es pequeña para grupos que interactúan débilmente, como las cadenas laterales de aminoácidos bien solvatadas en la superficie de la proteína, pero puede ser grande para grupos que interactúan fuertemente, como aquellos enterrados en sitios activos de enzimas o proteínas integrales de membrana. [33] [34] [35]
Si bien hay muchos métodos de predicción de pKa de proteínas disponibles, sus precisiones a menudo difieren significativamente debido a diferencias sutiles y a menudo drásticas en la estrategia. [36]