En biología computacional , los cálculos de p K a de proteínas se utilizan para estimar los valores de p K a de los aminoácidos tal como existen dentro de las proteínas . Estos cálculos complementan los valores de p K a informados para los aminoácidos en su estado libre y se utilizan con frecuencia en los campos del modelado molecular , la bioinformática estructural y la biología computacional .
Los valores de p K a de las cadenas laterales de aminoácidos juegan un papel importante en la definición de las características dependientes del pH de una proteína. La dependencia del pH de la actividad mostrada por las enzimas y la dependencia del pH de la estabilidad de las proteínas , por ejemplo, son propiedades que están determinadas por los valores de p K a de las cadenas laterales de los aminoácidos.
Los valores de p K a de una cadena lateral de aminoácidos en solución normalmente se infieren a partir de los valores de p K a de compuestos modelo (compuestos que son similares a las cadenas laterales de aminoácidos). Consulte Aminoácido para conocer los valores de p K a de todas las cadenas laterales de aminoácidos inferidos de esa manera. También existen numerosos estudios experimentales que han arrojado tales valores, por ejemplo mediante el uso de espectroscopia de RMN .
La siguiente tabla enumera los valores de p K a del modelo que se utilizan a menudo en un cálculo de p K a de proteína y contiene una tercera columna basada en estudios de proteínas. [1]
Cuando una proteína se pliega, los aminoácidos titulables de la proteína se transfieren de un entorno similar a una solución a un entorno determinado por la estructura tridimensional de la proteína. Por ejemplo, en una proteína desplegada, un ácido aspártico normalmente se encuentra en un entorno que expone la cadena lateral titulable al agua. Cuando la proteína se pliega, el ácido aspártico podría quedar enterrado profundamente en el interior de la proteína sin exposición al disolvente.
Además, en la proteína plegada, el ácido aspártico estará más cerca de otros grupos valorables en la proteína y también interactuará con cargas permanentes (por ejemplo, iones) y dipolos en la proteína. Todos estos efectos alteran el valor p K a de la cadena lateral de aminoácidos, y los métodos de cálculo de p K a generalmente calculan el efecto del entorno proteico en el valor p K a del modelo de una cadena lateral de aminoácidos. [2] [3] [4] [5]
Normalmente, los efectos del entorno proteico sobre el valor del aminoácido p K a se dividen en efectos independientes del pH y efectos dependientes del pH. Los efectos independientes del pH (desolvatación, interacciones con cargas permanentes y dipolos) se agregan al modelo p K un valor para darle un valor p K intrínseco . Los efectos dependientes del pH no se pueden sumar de la misma manera sencilla y deben tenerse en cuenta mediante la suma de Boltzmann, las iteraciones de Tanford-Roxby u otros métodos.
La interacción de los valores intrínsecos de p K a de un sistema con las energías de interacción electrostática entre grupos valorables puede producir efectos bastante espectaculares, como curvas de valoración no Henderson-Hasselbalch e incluso efectos de retrovaloración. [6]
La imagen de la derecha muestra un sistema teórico que consta de tres residuos ácidos. Un grupo muestra un evento de titulación inversa (grupo azul).
Se encuentran disponibles varios paquetes de software y un servidor web para el cálculo de los valores de proteína p K a .
Algunos métodos se basan en soluciones de la ecuación de Poisson-Boltzmann (PBE), a menudo denominadas métodos basados en FDPB ( FDPB significa " diferencias finitas de Poisson-Boltzmann"). El PBE es una modificación de la ecuación de Poisson que incorpora una descripción del efecto de los iones disolventes sobre el campo electrostático alrededor de una molécula.
El servidor web H++, [7] el servidor web pKD, [8] MCCE2, Karlsberg+, [ enlace muerto ] PETIT y GMCT utilizan el método FDPB para calcular los valores de p K a de las cadenas laterales de aminoácidos.
Los métodos basados en FDPB calculan el cambio en el valor p K a de una cadena lateral de aminoácido cuando esa cadena lateral se mueve desde un estado hipotético completamente solvatado a su posición en la proteína. Para realizar tal cálculo, se necesitan métodos teóricos que puedan calcular el efecto del interior de la proteína sobre el valor de pKa y conocimiento de los valores de pKa de las cadenas laterales de aminoácidos en sus estados completamente solvatados. [2] [3] [4] [5]
Li, Robertson y Jensen han desarrollado un conjunto de reglas empíricas que relacionan la estructura de la proteína con los valores de p K a de los residuos ionizables. [9] Estas reglas forman la base del programa accesible en la web llamado PROPKA para predicciones rápidas de valores de p K a . Tan KP et al. publicaron un programa empírico reciente de predicción de p K a . con el servidor en línea DEPTH servidor web. [10]
Los métodos de dinámica molecular para calcular los valores de p K a permiten incluir la flexibilidad total de la molécula titulada. [11] [12] [13]
Los métodos basados en la dinámica molecular suelen ser formas mucho más costosas desde el punto de vista computacional y no necesariamente más precisas para predecir los valores de p K a que los enfoques basados en la ecuación de Poisson-Boltzmann . También se puede lograr una flexibilidad conformacional limitada dentro de un enfoque de electrostática continua, por ejemplo, para considerar múltiples rotámeros de cadenas laterales de aminoácidos. Además, los campos de fuerza moleculares comúnmente utilizados actualmente no tienen en cuenta la polarizabilidad electrónica, lo que podría ser una propiedad importante para determinar las energías de protonación.
De la valoración del grupo protonable , se puede leer el llamado p K a 1 ⁄ 2 que es igual al valor de pH donde el grupo está medio protonado (es decir, cuando el 50% de dichos grupos estarían protonados). El p K a 1 ⁄ 2 es igual al p K a de Henderson-Hasselbalch (p KHH
un) si la curva de titulación sigue la ecuación de Henderson-Hasselbalch . [14] La mayoría de los métodos de cálculo de p K a asumen silenciosamente que todas las curvas de titulación tienen forma de Henderson-Hasselbalch y, por lo tanto, los valores de p K a en los programas de cálculo de p K a a menudo se determinan de esta manera. En el caso general de múltiples sitios protonables que interactúan, el valor de p K a 1 ⁄ 2 no es termodinámicamente significativo. Por el contrario, el valor p K a de Henderson-Hasselbalch se puede calcular a partir de la energía libre de protonación mediante
y, por lo tanto, está a su vez relacionado con la energía libre de protonación del sitio a través de
En principio, la energía libre de protonación se puede calcular a partir de la probabilidad de protonación del grupo ⟨ x ⟩ (pH), que se puede leer en su curva de titulación.
Las curvas de titulación se pueden calcular dentro de un enfoque electrostático continuo con métodos analíticos o Monte Carlo (MC) formalmente exactos pero más elaborados , o métodos aproximados inexactos pero rápidos. Los métodos MC que se han utilizado para calcular las curvas de titulación [15] son Metropolis MC [16] [17] o Wang-Landau MC . [18] Los métodos aproximados que utilizan un enfoque de campo medio para calcular las curvas de titulación son el método de Tanford-Roxby y los híbridos de este método que combinan un tratamiento de mecánica estadística exacta dentro de grupos de sitios que interactúan fuertemente con un tratamiento de campo medio de interacciones entre grupos. [19] [20] [21] [22] [23]
En la práctica, puede resultar difícil obtener energías libres de protonación precisas y estadísticamente convergentes a partir de curvas de titulación si ⟨ x ⟩ está cerca de un valor de 1 o 0. En este caso, se pueden utilizar varios métodos de cálculo de energía libre para obtener la energía libre de protonación. energía [15] como Metrópolis MC sesgada, [24] perturbación de energía libre , [25] [26] integración termodinámica , [27] [28] [29] el método de trabajo de no equilibrio [30] o el índice de aceptación de Bennett método. [31]
Tenga en cuenta que el p KHH
unEl valor generalmente depende del valor del pH. [32]
Esta dependencia es pequeña para grupos que interactúan débilmente, como cadenas laterales de aminoácidos bien solvatadas en la superficie de la proteína, pero puede ser grande para grupos que interactúan fuertemente, como los enterrados en sitios activos de enzimas o proteínas integrales de membrana. [33] [34] [35]
Si bien se encuentran disponibles muchos métodos de predicción de pKa de proteínas, sus precisiones a menudo difieren significativamente debido a diferencias sutiles y, a menudo, drásticas en la estrategia. [36]