En bioquímica , una biblioteca de rotámeros dependiente de la estructura principal proporciona las frecuencias, los ángulos diedros medios y las desviaciones estándar de las conformaciones discretas (conocidas como rotámeros ) de las cadenas laterales de aminoácidos en proteínas como una función de los ángulos diedros de la estructura principal φ y ψ del mapa de Ramachandran . Por el contrario, las bibliotecas de rotámeros independientes de la estructura principal expresan las frecuencias y los ángulos diedros medios para todas las cadenas laterales en proteínas, independientemente de la conformación de la estructura principal de cada tipo de residuo. Se ha demostrado que las bibliotecas de rotámeros dependientes de la estructura principal tienen ventajas significativas sobre las bibliotecas de rotámeros independientes de la estructura principal, principalmente cuando se utilizan como un término de energía, al acelerar los tiempos de búsqueda de los algoritmos de empaquetamiento de cadenas laterales utilizados en la predicción de la estructura de proteínas y el diseño de proteínas . [1]
La primera biblioteca de rotámeros dependiente de la cadena principal fue desarrollada en 1993 por Roland Dunbrack y Martin Karplus para ayudar a la predicción de las coordenadas cartesianas de las cadenas laterales de una proteína dadas las coordenadas cartesianas determinadas o predichas experimentalmente de su cadena principal. [2] La biblioteca se derivó de las estructuras de 132 proteínas del Protein Data Bank con una resolución de 2,0 Å o mejor. La biblioteca proporcionó los recuentos y frecuencias de rotámeros χ 1 o χ 1 +χ 2 de 18 aminoácidos (excluyendo los tipos de residuos de glicina y alanina , ya que no tienen un diedro χ 1 ) para cada bin de 20° x 20° del mapa de Ramachandran (φ,ψ = -180° a -160°, -160° a -140°, etc.).
En 1997, Dunbrack y Fred E. Cohen de la Universidad de California en San Francisco presentaron una biblioteca de rotámeros dependiente de la estructura principal derivada de la estadística bayesiana . [3] El enfoque bayesiano brindó la oportunidad de definir un prior bayesiano para las frecuencias de los rotámeros en cada bin de 10° x 10° derivado al suponer que los efectos estéricos y electrostáticos de los ángulos diedros φ y ψ son independientes. Además, se utilizó un núcleo periódico con una periodicidad de 180° para contar las cadenas laterales a 180° de distancia en cada dirección desde el bin de interés. Como exponente de una función sen 2 , se comportó de manera muy similar a una distribución de von Mises comúnmente utilizada en la estadística direccional . La biblioteca de 1997 se puso a disposición del público a través de la World Wide Web en 1997 y se utilizó de manera temprana en la predicción de la estructura de proteínas [4] y el diseño de proteínas . [5] La biblioteca derivada de la estadística bayesiana se actualizó en 2002 [6]
Muchos programas de modelado, como Rosetta , utilizan una biblioteca de rotámeros dependiente de la estructura principal como una función de puntuación (generalmente en la forma E=-ln(p(rotamer( i ) | φ,ψ)) para el i ésimo rotámero, y optimizan la conformación de la estructura principal de las proteínas al minimizar la energía del rotámero con derivadas de las probabilidades logarítmicas con respecto a φ,ψ. [7] Esto requiere funciones de probabilidad suaves con derivadas suaves, porque la mayoría de los algoritmos de optimización matemática utilizan derivadas primeras y, a veces, segundas y se quedarán atascados en mínimos locales en superficies rugosas. En 2011, Shapovalov y Dunbrack publicaron una biblioteca de rotámeros dependiente de la estructura principal suavizada derivada de estimaciones de densidad de kernel y regresiones de kernel con kernels de distribución de von Mises en las variables φ,ψ. [8] El tratamiento de los grados de libertad no rotaméricos (aquellos ángulos diedros que no se refieren a enlaces sp 3 -sp 3 , como asparagina y aspartato χ 2 , fenilalanina , tirosina , histidina , triptófano χ 2 y glutamina y glutamato χ 3 ) se mejoró modelando la densidad de probabilidad del ángulo diedro de cada uno de estos ángulos diedros como una función del rotámero χ 1 (o χ 1 y χ 2 para Gln y Glu) y φ,ψ. Las funciones son esencialmente regresiones de una densidad de probabilidad periódica en un toro .
Además del análisis estadístico de las estructuras en el Protein Data Bank , las bibliotecas de rotámeros dependientes de la cadena principal también se pueden derivar de simulaciones de dinámica molecular de proteínas, como lo demuestra la biblioteca Dynameomics del grupo de investigación de Valerie Daggett . [9] Debido a que estas bibliotecas se basan en el muestreo de simulaciones, pueden generar cantidades mucho mayores de puntos de datos en las regiones del mapa de Ramachandran que están escasamente pobladas en estructuras experimentales, lo que conduce a una mayor significación estadística en estas regiones. Las bibliotecas de rotámeros derivadas de simulaciones dependen del campo de fuerza utilizado en las simulaciones. La biblioteca Dynameomics se basa en simulaciones que utilizan el campo de fuerza ENCAD de Levitt et al. de 1995. [10]
El efecto de la conformación de la cadena principal en las frecuencias del rotámero de la cadena lateral se debe principalmente a las repulsiones estéricas entre los átomos de la cadena principal cuya posición depende de φ y ψ y los átomos pesados γ de la cadena lateral (carbono, oxígeno o azufre) de cada tipo de residuo (tipos de átomos PDB CG, CG1, CG2, OG, OG1, SG). Estos ocurren en combinaciones predecibles que dependen de los diedros que conectan los átomos de la cadena principal con los átomos de la cadena lateral. [11] [3] Estas interacciones estéricas ocurren cuando los ángulos diedros de conexión forman un par de ángulos diedros con valores {-60°,+60°} o {+60°,-60°}, de una manera relacionada con el fenómeno de la interferencia del pentano . Por ejemplo, el átomo de nitrógeno del residuo i+1 está conectado al átomo pesado γ de cualquier cadena lateral por un conjunto conectado de 5 átomos: N(i+1)-C(i)-Cα(i)-Cβ(i)-Cγ(i). El ángulo diedro N(i+1)-C(i)-Cα(i)-Cβ(i) es igual a ψ+120°, y C(i)-Cα(i)-Cβ(i)-Cγ(i) es igual a χ 1 -120°. Cuando ψ es -60° y χ 1 es +60° (el rotámero g+ de una cadena lateral), hay una interacción estérica entre N(i+1) y Cγ porque los ángulos diedros que los conectan son N(i+1)-C(i)-Cα(i)-Cβ(i) = ψ+120° = +60°, y C(i)-Cα(i)-Cβ(i)-Cγ(i) = χ 1 -120° = -60°. La misma interacción ocurre cuando ψ es 0° y χ 1 es 180° (el rotámero trans de una cadena lateral). El oxígeno carbonílico del residuo i juega el mismo papel cuando ψ=-60° para el rotámero g+ y cuando ψ=180° para el rotámero trans. Finalmente, ocurren interacciones dependientes de φ entre los átomos pesados γ de la cadena lateral en los rotámeros g- y g+ por un lado, y el carbono carbonílico del residuo i-1 y un átomo pesado γ, y entre el NH de la cadena principal del residuo i y su socio de enlace de hidrógeno por el otro.
Las interacciones dependientes de φ,ψ de los átomos de la cadena principal y los átomos de Cγ de la cadena lateral se pueden observar en la distribución de observaciones en el diagrama de Ramachandran de cada rotámero χ 1 (marcado en la figura). En estas posiciones, las poblaciones de Ramachandran de los rotámeros se reducen significativamente. Se pueden resumir de la siguiente manera:
Los tipos de cadena lateral con dos átomos pesados (Val, Ile, Thr) tienen interacciones dependientes de la cadena principal con ambos átomos pesados. Val tiene CG1 en χ 1 y CG2 en χ 1 +120°. Debido a que las conformaciones g+ y g- de Val tienen interacciones estéricas con la cadena principal cerca de ψ=120° y -60° (los rangos ψ más poblados), Val es el único aminoácido donde el rotámero t (χ 1 ~180°) es el más común. En la mayoría de los valores de φ y ψ, solo se permite un rotámero de Val (que se muestra en la figura). Ile tiene CG1 en χ 1 y CG2 en χ 1 -120°. Thr tiene OG1 en χ 1 y CG2 en χ 1 -120°.
La biblioteca de rotámeros dependiente de la estructura principal de Dunbrack se utiliza en varios programas para la predicción de la estructura de proteínas y el diseño computacional, incluidos: