stringtranslate.com

Biblioteca de rotámeros dependiente de la estructura principal

Biblioteca de rotámeros dependientes de la estructura principal para serina . Cada gráfico muestra la población de rotámeros χ 1 de serina en función de los ángulos diedros φ y ψ de la estructura principal.

En bioquímica , una biblioteca de rotámeros dependiente de la estructura principal proporciona las frecuencias, los ángulos diedros medios y las desviaciones estándar de las conformaciones discretas (conocidas como rotámeros ) de las cadenas laterales de aminoácidos en proteínas como una función de los ángulos diedros de la estructura principal φ y ψ del mapa de Ramachandran . Por el contrario, las bibliotecas de rotámeros independientes de la estructura principal expresan las frecuencias y los ángulos diedros medios para todas las cadenas laterales en proteínas, independientemente de la conformación de la estructura principal de cada tipo de residuo. Se ha demostrado que las bibliotecas de rotámeros dependientes de la estructura principal tienen ventajas significativas sobre las bibliotecas de rotámeros independientes de la estructura principal, principalmente cuando se utilizan como un término de energía, al acelerar los tiempos de búsqueda de los algoritmos de empaquetamiento de cadenas laterales utilizados en la predicción de la estructura de proteínas y el diseño de proteínas . [1]

Historia

La primera biblioteca de rotámeros dependiente de la cadena principal fue desarrollada en 1993 por Roland Dunbrack y Martin Karplus para ayudar a la predicción de las coordenadas cartesianas de las cadenas laterales de una proteína dadas las coordenadas cartesianas determinadas o predichas experimentalmente de su cadena principal. [2] La biblioteca se derivó de las estructuras de 132 proteínas del Protein Data Bank con una resolución de 2,0 Å o mejor. La biblioteca proporcionó los recuentos y frecuencias de rotámeros χ 1 o χ 12 de 18 aminoácidos (excluyendo los tipos de residuos de glicina y alanina , ya que no tienen un diedro χ 1 ) para cada bin de 20° x 20° del mapa de Ramachandran (φ,ψ = -180° a -160°, -160° a -140°, etc.).

En 1997, Dunbrack y Fred E. Cohen de la Universidad de California en San Francisco presentaron una biblioteca de rotámeros dependiente de la estructura principal derivada de la estadística bayesiana . [3] El enfoque bayesiano brindó la oportunidad de definir un prior bayesiano para las frecuencias de los rotámeros en cada bin de 10° x 10° derivado al suponer que los efectos estéricos y electrostáticos de los ángulos diedros φ y ψ son independientes. Además, se utilizó un núcleo periódico con una periodicidad de 180° para contar las cadenas laterales a 180° de distancia en cada dirección desde el bin de interés. Como exponente de una función sen 2 , se comportó de manera muy similar a una distribución de von Mises comúnmente utilizada en la estadística direccional . La biblioteca de 1997 se puso a disposición del público a través de la World Wide Web en 1997 y se utilizó de manera temprana en la predicción de la estructura de proteínas [4] y el diseño de proteínas . [5] La biblioteca derivada de la estadística bayesiana se actualizó en 2002 [6]

Biblioteca de rotámeros dependiente de la cadena principal para fenilalanina . Cada gráfico muestra la población de rotámeros χ 1 de fenilalanina en función de los ángulos diedros de la cadena principal φ y ψ

Muchos programas de modelado, como Rosetta , utilizan una biblioteca de rotámeros dependiente de la estructura principal como una función de puntuación (generalmente en la forma E=-ln(p(rotamer( i ) | φ,ψ)) para el i ésimo rotámero, y optimizan la conformación de la estructura principal de las proteínas al minimizar la energía del rotámero con derivadas de las probabilidades logarítmicas con respecto a φ,ψ. [7] Esto requiere funciones de probabilidad suaves con derivadas suaves, porque la mayoría de los algoritmos de optimización matemática utilizan derivadas primeras y, a veces, segundas y se quedarán atascados en mínimos locales en superficies rugosas. En 2011, Shapovalov y Dunbrack publicaron una biblioteca de rotámeros dependiente de la estructura principal suavizada derivada de estimaciones de densidad de kernel y regresiones de kernel con kernels de distribución de von Mises en las variables φ,ψ. [8] El tratamiento de los grados de libertad no rotaméricos (aquellos ángulos diedros que no se refieren a enlaces sp 3 -sp 3 , como asparagina y aspartato χ 2 , fenilalanina , tirosina , histidina , triptófano χ 2 y glutamina y glutamato χ 3 ) se mejoró modelando la densidad de probabilidad del ángulo diedro de cada uno de estos ángulos diedros como una función del rotámero χ 1 (o χ 1 y χ 2 para Gln y Glu) y φ,ψ. Las funciones son esencialmente regresiones de una densidad de probabilidad periódica en un toro .

Además del análisis estadístico de las estructuras en el Protein Data Bank , las bibliotecas de rotámeros dependientes de la cadena principal también se pueden derivar de simulaciones de dinámica molecular de proteínas, como lo demuestra la biblioteca Dynameomics del grupo de investigación de Valerie Daggett . [9] Debido a que estas bibliotecas se basan en el muestreo de simulaciones, pueden generar cantidades mucho mayores de puntos de datos en las regiones del mapa de Ramachandran que están escasamente pobladas en estructuras experimentales, lo que conduce a una mayor significación estadística en estas regiones. Las bibliotecas de rotámeros derivadas de simulaciones dependen del campo de fuerza utilizado en las simulaciones. La biblioteca Dynameomics se basa en simulaciones que utilizan el campo de fuerza ENCAD de Levitt et al. de 1995. [10]

Dependencia de la estructura principal de las poblaciones de rotámeros

Interacciones estéricas que afectan las preferencias de rotámero dependientes de la conformación de la cadena principal de las cadenas laterales de aminoácidos, mostradas en una proyección de Newman

El efecto de la conformación de la cadena principal en las frecuencias del rotámero de la cadena lateral se debe principalmente a las repulsiones estéricas entre los átomos de la cadena principal cuya posición depende de φ y ψ y los átomos pesados ​​γ de la cadena lateral (carbono, oxígeno o azufre) de cada tipo de residuo (tipos de átomos PDB CG, CG1, CG2, OG, OG1, SG). Estos ocurren en combinaciones predecibles que dependen de los diedros que conectan los átomos de la cadena principal con los átomos de la cadena lateral. [11] [3] Estas interacciones estéricas ocurren cuando los ángulos diedros de conexión forman un par de ángulos diedros con valores {-60°,+60°} o {+60°,-60°}, de una manera relacionada con el fenómeno de la interferencia del pentano . Por ejemplo, el átomo de nitrógeno del residuo i+1 está conectado al átomo pesado γ de cualquier cadena lateral por un conjunto conectado de 5 átomos: N(i+1)-C(i)-Cα(i)-Cβ(i)-Cγ(i). El ángulo diedro N(i+1)-C(i)-Cα(i)-Cβ(i) es igual a ψ+120°, y C(i)-Cα(i)-Cβ(i)-Cγ(i) es igual a χ 1 -120°. Cuando ψ es -60° y χ 1 es +60° (el rotámero g+ de una cadena lateral), hay una interacción estérica entre N(i+1) y Cγ porque los ángulos diedros que los conectan son N(i+1)-C(i)-Cα(i)-Cβ(i) = ψ+120° = +60°, y C(i)-Cα(i)-Cβ(i)-Cγ(i) = χ 1 -120° = -60°. La misma interacción ocurre cuando ψ es 0° y χ 1 es 180° (el rotámero trans de una cadena lateral). El oxígeno carbonílico del residuo i juega el mismo papel cuando ψ=-60° para el rotámero g+ y cuando ψ=180° para el rotámero trans. Finalmente, ocurren interacciones dependientes de φ entre los átomos pesados ​​γ de la cadena lateral en los rotámeros g- y g+ por un lado, y el carbono carbonílico del residuo i-1 y un átomo pesado γ, y entre el NH de la cadena principal del residuo i y su socio de enlace de hidrógeno por el otro.

Interacciones estéricas de cadena lateral/cadena principal que afectan las distribuciones de aminoácidos del diagrama de Ramachandran. Los datos corresponden al aminoácido lisina.

Las interacciones dependientes de φ,ψ de los átomos de la cadena principal y los átomos de Cγ de la cadena lateral se pueden observar en la distribución de observaciones en el diagrama de Ramachandran de cada rotámero χ 1 (marcado en la figura). En estas posiciones, las poblaciones de Ramachandran de los rotámeros se reducen significativamente. Se pueden resumir de la siguiente manera:

Biblioteca de rotámeros dependientes de la estructura principal para valina . Cada gráfico muestra la población de rotámeros χ 1 de valina en función de los ángulos diedros de la estructura principal φ y ψ

Los tipos de cadena lateral con dos átomos pesados ​​(Val, Ile, Thr) tienen interacciones dependientes de la cadena principal con ambos átomos pesados. Val tiene CG1 en χ 1 y CG2 en χ 1 +120°. Debido a que las conformaciones g+ y g- de Val tienen interacciones estéricas con la cadena principal cerca de ψ=120° y -60° (los rangos ψ más poblados), Val es el único aminoácido donde el rotámero t (χ 1 ~180°) es el más común. En la mayoría de los valores de φ y ψ, solo se permite un rotámero de Val (que se muestra en la figura). Ile tiene CG1 en χ 1 y CG2 en χ 1 -120°. Thr tiene OG1 en χ 1 y CG2 en χ 1 -120°.

Usos

La biblioteca de rotámeros dependiente de la estructura principal de Dunbrack se utiliza en varios programas para la predicción de la estructura de proteínas y el diseño computacional, incluidos:

Referencias

  1. ^ Huang, X; Pearce, R; Zhang, Y (2020). "Hacia la precisión y velocidad del empaquetamiento de la cadena lateral de proteínas: un estudio sistemático sobre bibliotecas de rotámeros". Journal of Chemical Information and Modeling . 60 (1): 410–420. doi :10.1021/acs.jcim.9b00812. PMC  7938712 . PMID  31851497 . Consultado el 18 de febrero de 2021 .
  2. ^ Dunbrack, RL Jr.; Karplus, M (1993). "Biblioteca de rotámeros dependiente de la cadena principal para proteínas. Aplicación a la predicción de la cadena lateral". Journal of Molecular Biology . 230 (2): 543–74. doi :10.1006/jmbi.1993.1170. PMID  8464064.
  3. ^ ab Dunbrack, RL Jr.; Cohen, FE (1997). "Análisis estadístico bayesiano de las preferencias de rotámeros de la cadena lateral de proteínas". Protein Science . 6 (8): 1661–81. doi :10.1002/pro.5560060807. PMC 2143774 . PMID  9260279. 
  4. ^ Bower, MJ; Cohen, FE; Dunbrack, RL Jr (1997). "Predicción de rotámeros de cadena lateral de proteínas a partir de una biblioteca de rotámeros dependiente de la estructura principal: una nueva herramienta de modelado de homología". Journal of Molecular Biology . 267 (5): 1268–82. doi :10.1006/jmbi.1997.0926. PMID  9150411.
  5. ^ Kuhlman, B; Baker, D (2000). "Las secuencias de proteínas nativas están cerca de ser óptimas para sus estructuras". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 97 (19): 10383–8. Bibcode :2000PNAS...9710383K. doi : 10.1073/pnas.97.19.10383 . PMC 27033 . PMID  10984534. 
  6. ^ Dunbrack, RL Jr (2002). "Bibliotecas de rotámeros en el siglo XXI". Current Opinion in Structural Biology . 12 (4): 431–40. doi :10.1016/s0959-440x(02)00344-5. PMID  12163064.
  7. ^ abc Alford, RF; Leaver-Fay, A; Jeliazkov, JR; O'Meara, MJ; DiMaio, FP; Park, H; Shapovalov, MV; Renfrew, PD; Mulligan, VK; Kappel, K; Labonte, JW; Pacella, MS; Bonneau, R; Bradley, P; Dunbrack, RL; Das, R; Baker, D; Kuhlman, B; Kortemme, T; Gray, JJ (13 de junio de 2017). "La función de energía de todos los átomos de Rosetta para el diseño y modelado macromolecular". Revista de teoría y computación química . 13 (6): 3031–3048. doi :10.1021/acs.jctc.7b00125. PMC 5717763 . PMID  28430426. 
  8. ^ Shapovalov, MV; Dunbrack, RL Jr (2011). "Una biblioteca de rotámeros dependiente de la estructura principal suavizada para proteínas derivadas de estimaciones y regresiones de densidad de núcleo adaptativo". Estructura . 19 (6): 844–58. doi :10.1016/j.str.2011.03.019. PMC 3118414 . PMID  21645855. 
  9. ^ Towse, Clare-Louise; Rysavy, Steven J.; Vulovic, Ivan M.; Daggett, Valerie (5 de enero de 2016). "Nuevas bibliotecas de rotámeros dinámicos: análisis basado en datos de las propensiones conformacionales de las cadenas laterales". Structure . 24 (1): 187–199. doi :10.1016/j.str.2015.10.017. ISSN  0969-2126. PMC 4715459 . PMID  26745530. 
  10. ^ Levitt, Michael; Hirshberg, Miriam; Sharon, Ruth; Daggett, Valerie (1995). "Función de energía potencial y parámetros para simulaciones de la dinámica molecular de proteínas y ácidos nucleicos en solución". Computer Physics Communications . 91 (1): 215–231. Bibcode :1995CoPhC..91..215L. doi : 10.1016/0010-4655(95)00049-L .
  11. ^ Dunbrack, RL Jr.; Karplus, M (1994). "Análisis conformacional de las preferencias de rotámeros dependientes de la estructura principal de las cadenas laterales de proteínas". Nature Structural Biology . 1 (5): 334–340. doi :10.1038/nsb0594-334. ISSN  1545-9985. PMID  7664040. S2CID  9157373.
  12. ^ Waterhouse, A; Bertoni, M; Bienert, S; Studer, G; Tauriello, G; Gumienny, R; Heer, FT; de Beer, TAP; Rempfer, C; Bordoli, L; Lepore, R; Schwede, T (2018). "SWISS-MODEL: modelado de homología de estructuras y complejos proteicos". Investigación de ácidos nucleicos . 46 (W1): W296–W303. doi :10.1093/nar/gky427. PMC 6030848 . PMID  29788355. 
  13. ^ Studer, G; Tauriello, G; Bienert, S; Biasini, M; Johner, N; Schwede, T (2021). "ProMod3: una caja de herramientas versátil para modelado de homología". PLOS Computational Biology . 17 (1): e1008667. Bibcode :2021PLSCB..17E8667S. doi : 10.1371/journal.pcbi.1008667 . PMC 7872268 . PMID  33507980. 
  14. ^ Kelley, LA; Mezulis, S; Yates, CM; Wass, MN; Sternberg, MJ (2015). "El portal web Phyre2 para modelado, predicción y análisis de proteínas". Nature Protocols . 10 (6): 845–58. doi :10.1038/nprot.2015.053. PMC 5298202 . PMID  25950237. 
  15. ^ OpenEye Scientific Software. «Conformaciones de macromoléculas: kits de herramientas: Java». OEChem Toolkit 3.1.0.0 . Consultado el 10 de febrero de 2021 .
  16. ^ Krieger, E. "Modelado de cadenas laterales de proteínas en YASARA". www.yasara.org . Biociencias Yasara . Consultado el 10 de febrero de 2021 .
  17. ^ Heo, L; Park, H; Seok, C (2013). "GalaxyRefine: refinamiento de la estructura de proteínas impulsado por el reempaquetamiento de la cadena lateral". Nucleic Acids Research . 41 (número del servidor web): W384-8. doi :10.1093/nar/gkt458. PMC 3692086 . PMID  23737448. 
  18. ^ Krivov, Georgii G.; Shapovalov, Maxim V.; Dunbrack, Roland L. (2009). "Predicción mejorada de conformaciones de cadena lateral de proteínas con SCWRL4". Proteínas: estructura, función y bioinformática . 77 (4): 778–795. doi :10.1002/prot.22488. ISSN  1097-0134. PMC 2885146 . PMID  19603484. 
  19. ^ Huang, X; Pearce, R; Zhang, Y (2020). "EvoEF2: función de energía precisa y rápida para el diseño computacional de proteínas". Bioinformática . 36 (4): 1135–1142. doi :10.1093/bioinformatics/btz740. PMC 7144094 . PMID  31588495. 
  20. ^ Kulp, Daniel W. "Rotamer Toggle - PyMOLWiki". pymolwiki.org . Consorcio SBGrid . Consultado el 10 de febrero de 2021 .
  21. ^ Pettersen, EF; Goddard, TD; Huang, CC; Meng, EC; Couch, GS; Croll, TI; Morris, JH; Ferrin, TE. "Herramientas Rotamer (ChimeraX)". Guía del usuario de ChimeraX . Regentes de la Universidad de California . Consultado el 9 de febrero de 2021 .

Enlaces externos