stringtranslate.com

Resolución por poder

La resolución por proxy (ResProx) es un método para evaluar la resolución equivalente de rayos X de estructuras proteínicas derivadas de RMN . ResProx calcula la resolución a partir de datos de coordenadas en lugar de a partir de la densidad electrónica u otras entradas experimentales. Esto hace posible calcular la resolución de una estructura independientemente de cómo se haya resuelto ( rayos X , RMN , EM, modelado, predicción ab initio ). ResProx se diseñó originalmente para servir como una evaluación simple de un solo número que permite una comparación directa entre la calidad/resolución de las estructuras de rayos X y la calidad de una estructura de RMN dada . Sin embargo, también se puede utilizar para evaluar la confiabilidad de una resolución de estructura de rayos X informada experimentalmente, para evaluar estructuras proteínicas resueltas por medios no convencionales o híbridos y para identificar estructuras fraudulentas depositadas en el PDB. [1] ResProx incorpora más de 25 características estructurales diferentes para determinar un único valor similar a la resolución. Los valores de ResProx se informan en Angstroms. Las pruebas realizadas en miles de estructuras de rayos X muestran que los valores de ResProx coinciden muy estrechamente con los valores de resolución informados por los cristalógrafos de rayos X. [1] Los valores de resolución por proxy se pueden calcular para estructuras de proteínas recién determinadas utilizando un servidor web ResProx de libre acceso. [1] Este servidor acepta datos de coordenadas de proteínas (en formato PDB ) y genera una estimación de resolución (en angstroms) para esa estructura de entrada.

Antecedentes y fundamento

En cristalografía de rayos X , la resolución es una medida de la resolubilidad o precisión en el mapa de densidad electrónica de una molécula. La resolución se informa generalmente en Angstroms (Å, 10 –10 metros) para estructuras cristalinas de rayos X. Cuanto menor sea el número, mejor será el grado de resolución atómica. En la cristalografía de rayos X de proteínas , la mejor resolución que se puede alcanzar normalmente es de alrededor de 1 Å. Este nivel de resolución permite visualizar átomos de hidrógeno individuales y mapear átomos pesados ​​( C , O , N ) con mucha precisión. La mayoría de las estructuras de proteínas resueltas hoy tienen una resolución de 1,5 a 2,5 Å, lo que significa que los átomos de hidrógeno no son visibles y existe cierta incertidumbre en la ubicación precisa de los átomos pesados. Las estructuras de proteínas con una resolución de >2,5 Å generalmente tienen una serie de imprecisiones de coordenadas , así como otros problemas estructurales. Cuando la resolución es mayor de 3,5 Å, a menudo existe una incertidumbre considerable tanto en las ubicaciones de los átomos como incluso en la identidad de los residuos amino individuales. En otras palabras, la resolución está inversamente correlacionada con la calidad de la estructura (es decir, los números más altos significan estructuras más pobres). Esta tendencia en la calidad de la estructura de la proteína para la resolución de rayos X coincide muy de cerca con la tendencia observada en la calidad de las estructuras de proteínas determinadas por RMN . Algunas estructuras de RMN tienen un gran número de restricciones (NOE, enlaces de H, acoplamientos J, acoplamientos dipolares), excelente geometría, alta calidad de estructura y conjuntos muy ajustados con excelente precisión atómica ( RMSD < 1 Å). Otras estructuras de RMN tienen muy pocas restricciones, mala geometría o mala calidad de estructura y conjuntos muy sueltos (RMSD > 3 Å). Sin embargo, no existe un mapeo simple entre los valores de RMSD de RMN y los valores de resolución de rayos X. Es decir , un conjunto de RMN con 1 Å RMSD no corresponde en calidad o precisión a una estructura de rayos X con una resolución de 1 Å. Esto se debe a que la medida de RMSD es tanto una función del número de estructuras utilizadas en el conjunto como del sesgo de selección del espectroscopista que deposita el conjunto estructural. De la misma manera, en RMN es posible generar estructuras proteínicas de alta calidad, determinadas con precisión, utilizando relativamente pocas restricciones bien elegidas. También es posible generar estructuras proteínicas de muy baja calidad. Estructuras de RMN a partir de un gran número de restricciones evaluadas descuidadamente, erróneas o mal asignadas.

Durante los últimos 20 años se han propuesto varios métodos para calcular la “resolución equivalente” utilizando únicamente datos de coordenadas de rayos X (en lugar de datos de difracción de rayos X ). Algunos fueron diseñados específicamente para evaluar estructuras de RMN, como Procheck-NMR [2], mientras que otros fueron diseñados más para la evaluación de la calidad de la estructura y la validación de estructuras de rayos X , como MolProbity [3] y RosettaHoles2 [4] . Sin embargo, estos métodos se basan en un número relativamente pequeño de medidas de calidad de la estructura de la proteína para predecir la resolución (4, 3 y 1 medidas, respectivamente) y, en consecuencia, la correlación entre la resolución observada (de rayos X) y la resolución predicha no es particularmente buena. Al expandir el número de características de la estructura para incluir la distribución de ángulos de torsión, la presencia de choques de átomos, la normalidad de los enlaces de hidrógeno, el número de violaciones de longitudes de enlace y ángulos de enlace, la presencia de cavidades, volúmenes de empaquetamiento específicos de residuos, eficiencia de empaquetamiento y energías de enhebrado, es posible mejorar esta correlación de manera bastante sustancial.

El algoritmo ResProx

ResProx utiliza una colección de 25 características diferentes de la estructura de proteínas (como distribuciones de ángulos de torsión, enlaces de hidrógeno, volumen de empaquetamiento, cavidades, medidas de Molprobity) que se usaron en un método de regresión de vectores de soporte para maximizar la correlación entre la resolución predicha y la resolución de rayos X observada en un conjunto de 2400 estructuras de proteínas con resolución de rayos X conocida . Los detalles exactos del algoritmo se proporcionan en un artículo publicado por Wishart y colegas. [1] Después del entrenamiento y la validación apropiada en conjuntos de pruebas independientes, este modelo SVR puede estimar la resolución de estructuras de rayos X resueltas con un coeficiente de correlación de 0,92, error absoluto medio de 0,28 Å. Esto es aproximadamente un 15-30% mejor que los métodos existentes. Esto se muestra en la Figura 1. Debido a que el rendimiento del método ResProx es tan alto y debido a que solo necesita datos de coordenadas para generar una estimación de la resolución de rayos X equivalente , es ideal para ser aplicado a estructuras de RMN . Cuando se analizan las estructuras de RMN con ResProx, la estructura de RMN promedio tiene una resolución de rayos X equivalente de 2,8 Å, que es relativamente pobre (Fig. 2). Esto concuerda con las observaciones cualitativas sobre la calidad y precisión generales de las estructuras de RMN . Como se ve en la Figura 2, una cantidad muy pequeña de estructuras de RMN exhiben una resolución equivalente a < 1,0 Å, pero estas son raras.

Figura 1. Rendimiento de ResProx frente a datos de entrenamiento y prueba.

Figura 2. Histograma de la resolución equivalente de ResProx para modelos de RMN y resolución experimental para estructuras de rayos X. Se seleccionaron aleatoriamente 500 conjuntos de RMN y 500 estructuras de rayos X del PDB. Las proteínas se agruparon en compartimentos de resolución de 0,25 Å. Los valores de resolución en el eje X indican el límite superior de cada compartimento de resolución. Los valores para las estructuras de RMN y las estructuras de rayos X representan la cantidad de estructuras en cada compartimento de resolución.

El servidor ResProx

El servidor web ResProx es un servidor de libre acceso que acepta datos de coordenadas de proteínas de RMN (en formato PDB ) y genera una estimación de resolución (en angstroms) para esa estructura de RMN . También está disponible una versión descargable de ResProx. ResProx también proporciona una lista de 50834 estructuras de proteínas con identificadores PDB junto con su resolución observada y los valores ResProx correspondientes.

Referencias

  1. ^ abcde Berjanskii, M; Zhou J; Liang Y; Li G; Wishart DS (julio de 2012). "Resolución por proxy: una medida simple para evaluar y comparar la calidad general de las estructuras de proteínas de RMN". J Biomol NMR . 53 (3): 167–80. doi :10.1007/s10858-012-9637-2. PMID  22678091. S2CID  43740468.
  2. ^ Laskowski, RA; Rullmannn JA; MacArthur MW; Kaptein R; Thornton JM (1996). "AQUA y PROCHECK-NMR: programas para comprobar la calidad de las estructuras proteínicas resueltas por RMN". J Biomol NMR . 8 (4): 477–486. doi :10.1007/bf00228148. PMID  9008363. S2CID  45664105.
  3. ^ Chen VB, Arendall WB 3rd, Headd JJ, Keedy DA, Immormino RM, Kapral GJ, Murray LW, Richardson JS, Richardson DC (2010). "MolProbity: validación de la estructura de todos los átomos para cristalografía macromolecular". Acta Crystallogr D . 66 (Pt 1): 12–21. doi :10.1107/S0907444909042073. PMC 2803126 . PMID  20057044. 
  4. ^ Sheffler, W; Baker D (2010). "RosettaHoles2: una medida de empaquetamiento volumétrico para el refinamiento y validación de la estructura de proteínas". Protein Sci . 19 (10): 1991–1995. doi :10.1002/pro.458. PMC 2998733 . PMID  20665689.