Medida de distancia entre átomos de proteínas superpuestas.
En bioinformática , la desviación cuadrática media de las posiciones atómicas , o simplemente desviación cuadrática media (RMSD) , es la medida de la distancia promedio entre los átomos (generalmente los átomos principales) de moléculas superpuestas . [1] En el estudio de las conformaciones de proteínas globulares, habitualmente se mide la similitud en la estructura tridimensional mediante el RMSD de las coordenadas atómicas Cα después de una superposición óptima de cuerpos rígidos.
Cuando un sistema dinámico fluctúa alrededor de una posición promedio bien definida, el RMSD del promedio a lo largo del tiempo puede denominarse RMSF o fluctuación cuadrática media . El tamaño de esta fluctuación se puede medir, por ejemplo, mediante espectroscopia de Mössbauer o resonancia magnética nuclear , y puede proporcionar información física importante. El índice de Lindemann es un método para ubicar el RMSF en el contexto de los parámetros del sistema.
Una forma ampliamente utilizada de comparar las estructuras de biomoléculas o cuerpos sólidos es trasladar y rotar una estructura con respecto a la otra para minimizar el RMSD. Coutsias, et al. presentó una derivación simple, basada en cuaterniones , para la transformación óptima de un cuerpo sólido (rotación-traslación) que minimiza el RMSD entre dos conjuntos de vectores. [2] Demostraron que el método de los cuaterniones es equivalente al conocido algoritmo de Kabsch . [3] La solución dada por Kabsch es un ejemplo de la solución del problema d -dimensional, introducida por Hurley y Cattell. [4] La solución del cuaternión para calcular la rotación óptima se publicó en el apéndice de un artículo de Petitjean. [5] Esta solución del cuaternión y el cálculo de la isometría óptima en el caso d -dimensional se extendieron a conjuntos infinitos y al caso continuo en el apéndice A de otro artículo de Petitjean. [6]
La ecuacion
![{\displaystyle \mathrm {RMSD} ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}\delta _{i}^{2}}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde δ i es la distancia entre el átomo i y una estructura de referencia o la posición media de los N átomos equivalentes. Esto a menudo se calcula para los átomos pesados de la columna vertebral C , N , O y C α o, a veces, solo para los átomos de C α .
Normalmente se realiza una superposición rígida que minimiza el RMSD y se devuelve este mínimo. Dados dos conjuntos de puntos y , el RMSD se define de la siguiente manera:![{\displaystyle n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbf {v} }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbf {w} }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle {\begin{aligned}\mathrm {RMSD} (\mathbf {v} ,\mathbf {w} )&={\sqrt {{\frac {1}{n}}\sum _{i=1 }^{n}\|v_{i}-w_{i}\|^{2}}}\\&={\sqrt {{\frac {1}{n}}\sum _{i=1} ^{n}((v_{ix}-w_{ix})^{2}+(v_{iy}-w_{iy})^{2}+(v_{iz}-w_{iz})^{ 2}}})\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Un valor RMSD se expresa en unidades de longitud. La unidad más utilizada en biología estructural es el Ångström (Å), que equivale a 10 −10 m.
Usos
Normalmente, RMSD se utiliza como medida cuantitativa de similitud entre dos o más estructuras proteicas. Por ejemplo, la competencia de predicción de la estructura de la proteína CASP utiliza RMSD como una de sus evaluaciones de qué tan bien una estructura enviada coincide con la estructura objetivo conocida. Por lo tanto, cuanto menor sea el RMSD, mejor será el modelo en comparación con la estructura objetivo.
Además, algunos científicos que estudian el plegamiento de proteínas mediante simulaciones por computadora utilizan RMSD como coordenada de reacción para cuantificar dónde se encuentra la proteína entre el estado plegado y el estado desplegado.
El estudio de RMSD para pequeñas moléculas orgánicas (comúnmente llamadas ligandos cuando se estudia su unión a macromoléculas, como proteínas) es común en el contexto del acoplamiento , [1] así como en otros métodos para estudiar la configuración de ligandos. cuando se une a macromoléculas. Tenga en cuenta que, en el caso de los ligandos (a diferencia de las proteínas, como se describe anteriormente), sus estructuras normalmente no se superponen antes del cálculo de la RMSD.
RMSD es también una de varias métricas que se han propuesto para cuantificar la similitud evolutiva entre proteínas, así como la calidad de las alineaciones de secuencias. [7] [8]
Ver también
- Desviación cuadrática media
- Fluctuación cuadrática media
- Quaternion : utilizado para optimizar los cálculos de RMSD
- Algoritmo de Kabsch : un algoritmo utilizado para minimizar el RMSD encontrando primero la mejor rotación [3]
- GDT : una medida de comparación de estructuras diferente
- TM-score : una medida de comparación de estructuras diferente
- Segmento continuo más largo (LCS): una medida de comparación de estructura diferente
- Cálculo de distancia global (GDC_sc, GDC_all): medidas de comparación de estructuras que utilizan información del modelo completo (no solo carbono α) para evaluar la similitud
- Alineación global local (LGA): programa de alineación de la estructura de proteínas y medida de comparación de estructuras
Referencias
- ^ ab "Acoplamiento molecular, estimación de energías libres de unión y campo de fuerza semiempírico de AutoDock". Sitio web de Sebastián Raschka . 26/06/2014 . Consultado el 7 de junio de 2016 .
- ^ Coutsias EA, Seok C, Dill KA (2004). "Uso de cuaterniones para calcular RMSD". J Computación Química . 25 (15): 1849–1857. doi :10.1002/jcc.20110. PMID 15376254. S2CID 18224579.
- ^ ab Kabsch W (1976). "Una solución para la mejor rotación para relacionar dos conjuntos de vectores". Acta Cristalográfica . 32 (5): 922–923. Código bibliográfico : 1976AcCrA..32..922K. doi :10.1107/S0567739476001873.
- ^ Hurley JR, Cattell RB (1962). "El programa Procrustes: producción de rotación directa para probar una estructura factorial hipotética". Ciencia del comportamiento . 7 (2): 258–262. doi :10.1002/bs.3830070216.
- ^ Petitjean M (1999). "Sobre las medidas de quiralidad cuantitativa y simetría cuantitativa cuadrática media" (PDF) . Revista de Física Matemática . 40 (9): 4587–4595. Código Bib : 1999JMP....40.4587P. doi : 10.1063/1.532988.
- ^ Petitjean M (2002). «Mezclas quirales» (PDF) . Revista de Física Matemática . 43 (8): 185-192. Código Bib : 2002JMP....43.4147P. doi : 10.1063/1.1484559.
- ^ Jewett AI, Huang CC, Ferrin TE (2003). "MINRMS: un algoritmo eficiente para determinar la similitud de la estructura de proteínas utilizando la distancia cuadrática media" (PDF) . Bioinformática . 19 (5): 625–634. doi : 10.1093/bioinformática/btg035 . PMID 12651721.
{{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace ) - ^ Armougom F, Moretti S, Keduas V, Notredame C (2006). "El iRMSD: una medida local de la precisión de la alineación de secuencias utilizando información estructural" (PDF) . Bioinformática . 22 (14): e35–39. doi : 10.1093/bioinformática/btl218 . PMID 16873492.
Otras lecturas
- Shibuya T (2009). "Búsqueda de estructuras tridimensionales de proteínas en tiempo lineal". Proc. 13.ª Conferencia Internacional Anual sobre Investigación en Biología Molecular Computacional (RECOMB 2009), LNCS 5541:1–15.
- Damm KL, Carlson HA (2006). "Superposición de proteínas RMSD ponderada gaussiana: una comparación estructural para proteínas flexibles y estructuras proteicas previstas". Biophys J. 90 (12): 4558–4573. Código Bib : 2006BpJ....90.4558D. doi : 10.1529/biophysj.105.066654. PMC 1471868 . PMID 16565070.
- Kneller GR (2005). "Comentario sobre 'Uso de cuaterniones para calcular RMSD' [J. Comp. Chem. 25, 1849 (2004)]". J Computación Química . 26 (15): 1660–1662. doi : 10.1002/jcc.20296 . PMID 16175580. S2CID 27004373.
- Theobald DL (2005). "Cálculo rápido de RMSD utilizando un polinomio característico basado en cuaterniones". Acta Crystallogr A. 61 (parte 4): 478–480. Código Bib : 2005AcCrA..61..478T. doi : 10.1107/S0108767305015266 . PMID 15973002.
- Maiorov VN, Crippen GM (1994). "Importancia de la desviación cuadrática media al comparar estructuras tridimensionales de proteínas globulares" (PDF) . J Mol Biol . 235 (2): 625–634. doi :10.1006/jmbi.1994.1017. hdl : 2027.42/31835 . PMID 8289285.
enlaces externos
- Medidas de distancia molecular: un tutorial sobre cómo calcular RMSD
- RMSD: otro tutorial sobre cómo calcular RMSD con código de ejemplo
- Coincidencia de estructura secundaria (SSM): una herramienta para comparar la estructura de proteínas. Utiliza RMSD.
- GDT, LCS y LGA: diferentes medidas de comparación de estructuras. Descripción y servicios.
- SuperPose: un servidor de superposición de proteínas. Utiliza RMSD.
- superponer: alineación estructural basada en la coincidencia de estructuras secundarias. Por el proyecto CCP4. Utiliza RMSD.
- Hay un script de Python disponible en https://github.com/charnley/rmsd
- Hay un script de Python alternativo disponible en https://github.com/jewettaij/superpose3d