stringtranslate.com

RAPTOR (software)

RAPTOR es un software de procesamiento de proteínas utilizado para la predicción de la estructura de las proteínas . Ha sido reemplazado por RaptorX , que es mucho más preciso que RAPTOR.

Comparación de técnicas

Enhebrado de proteínas versus modelado de homología

Los investigadores que intentan resolver la estructura de una proteína comienzan su estudio con poco más que una secuencia de proteína. Los pasos iniciales pueden incluir realizar una búsqueda PSI-BLAST o PatternHunter para localizar secuencias similares con una estructura conocida en el Protein Data Bank (PDB). Si hay secuencias muy similares con estructuras conocidas, existe una alta probabilidad de que la estructura de esta proteína sea muy similar a esas estructuras y funciones conocidas. Si no se encuentra ninguna homología, el investigador debe realizar cristalografía de rayos X o espectroscopia de resonancia magnética nuclear (RMN) , las cuales requieren tiempo y recursos considerables para producir una estructura. Cuando estas técnicas son demasiado costosas, consumen mucho tiempo o tienen un alcance limitado, los investigadores pueden utilizar software de procesamiento de proteínas, como RAPTOR, para crear un modelo altamente confiable de la proteína.

El enhebrado de proteínas es más eficaz que el modelado por homología, especialmente para proteínas que tienen pocos homólogos detectables mediante alineación de secuencias . Los dos métodos predicen la estructura de las proteínas a partir de una plantilla. Dada una secuencia de proteínas, el enhebrado de proteínas primero alinea (enhebra) la secuencia con cada plantilla en una biblioteca de estructuras optimizando una función de puntuación que mide la idoneidad de una alineación de secuencia-estructura. La mejor plantilla seleccionada se utiliza para construir el modelo de estructura. A diferencia del modelado de homología, que selecciona la plantilla basándose únicamente en información de homología (alineamientos de secuencia), la función de puntuación utilizada en el enhebrado de proteínas utiliza información tanto de homología como de estructura (alineamientos de estructura de secuencia).

Si no se ha encontrado una homología significativa en una secuencia, es posible que el modelado de homología no proporcione una predicción confiable en este caso. Sin información de homología, el enhebrado de proteínas aún puede utilizar información estructural para producir una buena predicción. Los intentos fallidos de obtener una buena plantilla con BLAST a menudo resultan en que los usuarios procesen los resultados a través de RAPTOR.

Programación entera versus programación dinámica

El enfoque de programación entera de RAPTOR produce modelos de mayor calidad que otros métodos de subprocesamiento de proteínas. La mayoría del software de subprocesos utiliza programación dinámica para optimizar sus funciones de puntuación al alinear una secuencia con una plantilla. La programación dinámica es mucho más fácil de implementar que la programación entera; sin embargo, si una función de puntuación tiene incluido un potencial de contacto por pares, la programación dinámica no puede optimizar globalmente dicha función de puntuación y, en cambio, simplemente genera una alineación óptima local.

Los contactos por pares están muy conservados en la estructura de las proteínas y son cruciales para la precisión de la predicción. La programación de números enteros puede optimizar globalmente una función de puntuación con potencial de contacto por pares y producir una alineación óptima global.

Componentes

Motores de roscado

NoCore, NPCore e IP son los tres motores de subprocesos diferentes implementados en RAPTOR. NoCore y NPCore se basan en programación dinámica y más rápido que IP. La diferencia entre ellos es que en NPCore, una plantilla se analiza en muchas regiones "centrales". Un núcleo es una región estructuralmente conservada. IP es el exclusivo motor de subprocesos basado en programación entera de RAPTOR. Produce mejores alineaciones y modelos que los otros dos motores de roscado. La gente siempre puede empezar con NoCore y NPCore. Si sus predicciones no son lo suficientemente buenas, la propiedad intelectual puede ser una mejor opción. Una vez ejecutados los tres métodos, un simple consenso puede ayudar a encontrar la mejor predicción.

Módulo de modelado de estructuras 3D.

La herramienta de modelado de estructuras 3D predeterminada utilizada en RAPTOR es OWL. El modelado de estructuras tridimensionales implica dos pasos. El primer paso es el modelado de bucles que modela regiones en la secuencia objetivo que no se asignan a nada en la plantilla. Una vez modelados todos los bucles y la columna vertebral esté lista, se unen las cadenas laterales a la columna vertebral y se empaquetan. Para el modelado de bucles, se utiliza un algoritmo de descenso de coordenadas cíclico para llenar los bucles y evitar conflictos. Para el empaquetado de cadenas laterales, se utiliza un algoritmo de descomposición de árbol para empaquetar todas las cadenas laterales y evitar conflictos. OWL se llama automáticamente en RAPTOR para generar la salida 3D.

Si un investigador tiene MODELLER, también puede configurar RAPTOR para que llame a MODELLER automáticamente. RAPTOR también puede generar archivos de entrada de ICM-Pro, con los que las personas ejecutan ICM-Pro por sí mismas.

Módulo PSI-BLAST

Para convertirlo en un conjunto de herramientas completo, PSI-BLAST también se incluye en RAPTOR para permitir a las personas realizar modelos de homología. Las personas pueden configurar todos los parámetros necesarios por sí mismas. Hay dos pasos involucrados en la ejecución de PSI-BLAST. El primer paso es generar el perfil de secuencia. Para este paso, se utiliza una base de datos NR no redundante. El siguiente paso es permitir que PSI-BLAST busque la secuencia objetivo frente a las secuencias del banco de datos de proteínas. Los usuarios también pueden especificar su propia base de datos para cada paso.

Visor de estructura de proteínas

Hay muchos visores de estructuras diferentes. En RAPTOR, Jmol se utiliza como visor de estructuras para examinar la predicción generada.

Producción

Después de un trabajo de subprocesamiento/PSI-BLAST, se puede ver una lista de clasificación de todas las plantillas. Para cada plantilla, las personas pueden ver la alineación, el valor E y muchas otras puntuaciones específicas. Además, se proporciona la información funcional de la plantilla y su clasificación SCOP . También se puede ver la matriz PSM de la secuencia y la predicción de la estructura secundaria. Si una plantilla ha sido reportada por más de un método, se marcará con la cantidad de veces que se ha reportado. Esto ayuda a identificar la mejor plantilla.

Rendimiento en CASP

CASP , Evaluación crítica de técnicas para la predicción de la estructura de proteínas, es un experimento bienal patrocinado por los NIH . CASP representa los Juegos Olímpicos de la comunidad de predicción de estructuras de proteínas y se estableció en 1994.

RAPTOR apareció por primera vez en CAFASP 3 (CASP5) en 2002 y ocupó el puesto número uno en el grupo de servidores individuales ese año. Desde entonces, RAPTOR ha participado activamente en todos los CASP con fines de evaluación y se ha clasificado constantemente en el nivel superior.

El CASP8 más reciente se desarrolló entre mayo de 2008 y agosto de 2008. Más de 80 servidores de predicción y más de 100 grupos de expertos humanos de todo el mundo se registraron para el evento, donde los participantes intentan predecir la estructura 3D a partir de una secuencia de proteínas. Según la clasificación del grupo de Zhang, RAPTOR ocupó el segundo lugar entre todos los servidores (metaservidor y servidores individuales). ROBETTA de Baker Lab ocupa el quinto lugar en la misma lista de clasificación.

Los cinco mejores servidores de predicción en CASP8

Referencias

enlaces externos