La Evaluación Crítica de la Predicción de la Estructura ( CASP ), a veces llamada Evaluación Crítica de la Predicción de la Estructura de las Proteínas , es un experimento comunitario y mundial para la predicción de la estructura de las proteínas que se lleva a cabo cada dos años desde 1994. [1] [2] La CASP ofrece a los grupos de investigación la oportunidad de probar objetivamente sus métodos de predicción de la estructura y ofrece una evaluación independiente del estado del arte en el modelado de la estructura de las proteínas a la comunidad de investigación y a los usuarios de software. Aunque el objetivo principal de la CASP es ayudar a avanzar en los métodos de identificación de la estructura tridimensional de las proteínas a partir de su secuencia de aminoácidos, muchos ven el experimento más como un "campeonato mundial" en este campo de la ciencia. Más de 100 grupos de investigación de todo el mundo participan en la CASP de forma regular y no es raro que grupos enteros suspendan sus otras investigaciones durante meses mientras se concentran en preparar sus servidores para el experimento y en realizar las predicciones detalladas.
Para garantizar que ningún predictor pueda tener información previa sobre la estructura de una proteína que lo pondría en ventaja, es importante que el experimento se realice de manera doble ciego: ni los predictores ni los organizadores y evaluadores conocen las estructuras de las proteínas objetivo en el momento en que se realizan las predicciones. Los objetivos para la predicción de la estructura son estructuras que pronto se resolverán mediante cristalografía de rayos X o espectroscopia de RMN, o estructuras que acaban de resolverse (principalmente por uno de los centros de genómica estructural ) y se mantienen en espera en el Protein Data Bank . Si se descubre que la secuencia dada está relacionada por descendencia común con una secuencia de proteína de estructura conocida (llamada plantilla), se puede utilizar el modelado comparativo de proteínas para predecir la estructura terciaria . Las plantillas se pueden encontrar utilizando métodos de alineamiento de secuencias (por ejemplo, BLAST o HHsearch ) o métodos de enhebrado de proteínas , que son mejores para encontrar plantillas distantemente relacionadas. De lo contrario, se debe aplicar una predicción de la estructura de proteínas de novo (por ejemplo, Rosetta), que es mucho menos confiable pero que a veces puede producir modelos con el plegamiento correcto (generalmente, para proteínas de menos de 100-150 aminoácidos). Los plegamientos verdaderamente nuevos se están volviendo bastante raros entre los objetivos, [3] [4] lo que hace que esa categoría sea más pequeña de lo deseable.
El método principal de evaluación [5] es una comparación de las posiciones predichas del carbono α del modelo con aquellas en la estructura objetivo. La comparación se muestra visualmente mediante gráficos acumulativos de distancias entre pares de carbonos α equivalentes en la alineación del modelo y la estructura, como se muestra en la figura (un modelo perfecto permanecería en cero en todo el recorrido), y se le asigna una puntuación numérica GDT-TS (Prueba de distancia global: puntuación total) que describe el porcentaje de residuos bien modelados en el modelo con respecto al objetivo. [6] Los evaluadores también evalúan visualmente el modelado libre (sin plantilla o de novo ), ya que las puntuaciones numéricas no funcionan tan bien para encontrar semejanzas vagas en los casos más difíciles. [7] Las predicciones basadas en plantillas de alta precisión se evaluaron en CASP7 en función de si funcionaban para la fase de reemplazo molecular de la estructura cristalina objetivo [8] con éxitos seguidos más tarde, [9] y por la calidad del modelo completo (no solo el carbono α ) y la coincidencia del modelo completo con el objetivo en CASP8. [10]
La evaluación de los resultados se realiza en las siguientes categorías de predicción:
La categoría de predicción de estructura terciaria se subdividió en:
A partir de CASP7, las categorías se han redefinido para reflejar los avances en los métodos. La categoría "Modelado basado en plantillas" incluye todos los modelos comparativos anteriores, modelos basados en plegamientos homólogos y algunos modelos basados en plegamientos análogos. La categoría "modelado sin plantillas (FM)" incluye modelos de proteínas con plegamientos nunca antes vistos y modelos basados en plegamientos análogos duros. Debido a la cantidad limitada de objetivos sin plantillas (son bastante raros), en 2011 se introdujo el llamado CASP ROLL. Este experimento CASP continuo (que se realiza en forma continua) tiene como objetivo una evaluación más rigurosa de los métodos de predicción sin plantillas mediante la evaluación de una mayor cantidad de objetivos fuera de la temporada regular de predicción CASP. A diferencia de LiveBench y EVA , este experimento sigue el espíritu de predicción a ciegas de CASP, es decir, todas las predicciones se realizan sobre estructuras aún desconocidas. [11]
Los resultados de CASP se publican en suplementos especiales de la revista científica Proteins , a los que se puede acceder a través del sitio web de CASP. [12] Un artículo principal en cada uno de estos suplementos describe detalles del experimento [13] [14] mientras que un artículo de cierre evalúa el progreso en el campo. [15] [16]
En diciembre de 2018, CASP13 fue noticia cuando fue ganado por AlphaFold , un programa de inteligencia artificial creado por DeepMind . [17] En noviembre de 2020, una versión 2 mejorada de AlphaFold ganó CASP14. [18] Según uno de los cofundadores de CASP, John Moult, AlphaFold obtuvo alrededor de 90 en una escala de 100 puntos de precisión de predicción para objetivos proteicos moderadamente difíciles. [19] AlphaFold se hizo de código abierto en 2021, y en CASP15 en 2022, aunque DeepMind no participó, prácticamente todos los equipos de alto rango utilizaron AlphaFold o modificaciones de AlphaFold. [20]
Evaluaciones automatizadas para CASP15 (2022)
Evaluaciones automatizadas para CASP14 (2020)
Evaluaciones automatizadas para CASP13 (2018)
Evaluaciones automatizadas para CASP12 (2016)
Evaluaciones automatizadas para CASP11 (2014)
Evaluaciones automatizadas para CASP10 (2012)
Evaluaciones automatizadas para CASP9 (2010)
Evaluaciones automatizadas para CASP8 (2008)
Evaluaciones automatizadas para CASP7 (2006)