CASP

La Evaluación Crítica de la Predicción de la Estructura ( CASP ), a veces llamada Evaluación Crítica de la Predicción de la Estructura de las Proteínas , es un experimento comunitario y mundial para la predicción de la estructura de las proteínas que se lleva a cabo cada dos años desde 1994. ^[1]^[2] La CASP ofrece a los grupos de investigación la oportunidad de probar objetivamente sus métodos de predicción de la estructura y ofrece una evaluación independiente del estado del arte en el modelado de la estructura de las proteínas a la comunidad de investigación y a los usuarios de software. Aunque el objetivo principal de la CASP es ayudar a avanzar en los métodos de identificación de la estructura tridimensional de las proteínas a partir de su secuencia de aminoácidos, muchos ven el experimento más como un "campeonato mundial" en este campo de la ciencia. Más de 100 grupos de investigación de todo el mundo participan en la CASP de forma regular y no es raro que grupos enteros suspendan sus otras investigaciones durante meses mientras se concentran en preparar sus servidores para el experimento y en realizar las predicciones detalladas.

Selección de proteínas diana

Para garantizar que ningún predictor pueda tener información previa sobre la estructura de una proteína que lo pondría en ventaja, es importante que el experimento se realice de manera doble ciego: ni los predictores ni los organizadores y evaluadores conocen las estructuras de las proteínas objetivo en el momento en que se realizan las predicciones. Los objetivos para la predicción de la estructura son estructuras que pronto se resolverán mediante cristalografía de rayos X o espectroscopia de RMN, o estructuras que acaban de resolverse (principalmente por uno de los centros de genómica estructural ) y se mantienen en espera en el Protein Data Bank . Si se descubre que la secuencia dada está relacionada por descendencia común con una secuencia de proteína de estructura conocida (llamada plantilla), se puede utilizar el modelado comparativo de proteínas para predecir la estructura terciaria . Las plantillas se pueden encontrar utilizando métodos de alineamiento de secuencias (por ejemplo, BLAST o HHsearch ) o métodos de enhebrado de proteínas , que son mejores para encontrar plantillas distantemente relacionadas. De lo contrario, se debe aplicar una predicción de la estructura de proteínas de novo^{(por ejemplo, Rosetta), que es mucho menos confiable pero que a veces puede producir modelos con el plegamiento correcto (generalmente, para proteínas de menos de 100-150 aminoácidos). Los plegamientos verdaderamente nuevos se están volviendo bastante raros entre los objetivos, [3]}^[4] lo que hace que esa categoría sea más pequeña de lo deseable.

Evaluación

El método principal de evaluación ^[5] es una comparación de las posiciones predichas del carbono α del modelo con aquellas en la estructura objetivo. La comparación se muestra visualmente mediante gráficos acumulativos de distancias entre pares de carbonos α equivalentes en la alineación del modelo y la estructura, como se muestra en la figura (un modelo perfecto permanecería en cero en todo el recorrido), y se le asigna una puntuación numérica GDT-TS (Prueba de distancia global: puntuación total) que describe el porcentaje de residuos bien modelados en el modelo con respecto al objetivo. ^[6] Los evaluadores también evalúan visualmente el modelado libre (sin plantilla o de novo ), ya que las puntuaciones numéricas no funcionan tan bien para encontrar semejanzas vagas en los casos más difíciles. ^[7] Las predicciones basadas en plantillas de alta precisión se evaluaron en CASP7 en función de si funcionaban para la fase de reemplazo molecular de la estructura cristalina objetivo ^[8] con éxitos seguidos más tarde, ^[9] y por la calidad del modelo completo (no solo el carbono α ) y la coincidencia del modelo completo con el objetivo en CASP8. ^[10]

La evaluación de los resultados se realiza en las siguientes categorías de predicción:

Predicción de la estructura terciaria (todos los CASP)
Predicción de estructura secundaria (eliminada después de CASP5)
Predicción de complejos estructurales (sólo CASP2; un experimento independiente, CAPRI , continúa con este tema)
Predicción del contacto residuo-residuo (iniciando CASP4)
Predicción de regiones desordenadas (iniciando CASP5)
Predicción de límites de dominio (CASP6–CASP8)
predicción de funciones (a partir de CASP6)
Evaluación de la calidad del modelo (a partir de CASP7)
Refinamiento del modelo (iniciando CASP7)
Predicción basada en plantillas de alta precisión (a partir de CASP7)

La categoría de predicción de estructura terciaria se subdividió en:

modelado de homología
Reconocimiento de pliegues (también llamado enhebrado de proteínas ; tenga en cuenta que este nombre es incorrecto ya que el enhebrado es un método)
predicción de estructura de novo , ahora denominada 'New Fold' ya que muchos métodos aplican funciones de evaluación o puntuación que están sesgadas por el conocimiento de las estructuras de proteínas nativas, como una red neuronal artificial .

A partir de CASP7, las categorías se han redefinido para reflejar los avances en los métodos. La categoría "Modelado basado en plantillas" incluye todos los modelos comparativos anteriores, modelos basados en plegamientos homólogos y algunos modelos basados en plegamientos análogos. La categoría "modelado sin plantillas (FM)" incluye modelos de proteínas con plegamientos nunca antes vistos y modelos basados en plegamientos análogos duros. Debido a la cantidad limitada de objetivos sin plantillas (son bastante raros), en 2011 se introdujo el llamado CASP ROLL. Este experimento CASP continuo (que se realiza en forma continua) tiene como objetivo una evaluación más rigurosa de los métodos de predicción sin plantillas mediante la evaluación de una mayor cantidad de objetivos fuera de la temporada regular de predicción CASP. A diferencia de LiveBench y EVA , este experimento sigue el espíritu de predicción a ciegas de CASP, es decir, todas las predicciones se realizan sobre estructuras aún desconocidas. ^[11]

Los resultados de CASP se publican en suplementos especiales de la revista científica Proteins , a los que se puede acceder a través del sitio web de CASP. ^[12] Un artículo principal en cada uno de estos suplementos describe detalles del experimento ^[13]^[14] mientras que un artículo de cierre evalúa el progreso en el campo. ^[15]^[16]

Pliegue alfa

En diciembre de 2018, CASP13 fue noticia cuando fue ganado por AlphaFold , un programa de inteligencia artificial creado por DeepMind . ^[17] En noviembre de 2020, una versión 2 mejorada de AlphaFold ganó CASP14. ^[18] Según uno de los cofundadores de CASP, John Moult, AlphaFold obtuvo alrededor de 90 en una escala de 100 puntos de precisión de predicción para objetivos proteicos moderadamente difíciles. ^[19] AlphaFold se hizo de código abierto en 2021, y en CASP15 en 2022, aunque DeepMind no participó, prácticamente todos los equipos de alto rango utilizaron AlphaFold o modificaciones de AlphaFold. ^[20]

Véase también

Referencias

^ "Inicio - CASP15". predictioncenter.org . Consultado el 14 de diciembre de 2022 .
^ Moult J, Pedersen JT, Judson R, Fidelis K (noviembre de 1995). "Un experimento a gran escala para evaluar los métodos de predicción de la estructura de las proteínas". Proteins . 23 (3): ii–v. doi :10.1002/prot.340230303. PMID 8710822. S2CID 11216440.
^ Tress ML, Ezkurdia I, Richardson JS (2009). "Definición y clasificación del dominio diana en CASP8". Proteins . 77 Suppl 9 (Suppl 9): 10–7. doi :10.1002/prot.22497. PMC 2805415 . PMID 19603487.
^ Zhang Y, Skolnick J (enero de 2005). "El problema de predicción de la estructura de las proteínas podría resolverse utilizando la biblioteca PDB actual". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (4): 1029–34. Bibcode :2005PNAS..102.1029Z. doi : 10.1073/pnas.0407152101 . PMC 545829 . PMID 15653774.
^ Cozzetto D, Kryshtafovych A, Fidelis K, Moult J, Rost B, Tramontano A (2009). "Evaluación de modelos basados en plantillas en CASP8 con medidas estándar". Proteins . 77 Suppl 9 (Suppl 9): 18–28. doi :10.1002/prot.22561. PMC 4589151 . PMID 19731382.
^ Zemla A (julio de 2003). "LGA: Un método para encontrar similitudes 3D en estructuras proteínicas". Nucleic Acids Research . 31 (13): 3370–4. doi :10.1093/nar/gkg571. PMC 168977 . PMID 12824330.
^ Ben-David M, Noivirt-Brik O, Paz A, Prilusky J, Sussman JL, Levy Y (2009). "Evaluación de las predicciones de la estructura de CASP8 para objetivos libres de plantilla". Proteins . 77 Suppl 9 (Suppl 9): 50–65. doi :10.1002/prot.22591. PMID 19774550. S2CID 16517118.
^ Read RJ, Chavali G (2007). "Evaluación de las predicciones de CASP7 en la categoría de modelado basado en plantillas de alta precisión". Proteins . 69 Suppl 8 (Suppl 8): 27–37. doi : 10.1002/prot.21662 . PMID 17894351. S2CID 33172629.
^ Qian B, Raman S, Das R, Bradley P, McCoy AJ, Read RJ, Baker D (noviembre de 2007). "Predicción de la estructura en alta resolución y el problema de la fase cristalográfica". Nature . 450 (7167): 259–64. Bibcode :2007Natur.450..259Q. doi :10.1038/nature06249. PMC 2504711 . PMID 17934447.
^ Keedy DA, Williams CJ, Headd JJ, Arendall WB, Chen VB, Kapral GJ, et al. (2009). "El otro 90% de la proteína: evaluación más allá de Calphas para modelos CASP8 basados en plantillas y de alta precisión". Proteins . 77 Suppl 9 (Suppl 9): 29–49. doi :10.1002/prot.22551. PMC 2877634 . PMID 19731372.
^ Kryshtafovych A, Monastyrskyy B, Fidelis K (febrero de 2014). "Infraestructura del centro de predicción CASP y medidas de evaluación en CASP10 y CASP ROLL". Proteins . 82 Suppl 2 (2): 7–13. doi :10.1002/prot.24399. PMC 4396618 . PMID 24038551.
^ "Actas del CASP".
^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Hubbard T, Tramontano A (2007). "Evaluación crítica de los métodos de predicción de la estructura de proteínas - Ronda VII". Proteins . 69 Suppl 8 (Suppl 8): 3–9. doi :10.1002/prot.21767. PMC 2653632 . PMID 17918729.
^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A (2009). "Evaluación crítica de los métodos de predicción de la estructura de proteínas - Ronda VIII". Proteins . 77 Suppl 9 (Suppl 9): 1–4. doi : 10.1002/prot.22589 . PMID 19774620. S2CID 9704851.
^ Kryshtafovych A, Fidelis K, Moult J (2007). "Progreso de CASP6 a CASP7". Proteins . 69 Suppl 8 (Suppl 8): 194–207. doi : 10.1002/prot.21769 . PMID 17918728. S2CID 40200832.
^ Kryshtafovych A, Fidelis K, Moult J (2009). "Resultados de CASP8 en el contexto de experimentos previos". Proteins . 77 Suppl 9 (Suppl 9): 217–28. doi :10.1002/prot.22562. PMC 5479686 . PMID 19722266.
^ Sample, Ian (2 de diciembre de 2018). «DeepMind de Google predice formas 3D de proteínas». The Guardian . Consultado el 19 de julio de 2019 .
^ "La inteligencia artificial de DeepMind que plega proteínas ha resuelto un gran desafío de la biología que existía hace 50 años". MIT Technology Review . Consultado el 30 de noviembre de 2020 .
^ Callaway, Ewen (2020). «'Cambiará todo': la IA de DeepMind da un salto gigantesco en la resolución de estructuras proteínicas». Nature . 588 (7837): 203–204. doi :10.1038/d41586-020-03348-4. PMID 33257889. S2CID 227243204.
^ Schreiner, Maximilian (14 de diciembre de 2022). "CASP15: el éxito de AlphaFold impulsa nuevos desafíos en la predicción de la estructura de las proteínas". The Decoder . Consultado el 13 de febrero de 2023 .

Enlaces externos

Sitio web oficial
ROLLO DE CASP
Foro de FORCASP

Clasificación de resultados

Evaluaciones automatizadas para CASP15 (2022)

Clasificación oficial solo para servidores
Clasificación oficial para humanos y servidores

Evaluaciones automatizadas para CASP14 (2020)

Clasificación oficial solo para servidores
Clasificación oficial para humanos y servidores
Clasificación según Zhang Lab

Evaluaciones automatizadas para CASP13 (2018)

Clasificación oficial solo para servidores
Clasificación oficial para humanos y servidores
Clasificación según Zhang Lab

Evaluaciones automatizadas para CASP12 (2016)

Clasificación oficial solo para servidores
Clasificación oficial para humanos y servidores
Clasificación según Zhang Lab

Evaluaciones automatizadas para CASP11 (2014)

Clasificación oficial solo para servidores (126 objetivos)
Clasificación oficial para humanos y servidores (78 objetivos)
Clasificación según Zhang Lab

Evaluaciones automatizadas para CASP10 (2012)

Clasificación oficial solo para servidores (127 objetivos)
Clasificación oficial para humanos y servidores (71 objetivos)
Clasificación según Zhang Lab

Evaluaciones automatizadas para CASP9 (2010)

Clasificación oficial solo para servidores (147 objetivos)
Clasificación oficial para humanos y servidores (78 objetivos)
Clasificación de Grishin Lab (solo para servidores)
Clasificación de Grishin Lab (para humanos y servidores)
Clasificación según Zhang Lab
Clasificación de Cheng Lab

Evaluaciones automatizadas para CASP8 (2008)

Clasificación oficial solo para servidores
Clasificación oficial para humanos y servidores
Clasificación según Zhang Lab
Clasificación de Grishin Lab
Clasificación del laboratorio McGuffin
Clasificación de Cheng Lab

Evaluaciones automatizadas para CASP7 (2006)

Clasificación por Livebench
Clasificación según Zhang Lab