stringtranslate.com

CASP

Una estructura de destino (cintas) y 354 predicciones basadas en plantillas superpuestas (columnas vertebrales Calpha grises); de CASP8

La Evaluación Crítica de la Predicción de la Estructura ( CASP ), a veces llamada Evaluación Crítica de la Predicción de la Estructura de las Proteínas , es un experimento comunitario y mundial para la predicción de la estructura de las proteínas que se lleva a cabo cada dos años desde 1994. [1] [2] La CASP ofrece a los grupos de investigación la oportunidad de probar objetivamente sus métodos de predicción de la estructura y ofrece una evaluación independiente del estado del arte en el modelado de la estructura de las proteínas a la comunidad de investigación y a los usuarios de software. Aunque el objetivo principal de la CASP es ayudar a avanzar en los métodos de identificación de la estructura tridimensional de las proteínas a partir de su secuencia de aminoácidos, muchos ven el experimento más como un "campeonato mundial" en este campo de la ciencia. Más de 100 grupos de investigación de todo el mundo participan en la CASP de forma regular y no es raro que grupos enteros suspendan sus otras investigaciones durante meses mientras se concentran en preparar sus servidores para el experimento y en realizar las predicciones detalladas.

Selección de proteínas diana

Para garantizar que ningún predictor pueda tener información previa sobre la estructura de una proteína que lo pondría en ventaja, es importante que el experimento se realice de manera doble ciego: ni los predictores ni los organizadores y evaluadores conocen las estructuras de las proteínas objetivo en el momento en que se realizan las predicciones. Los objetivos para la predicción de la estructura son estructuras que pronto se resolverán mediante cristalografía de rayos X o espectroscopia de RMN, o estructuras que acaban de resolverse (principalmente por uno de los centros de genómica estructural ) y se mantienen en espera en el Protein Data Bank . Si se descubre que la secuencia dada está relacionada por descendencia común con una secuencia de proteína de estructura conocida (llamada plantilla), se puede utilizar el modelado comparativo de proteínas para predecir la estructura terciaria . Las plantillas se pueden encontrar utilizando métodos de alineamiento de secuencias (por ejemplo, BLAST o HHsearch ) o métodos de enhebrado de proteínas , que son mejores para encontrar plantillas distantemente relacionadas. De lo contrario, se debe aplicar una predicción de la estructura de proteínas de novo (por ejemplo, Rosetta), que es mucho menos confiable pero que a veces puede producir modelos con el plegamiento correcto (generalmente, para proteínas de menos de 100-150 aminoácidos). Los plegamientos verdaderamente nuevos se están volviendo bastante raros entre los objetivos, [3] [4] lo que hace que esa categoría sea más pequeña de lo deseable.

Evaluación

El método principal de evaluación [5] es una comparación de las posiciones predichas del carbono α del modelo con aquellas en la estructura objetivo. La comparación se muestra visualmente mediante gráficos acumulativos de distancias entre pares de carbonos α equivalentes en la alineación del modelo y la estructura, como se muestra en la figura (un modelo perfecto permanecería en cero en todo el recorrido), y se le asigna una puntuación numérica GDT-TS (Prueba de distancia global: puntuación total) que describe el porcentaje de residuos bien modelados en el modelo con respecto al objetivo. [6] Los evaluadores también evalúan visualmente el modelado libre (sin plantilla o de novo ), ya que las puntuaciones numéricas no funcionan tan bien para encontrar semejanzas vagas en los casos más difíciles. [7] Las predicciones basadas en plantillas de alta precisión se evaluaron en CASP7 en función de si funcionaban para la fase de reemplazo molecular de la estructura cristalina objetivo [8] con éxitos seguidos más tarde, [9] y por la calidad del modelo completo (no solo el carbono α ) y la coincidencia del modelo completo con el objetivo en CASP8. [10]

La evaluación de los resultados se realiza en las siguientes categorías de predicción:

La categoría de predicción de estructura terciaria se subdividió en:

A partir de CASP7, las categorías se han redefinido para reflejar los avances en los métodos. La categoría "Modelado basado en plantillas" incluye todos los modelos comparativos anteriores, modelos basados ​​en plegamientos homólogos y algunos modelos basados ​​en plegamientos análogos. La categoría "modelado sin plantillas (FM)" incluye modelos de proteínas con plegamientos nunca antes vistos y modelos basados ​​en plegamientos análogos duros. Debido a la cantidad limitada de objetivos sin plantillas (son bastante raros), en 2011 se introdujo el llamado CASP ROLL. Este experimento CASP continuo (que se realiza en forma continua) tiene como objetivo una evaluación más rigurosa de los métodos de predicción sin plantillas mediante la evaluación de una mayor cantidad de objetivos fuera de la temporada regular de predicción CASP. A diferencia de LiveBench y EVA , este experimento sigue el espíritu de predicción a ciegas de CASP, es decir, todas las predicciones se realizan sobre estructuras aún desconocidas. [11]

Los resultados de CASP se publican en suplementos especiales de la revista científica Proteins , a los que se puede acceder a través del sitio web de CASP. [12] Un artículo principal en cada uno de estos suplementos describe detalles del experimento [13] [14] mientras que un artículo de cierre evalúa el progreso en el campo. [15] [16]

Pliegue alfa

En diciembre de 2018, CASP13 fue noticia cuando fue ganado por AlphaFold , un programa de inteligencia artificial creado por DeepMind . [17] En noviembre de 2020, una versión 2 mejorada de AlphaFold ganó CASP14. [18] Según uno de los cofundadores de CASP, John Moult, AlphaFold obtuvo alrededor de 90 en una escala de 100 puntos de precisión de predicción para objetivos proteicos moderadamente difíciles. [19] AlphaFold se hizo de código abierto en 2021, y en CASP15 en 2022, aunque DeepMind no participó, prácticamente todos los equipos de alto rango utilizaron AlphaFold o modificaciones de AlphaFold. [20]

Véase también

Referencias

  1. ^ "Inicio - CASP15". predictioncenter.org . Consultado el 14 de diciembre de 2022 .
  2. ^ Moult J, Pedersen JT, Judson R, Fidelis K (noviembre de 1995). "Un experimento a gran escala para evaluar los métodos de predicción de la estructura de las proteínas". Proteins . 23 (3): ii–v. doi :10.1002/prot.340230303. PMID  8710822. S2CID  11216440.
  3. ^ Tress ML, Ezkurdia I, Richardson JS (2009). "Definición y clasificación del dominio diana en CASP8". Proteins . 77 Suppl 9 (Suppl 9): 10–7. doi :10.1002/prot.22497. PMC 2805415 . PMID  19603487. 
  4. ^ Zhang Y, Skolnick J (enero de 2005). "El problema de predicción de la estructura de las proteínas podría resolverse utilizando la biblioteca PDB actual". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (4): 1029–34. Bibcode :2005PNAS..102.1029Z. doi : 10.1073/pnas.0407152101 . PMC 545829 . PMID  15653774. 
  5. ^ Cozzetto D, Kryshtafovych A, Fidelis K, Moult J, Rost B, Tramontano A (2009). "Evaluación de modelos basados ​​en plantillas en CASP8 con medidas estándar". Proteins . 77 Suppl 9 (Suppl 9): 18–28. doi :10.1002/prot.22561. PMC 4589151 . PMID  19731382. 
  6. ^ Zemla A (julio de 2003). "LGA: Un método para encontrar similitudes 3D en estructuras proteínicas". Nucleic Acids Research . 31 (13): 3370–4. doi :10.1093/nar/gkg571. PMC 168977 . PMID  12824330. 
  7. ^ Ben-David M, Noivirt-Brik O, Paz A, Prilusky J, Sussman JL, Levy Y (2009). "Evaluación de las predicciones de la estructura de CASP8 para objetivos libres de plantilla". Proteins . 77 Suppl 9 (Suppl 9): 50–65. doi :10.1002/prot.22591. PMID  19774550. S2CID  16517118.
  8. ^ Read RJ, Chavali G (2007). "Evaluación de las predicciones de CASP7 en la categoría de modelado basado en plantillas de alta precisión". Proteins . 69 Suppl 8 (Suppl 8): 27–37. doi : 10.1002/prot.21662 . PMID  17894351. S2CID  33172629.
  9. ^ Qian B, Raman S, Das R, Bradley P, McCoy AJ, Read RJ, Baker D (noviembre de 2007). "Predicción de la estructura en alta resolución y el problema de la fase cristalográfica". Nature . 450 (7167): 259–64. Bibcode :2007Natur.450..259Q. doi :10.1038/nature06249. PMC 2504711 . PMID  17934447. 
  10. ^ Keedy DA, Williams CJ, Headd JJ, Arendall WB, Chen VB, Kapral GJ, et al. (2009). "El otro 90% de la proteína: evaluación más allá de Calphas para modelos CASP8 basados ​​en plantillas y de alta precisión". Proteins . 77 Suppl 9 (Suppl 9): 29–49. doi :10.1002/prot.22551. PMC 2877634 . PMID  19731372. 
  11. ^ Kryshtafovych A, Monastyrskyy B, Fidelis K (febrero de 2014). "Infraestructura del centro de predicción CASP y medidas de evaluación en CASP10 y CASP ROLL". Proteins . 82 Suppl 2 (2): 7–13. doi :10.1002/prot.24399. PMC 4396618 . PMID  24038551. 
  12. ^ "Actas del CASP".
  13. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Hubbard T, Tramontano A (2007). "Evaluación crítica de los métodos de predicción de la estructura de proteínas - Ronda VII". Proteins . 69 Suppl 8 (Suppl 8): 3–9. doi :10.1002/prot.21767. PMC 2653632 . PMID  17918729. 
  14. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A (2009). "Evaluación crítica de los métodos de predicción de la estructura de proteínas - Ronda VIII". Proteins . 77 Suppl 9 (Suppl 9): 1–4. doi : 10.1002/prot.22589 . PMID  19774620. S2CID  9704851.
  15. ^ Kryshtafovych A, Fidelis K, Moult J (2007). "Progreso de CASP6 a CASP7". Proteins . 69 Suppl 8 (Suppl 8): 194–207. doi : 10.1002/prot.21769 . PMID  17918728. S2CID  40200832.
  16. ^ Kryshtafovych A, Fidelis K, Moult J (2009). "Resultados de CASP8 en el contexto de experimentos previos". Proteins . 77 Suppl 9 (Suppl 9): 217–28. doi :10.1002/prot.22562. PMC 5479686 . PMID  19722266. 
  17. ^ Sample, Ian (2 de diciembre de 2018). «DeepMind de Google predice formas 3D de proteínas». The Guardian . Consultado el 19 de julio de 2019 .
  18. ^ "La inteligencia artificial de DeepMind que plega proteínas ha resuelto un gran desafío de la biología que existía hace 50 años". MIT Technology Review . Consultado el 30 de noviembre de 2020 .
  19. ^ Callaway, Ewen (2020). «'Cambiará todo': la IA de DeepMind da un salto gigantesco en la resolución de estructuras proteínicas». Nature . 588 (7837): 203–204. doi :10.1038/d41586-020-03348-4. PMID  33257889. S2CID  227243204.
  20. ^ Schreiner, Maximilian (14 de diciembre de 2022). "CASP15: el éxito de AlphaFold impulsa nuevos desafíos en la predicción de la estructura de las proteínas". The Decoder . Consultado el 13 de febrero de 2023 .

Enlaces externos

Clasificación de resultados

Evaluaciones automatizadas para CASP15 (2022)

Evaluaciones automatizadas para CASP14 (2020)

Evaluaciones automatizadas para CASP13 (2018)

Evaluaciones automatizadas para CASP12 (2016)

Evaluaciones automatizadas para CASP11 (2014)

Evaluaciones automatizadas para CASP10 (2012)

Evaluaciones automatizadas para CASP9 (2010)

Evaluaciones automatizadas para CASP8 (2008)

Evaluaciones automatizadas para CASP7 (2006)