stringtranslate.com

Pliegue alfa

AlphaFold es un programa de inteligencia artificial (IA) desarrollado por DeepMind , una subsidiaria de Alphabet , que realiza predicciones de la estructura de las proteínas . [1] El programa está diseñado como un sistema de aprendizaje profundo . [2]

El software AlphaFold ha tenido tres versiones principales. Un equipo de investigadores que utilizó AlphaFold 1 (2018) obtuvo el primer puesto en la clasificación general de la 13.ª Evaluación crítica de la predicción de la estructura (CASP) en diciembre de 2018. El programa tuvo un éxito especial en la predicción de la estructura más precisa para los objetivos calificados como los más difíciles por los organizadores de la competición, en los que no había estructuras de plantilla disponibles a partir de proteínas con una secuencia parcialmente similar. Un equipo que utilizó AlphaFold 2 (2020) repitió la posición en la competición CASP14 en noviembre de 2020. [3] El equipo logró un nivel de precisión mucho mayor que cualquier otro grupo. [2] [4] Obtuvo una puntuación superior a 90 para alrededor de dos tercios de las proteínas en la prueba de distancia global (GDT) de CASP, una prueba que mide el grado en que la estructura predicha por un programa computacional es similar a la estructura determinada por el experimento de laboratorio, siendo 100 una coincidencia completa, dentro del límite de distancia utilizado para calcular la GDT. [2] [5]

Los resultados de AlphaFold 2 en CASP14 fueron descritos como "asombrosos" [6] y "transformacionales". [7] Algunos investigadores señalaron que la precisión no es lo suficientemente alta para un tercio de sus predicciones, y que no revela el mecanismo o las reglas del plegamiento de proteínas para que el problema del plegamiento de proteínas se considere resuelto. [8] [9] Sin embargo, ha habido un respeto generalizado por el logro técnico. El 15 de julio de 2021, el artículo de AlphaFold 2 se publicó en Nature como una publicación de acceso anticipado junto con un software de código abierto y una base de datos de proteomas de especies con capacidad de búsqueda . [10] [11] [12] Desde entonces, el artículo ha sido citado más de 27 mil veces.

AlphaFold 3 se anunció el 8 de mayo de 2024. Puede predecir la estructura de complejos creados por proteínas con ADN , ARN , varios ligandos e iones . [13]

Demis Hassabis y John Jumper, del equipo que desarrolló AlphaFold, ganaron el Premio Nobel de Química en 2024 por su trabajo sobre la “predicción de la estructura de las proteínas”. Ambos habían ganado el Premio Breakthrough en Ciencias de la Vida y el Premio Albert Lasker de Investigación Médica Básica a principios de 2023. [14] [15]

Fondo

tres cadenas polipeptídicas individuales en diferentes niveles de plegamiento y un grupo de cadenas
Las cadenas de aminoácidos, conocidas como polipéptidos , se pliegan para formar una proteína.

Las proteínas están formadas por cadenas de aminoácidos que se pliegan espontáneamente para formar las estructuras tridimensionales (3-D) de las proteínas. La estructura tridimensional es fundamental para comprender la función biológica de la proteína.

Las estructuras de las proteínas se pueden determinar experimentalmente a través de técnicas como la cristalografía de rayos X , la criomicroscopía electrónica y la resonancia magnética nuclear , que son todas costosas y consumen mucho tiempo. [16] Estos esfuerzos, utilizando métodos experimentales, han identificado las estructuras de alrededor de 170.000 proteínas en los últimos 60 años, mientras que hay más de 200 millones de proteínas conocidas en todas las formas de vida. [5]

A lo largo de los años, los investigadores han aplicado numerosos métodos computacionales para predecir las estructuras 3D de las proteínas a partir de sus secuencias de aminoácidos; la precisión de dichos métodos en el mejor escenario posible se acerca a las técnicas experimentales (RMN) mediante el uso de modelos de homología basados ​​en la evolución molecular. CASP , que se lanzó en 1994 para desafiar a la comunidad científica a producir sus mejores predicciones de la estructura de las proteínas, descubrió que se pueden lograr puntajes GDT de solo alrededor de 40 de 100 para las proteínas más difíciles en 2016. [5] AlphaFold comenzó a competir en el CASP 2018 utilizando una técnica de aprendizaje profundo de inteligencia artificial (IA) . [16]

Algoritmo

Se sabe que DeepMind entrenó el programa con más de 170.000 proteínas del Protein Data Bank , un repositorio público de secuencias y estructuras de proteínas. El programa utiliza una forma de red de atención , una técnica de aprendizaje profundo que se centra en que la IA identifique partes de un problema más grande y luego las una para obtener la solución general. [2] El entrenamiento general se realizó con una potencia de procesamiento de entre 100 y 200 GPU . [2]

AlphaFold 1 (2018)

AlphaFold 1 (2018) se basó en el trabajo desarrollado por varios equipos en la década de 2010, un trabajo que analizó los grandes bancos de datos de secuencias de ADN relacionadas que ahora están disponibles de muchos organismos diferentes (la mayoría sin estructuras 3D conocidas), para tratar de encontrar cambios en diferentes residuos que parecían estar correlacionados, aunque los residuos no fueran consecutivos en la cadena principal. Tales correlaciones sugieren que los residuos pueden estar cerca uno del otro físicamente, aunque no estén cerca en la secuencia, lo que permite estimar un mapa de contacto . Basándose en trabajos recientes anteriores a 2018, AlphaFold 1 amplió esto para estimar una distribución de probabilidad de cuán cerca podrían estar los residuos, convirtiendo el mapa de contacto en un mapa de distancia probable. También utilizó métodos de aprendizaje más avanzados que antes para desarrollar la inferencia. [17] [18]

AlphaFold 2 (2020)

Rendimiento, experimentos y arquitectura de AlphaFold 2 [19]
Detalles arquitectónicos de AlphaFold 2 [19]

La versión 2020 del programa ( AlphaFold 2 , 2020) es significativamente diferente de la versión original que ganó el CASP 13 en 2018, según el equipo de DeepMind. [20] [21]

El diseño del software utilizado en AlphaFold 1 contenía una serie de módulos, cada uno entrenado por separado, que se utilizaban para producir el potencial guía que luego se combinaba con el potencial energético basado en la física. AlphaFold 2 lo reemplazó con un sistema de subredes acopladas entre sí en un único modelo diferenciable de extremo a extremo, basado completamente en el reconocimiento de patrones, que se entrenó de manera integrada como una única estructura integrada. [21] [22] La física local, en forma de refinamiento energético basado en el modelo AMBER , se aplica solo como un paso de refinamiento final una vez que la predicción de la red neuronal ha convergido, y solo ajusta ligeramente la estructura predicha. [23]

Una parte clave del sistema 2020 son dos módulos, que se cree que se basan en un diseño de transformador , que se utilizan para refinar progresivamente un vector de información para cada relación (o " borde " en la terminología de la teoría de grafos) entre un residuo de aminoácido de la proteína y otro residuo de aminoácido (estas relaciones están representadas por la matriz que se muestra en verde); y entre cada posición de aminoácido y cada secuencia diferente en la alineación de secuencia de entrada (estas relaciones están representadas por la matriz que se muestra en rojo). [22] Internamente, estas transformaciones de refinamiento contienen capas que tienen el efecto de reunir datos relevantes y filtrar datos irrelevantes (el "mecanismo de atención") para estas relaciones, de una manera dependiente del contexto, aprendida a partir de los datos de entrenamiento. Estas transformaciones se iteran, la información actualizada de salida de un paso se convierte en la entrada del siguiente, con la información de residuo/residuo afinada alimentando la actualización de la información de residuo/secuencia, y luego la información de residuo/secuencia mejorada alimentando la actualización de la información de residuo/residuo. [22] Según un informe, a medida que avanza la iteración, el "algoritmo de atención... imita la forma en que una persona podría armar un rompecabezas: primero conectando piezas en pequeños grupos (en este caso, grupos de aminoácidos) y luego buscando formas de unir los grupos en un todo más grande". [5] [ necesita actualización ]

El resultado de estas iteraciones informa al módulo de predicción de estructura final [22] , que también utiliza transformadores [24] y luego se itera. En un ejemplo presentado por DeepMind, el módulo de predicción de estructura logró una topología correcta para la proteína objetivo en su primera iteración, puntuada con un GDT_TS de 78, pero con una gran cantidad (90 %) de violaciones estereoquímicas, es decir, ángulos o longitudes de enlace no físicos. Con iteraciones posteriores, la cantidad de violaciones estereoquímicas disminuyó. En la tercera iteración, el GDT_TS de la predicción se acercaba a 90, y en la octava iteración, la cantidad de violaciones estereoquímicas se acercaba a cero. [25]

Los datos de entrenamiento se limitaban originalmente a cadenas de péptidos individuales. Sin embargo, la actualización de octubre de 2021, denominada AlphaFold-Multimer, incluyó complejos proteicos en sus datos de entrenamiento. DeepMind afirmó que esta actualización logró predecir con precisión las interacciones proteína-proteína aproximadamente el 70 % de las veces. [26]

AlphaFold 3 (2024)

Anunciado el 8 de mayo de 2024, AlphaFold 3 fue desarrollado conjuntamente por Google DeepMind e Isomorphic Labs , ambas subsidiarias de Alphabet . AlphaFold 3 no se limita a las proteínas de cadena única, ya que también puede predecir las estructuras de complejos proteicos con ADN , ARN , modificaciones postraduccionales y ligandos e iones seleccionados . [27] [13]

AlphaFold 3 introduce el "Pairformer", una arquitectura de aprendizaje profundo inspirada en el transformador, considerada similar pero más simple que el Evoformer introducido con AlphaFold 2. [28] [29] Las predicciones sin procesar del módulo Pairformer se pasan a un modelo de difusión , que comienza con una nube de átomos y utiliza estas predicciones para progresar iterativamente hacia una representación 3D de la estructura molecular. [13]

El servidor AlphaFold se creó para proporcionar acceso gratuito a AlphaFold 3 para investigaciones no comerciales. [30]

Competiciones

Resultados obtenidos para la predicción de proteínas por las mejores reconstrucciones en la competición CASP 2018 (círculos pequeños) y la competición CASP 2020 (círculos grandes), en comparación con los resultados obtenidos en años anteriores.
La línea de tendencia carmesí muestra cómo un puñado de modelos, incluido AlphaFold 1, logró un cambio significativo en 2018 con respecto a la tasa de progreso que se había logrado anteriormente, particularmente con respecto a las secuencias de proteínas consideradas las más difíciles de predecir.
(Se había logrado una mejora cualitativa en años anteriores, pero es solo cuando los cambios llevan las estructuras a 8 Å de sus posiciones experimentales que comienzan a afectar la medida CASP GDS-TS).
La línea de tendencia naranja muestra que, en 2020, los servidores de predicción en línea habían podido aprender de este rendimiento e igualarlo, mientras que los mejores otros grupos (curva verde) habían podido, en promedio, realizar algunas mejoras en él. Sin embargo, la curva de tendencia negra muestra hasta qué punto AlphaFold 2 había superado esto nuevamente en 2020, en todos los ámbitos.
La distribución detallada de los puntos de datos indica el grado de consistencia o variación alcanzado por AlphaFold. Los valores atípicos representan el puñado de secuencias para las que no se logró una predicción tan acertada.

CASP13

En diciembre de 2018, AlphaFold de DeepMind se ubicó en el primer lugar de la clasificación general de la 13.ª Evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP). [31] [32]

El programa fue particularmente exitoso en predecir la estructura más precisa para los objetivos calificados como los más difíciles por los organizadores de la competencia, donde no había estructuras de plantilla disponibles de proteínas con una secuencia parcialmente similar. AlphaFold dio la mejor predicción para 25 de los 43 objetivos proteicos en esta clase, [32] [33] [34] logrando una puntuación media de 58,9 en la prueba de distancia global (GDT) de CASP , por delante de 52,5 y 52,4 de los dos siguientes equipos mejor ubicados, [35] que también estaban usando aprendizaje profundo para estimar las distancias de contacto. [36] [37] En general, en todos los objetivos, el programa logró una puntuación GDT de 68,5. [38]

En enero de 2020, las implementaciones y el código ilustrativo de AlphaFold 1 se publicaron en código abierto en GitHub . [39] [16] pero, como se indica en el archivo "Read Me" de ese sitio web: "Este código no se puede utilizar para predecir la estructura de una secuencia de proteína arbitraria. Se puede utilizar para predecir la estructura solo en el conjunto de datos CASP13 (enlaces a continuación). El código de generación de características está estrechamente acoplado a nuestra infraestructura interna, así como a herramientas externas, por lo que no podemos publicarlo en código abierto". Por lo tanto, en esencia, el código depositado no es adecuado para uso general, sino solo para las proteínas CASP13. La empresa no ha anunciado planes para hacer que su código esté disponible públicamente a partir del 5 de marzo de 2021.

CASP14

En noviembre de 2020, la nueva versión de DeepMind, AlphaFold 2, ganó la prueba CASP14. [40] [41] En general, AlphaFold 2 hizo la mejor predicción para 88 de los 97 objetivos. [6]

En la medida de precisión de la prueba de distancia global (GDT) preferida de la competencia, el programa logró una puntuación media de 92,4 (sobre 100), lo que significa que más de la mitad de sus predicciones obtuvieron una puntuación mejor del 92,4% por tener sus átomos en más o menos el lugar correcto, [42] [43] un nivel de precisión que se informa que es comparable a técnicas experimentales como la cristalografía de rayos X. [20] [7] [38] En 2018, AlphaFold 1 solo había alcanzado este nivel de precisión en dos de todas sus predicciones. [6] El 88% de las predicciones en la competencia de 2020 tuvieron una puntuación GDT_TS de más de 80. En el grupo de objetivos clasificados como los más difíciles, AlphaFold 2 logró una puntuación media de 87.

Medido por la desviación cuadrática media (RMS-D) de la colocación de los átomos de carbono alfa de la cadena principal de la proteína, que tiende a estar dominada por el rendimiento de los valores atípicos peor ajustados, el 88% de las predicciones de AlphaFold 2 tuvieron una desviación RMS de menos de 4 Å para el conjunto de átomos de C-alfa superpuestos. [6] El 76% de las predicciones lograron una precisión superior a 3 Å, y el 46% tuvo una precisión RMS del átomo de C-alfa mejor que 2 Å, [6] con una desviación RMS media en sus predicciones de 2,1 Å para un conjunto de átomos de CA superpuestos. [6] AlphaFold 2 también logró una precisión en el modelado de cadenas laterales de superficie descrita como "realmente extraordinaria".

Para verificar aún más el funcionamiento de AlphaFold-2, los organizadores de la conferencia se pusieron en contacto con cuatro grupos experimentales líderes para que les propusieran estructuras que les resultaban especialmente difíciles de determinar y que no habían podido determinar. En los cuatro casos, los modelos tridimensionales producidos por AlphaFold 2 fueron lo suficientemente precisos como para determinar las estructuras de estas proteínas mediante reemplazo molecular . Entre ellas se encontraba la proteína diana T1100 (Af1503), una pequeña proteína de membrana estudiada por los experimentadores durante diez años. [5]

De las tres estructuras que AlphaFold 2 tuvo menos éxito en predecir, dos se habían obtenido mediante métodos de RMN de proteínas , que definen la estructura de las proteínas directamente en solución acuosa, mientras que AlphaFold se entrenó principalmente en estructuras de proteínas en cristales . La tercera existe en la naturaleza como un complejo multidominio que consta de 52 copias idénticas del mismo dominio , una situación que AlphaFold no fue programado para considerar. Para todos los objetivos con un solo dominio, excluyendo solo una proteína muy grande y las dos estructuras determinadas por RMN, AlphaFold 2 logró una puntuación GDT_TS de más de 80.

CASP15

En 2022, DeepMind no participó en CASP15, pero la mayoría de los participantes utilizaron AlphaFold o herramientas que incorporan AlphaFold. [44]

Recepción

El resultado de AlphaFold 2, que obtuvo una puntuación superior a 90 en la prueba de distancia global (GDT) de CASP , se considera un logro significativo en biología computacional [5] y un gran avance hacia un gran desafío de la biología que ya lleva décadas en pie. [7] El ganador del Premio Nobel y biólogo estructural Venki Ramakrishnan calificó el resultado como "un avance asombroso en el problema del plegamiento de proteínas", [5] y agregó que "se produjo décadas antes de lo que muchas personas en el campo habrían predicho. Será emocionante ver las muchas formas en que cambiará fundamentalmente la investigación biológica". [40]

Impulsado por los comunicados de prensa de CASP y DeepMind, [45] [40] el éxito de AlphaFold 2 recibió una amplia atención de los medios. [46] Además de las noticias en la prensa científica especializada, como Nature , [7] Science , [5] MIT Technology Review , [2] y New Scientist , [47] [48] la historia fue ampliamente cubierta por los principales periódicos nacionales. [49] [50] [51] [52] Un tema frecuente fue que se espera que la capacidad de predecir las estructuras de las proteínas con precisión basándose en la secuencia de aminoácidos constituyentes tenga una amplia variedad de beneficios en el espacio de las ciencias de la vida, incluida la aceleración del descubrimiento de fármacos avanzados y la posibilidad de una mejor comprensión de las enfermedades. [7] [53] Algunos han señalado que incluso una respuesta perfecta al problema de la predicción de proteínas aún dejaría preguntas sobre el problema del plegamiento de las proteínas : comprender en detalle cómo ocurre realmente el proceso de plegamiento en la naturaleza (y cómo a veces también pueden plegarse incorrectamente ). [54]

En 2023, Demis Hassabis y John Jumper ganaron el Premio Breakthrough en Ciencias de la Vida [15], así como el Premio Albert Lasker de Investigación Médica Básica por su gestión del proyecto AlphaFold. [55] Hassabis y Jumper ganaron el Premio Nobel de Química en 2024 por su trabajo sobre la “predicción de la estructura de las proteínas” con David Baker de la Universidad de Washington. [14] [56]

Código fuente

DeepMind ha proporcionado acceso abierto al código fuente de varias versiones de AlphaFold (excluyendo AlphaFold 3) tras las solicitudes de la comunidad científica. [57] [58] [59] Se espera que el código fuente completo de AlphaFold-3 esté disponible para acceso abierto a fines de 2024. [60] [61]

Base de datos de modelos de proteínas generados por AlphaFold

La base de datos de estructuras de proteínas AlphaFold se lanzó el 22 de julio de 2021, como un esfuerzo conjunto entre AlphaFold y EMBL-EBI . En el lanzamiento, la base de datos contiene modelos predichos por AlphaFold de estructuras proteicas de casi todo el proteoma UniProt de humanos y 20 organismos modelo , lo que suma más de 365.000 proteínas. La base de datos no incluye proteínas con menos de 16 o más de 2700 residuos de aminoácidos , [62] pero para los humanos están disponibles en el archivo de lote completo. [ 63] AlphaFold planeó agregar más secuencias a la colección, siendo el objetivo inicial (a principios de 2022) cubrir la mayor parte del conjunto UniRef90 de más de 100 millones de proteínas. Al 15 de mayo de 2022, estaban disponibles 992.316 predicciones. [64]

En julio de 2021, UniProt-KB e InterPro [65] se actualizaron para mostrar las predicciones de AlphaFold cuando estén disponibles. [66]

El 28 de julio de 2022, el equipo cargó en la base de datos las estructuras de alrededor de 200 millones de proteínas de 1 millón de especies, cubriendo casi todas las proteínas conocidas del planeta. [67]

Limitaciones

AlphaFold tiene varias limitaciones:

Aplicaciones

AlphaFold se ha utilizado para predecir las estructuras de las proteínas del SARS-CoV-2 , el agente causante de la COVID-19 . Las estructuras de estas proteínas estaban pendientes de detección experimental a principios de 2020. [76] [7] Los resultados fueron examinados por los científicos del Instituto Francis Crick en el Reino Unido antes de publicarlos en la comunidad de investigación más amplia. El equipo también confirmó la predicción precisa contra la proteína de pico del SARS-CoV-2 determinada experimentalmente que se compartió en el Protein Data Bank , una base de datos internacional de acceso abierto, antes de publicar las estructuras determinadas computacionalmente de las moléculas de proteína poco estudiadas. [77] El equipo reconoció que, aunque estas estructuras de proteínas podrían no ser objeto de esfuerzos de investigación terapéutica en curso, se sumarán a la comprensión de la comunidad sobre el virus SARS-CoV-2. [77] Específicamente, la predicción de AlphaFold 2 de la estructura de la proteína ORF3a fue muy similar a la estructura determinada por los investigadores de la Universidad de California, Berkeley utilizando microscopía crioelectrónica . Se cree que esta proteína específica ayuda al virus a salir de la célula huésped una vez que se replica. También se cree que esta proteína desempeña un papel en el desencadenamiento de la respuesta inflamatoria a la infección. [78]

Obras publicadas

Véase también

Referencias

  1. ^ "AlphaFold". Deepmind . Archivado desde el original el 19 de enero de 2021 . Consultado el 30 de noviembre de 2020 .
  2. ^ abcdef "La inteligencia artificial de DeepMind que plega proteínas ha resuelto un gran desafío de la biología que ya tenía 50 años". MIT Technology Review . Archivado desde el original el 28 de agosto de 2021 . Consultado el 30 de noviembre de 2020 .
  3. ^ Shead, Sam (30 de noviembre de 2020). «DeepMind resuelve un «gran desafío» de 50 años con inteligencia artificial que pliega proteínas» CNBC . Archivado desde el original el 28 de enero de 2021. Consultado el 30 de noviembre de 2020 .
  4. ^ Stoddart, Charlotte (1 de marzo de 2022). «Biología estructural: cómo las proteínas consiguieron su primer plano». Revista Knowable . doi : 10.1146/knowable-022822-1 . S2CID:  247206999. Archivado desde el original el 7 de abril de 2022. Consultado el 25 de marzo de 2022 .
  5. ^ abcdefgh Robert F. Service, 'El juego ha cambiado'. La IA triunfa al resolver estructuras de proteínas Archivado el 24 de junio de 2023 en Wayback Machine , Science , 30 de noviembre de 2020
  6. ^ abcdef Mohammed AlQuraishi, las puntuaciones del CASP14 acaban de salir y son asombrosas Archivado el 4 de agosto de 2022 en Wayback Machine , Twitter, 30 de noviembre de 2020.
  7. ^ abcdef Callaway, Ewen (30 de noviembre de 2020). ""Cambiará todo": la IA de DeepMind da un salto gigantesco en la resolución de estructuras proteínicas". Nature . 588 (7837): 203–204. Bibcode :2020Natur.588..203C. doi :10.1038/d41586-020-03348-4. PMID  33257889. S2CID  227243204.
  8. ^ Stephen Curry, No, DeepMind no ha resuelto el plegamiento de proteínas Archivado el 29 de julio de 2022 en Wayback Machine , Reciprocal Space (blog), 2 de diciembre de 2020
  9. ^ Ball, Phillip (9 de diciembre de 2020). «Detrás de las pantallas de AlphaFold». Chemistry World . Archivado desde el original el 15 de agosto de 2021. Consultado el 10 de diciembre de 2020 .
  10. ^ ab Saltador, John; Evans, Ricardo; Pritzel, Alejandro; Verde, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ; Žídek, Agustín; Potapenko, Anna; Bridgland, Alex; Meyer, Clemens; Kohl, Simón AA; Ballard, Andrew J; Cowie, Andrés; Romera-Paredes, Bernardino; Nikólov, Stanislav; Jainista, Rishub; Adler, Jonás; Atrás, Trevor; Petersen, Stig; Reiman, David; Clancy, Elena; Zielinski, Michal; Steinegger, Martín; Pacholska, Michalina; Berghammer, Tamas; Bodenstein, Sebastián; Plata, David; Vinyals, Oriol; Mayor, Andrew W; Kavukcuoglu, Koray; Kohli, Pushmeet; Hassabis, Demis (15 de julio de 2021). "Predicción de la estructura de proteínas de alta precisión con AlphaFold". Nature . 596 (7873): 583–589. Bibcode :2021Natur.596..583J. doi : 10.1038/s41586-021-03819 -2 . PMC 8371605 . PMID  34265844. 
  11. ^ "GitHub - deepmind/alphafold: código fuente abierto para AlphaFold". GitHub . Archivado desde el original el 2021-07-23 . Consultado el 2021-07-24 .
  12. ^ "Base de datos de estructura de proteínas AlphaFold". alphafold.ebi.ac.uk . Archivado desde el original el 2021-07-24 . Consultado el 2021-07-24 .
  13. ^ abc «AlphaFold 3 predice la estructura y las interacciones de todas las moléculas de la vida». Google . 2024-05-08. Archivado desde el original el 2024-05-09 . Consultado el 2024-05-09 .
  14. ^ ab Hunt, Christian Edwards, Katie (9 de octubre de 2024). «Los científicos que utilizaron la IA para 'descifrar el código' de casi todas las proteínas ganan el Premio Nobel de Química». CNN . Archivado desde el original el 10 de octubre de 2024. Consultado el 9 de octubre de 2024 .{{cite news}}: CS1 maint: varios nombres: lista de autores ( enlace )
  15. ^ ab Knapp, Alex. "2023 Breakthrough Prizes Announced: Deepmind's Protein Folders Awarded $3 Million" (Premios Breakthrough 2023: las carpetas de proteínas de Deepmind recibieron 3 millones de dólares). Forbes . Archivado desde el original el 9 de mayo de 2024. Consultado el 9 de mayo de 2024 .
  16. ^ abc «AlphaFold: Uso de la IA para el descubrimiento científico». Deepmind . 15 de enero de 2020. Archivado desde el original el 7 de marzo de 2022 . Consultado el 30 de noviembre de 2020 .
  17. ^ Mohammed AlQuraishi (mayo de 2019), AlphaFold en CASP13 Archivado el 22 de noviembre de 2021 en Wayback Machine , Bioinformatics , 35 (22), 4862–4865 doi :10.1093/bioinformatics/btz422. Véase también Mohammed AlQuraishi (9 de diciembre de 2018), AlphaFold @ CASP13: "¿Qué acaba de pasar?" Archivado el 29 de julio de 2022 en Wayback Machine (publicación de blog). Mohammed AlQuraishi (15 de enero de 2020), Un momento decisivo para la predicción de la estructura de las proteínas Archivado el 23 de junio de 2022 en Wayback Machine , Nature 577 , 627–628 doi :10.1038/d41586-019-03951-0
  18. ^ AlphaFold: aprendizaje automático para la predicción de la estructura de proteínas Archivado el 12 de mayo de 2022 en Wayback Machine , Foldit , 31 de enero de 2020
  19. ^ ab Jumper, John; et al. (agosto de 2021). "Predicción de la estructura de proteínas de alta precisión con AlphaFold". Nature . 596 (7873): 583–589. Bibcode :2021Natur.596..583J. doi :10.1038/s41586-021-03819-2. ISSN  1476-4687. PMC 8371605 . PMID  34265844. 
  20. ^ ab «DeepMind está respondiendo a uno de los mayores desafíos de la biología». The Economist . 2020-11-30. ISSN  0013-0613. Archivado desde el original el 2020-12-03 . Consultado el 2020-11-30 .
  21. ^ de Jeremy Kahn, Lecciones del gran avance de DeepMind en la inteligencia artificial de plegamiento de proteínas Archivado el 8 de abril de 2022 en Wayback Machine , Fortune , 1 de diciembre de 2020
  22. ^ abcd Ver diagrama de bloques. También John Jumper et al. (1 de diciembre de 2020), presentación de AlphaFold 2 Archivado el 3 de julio de 2022 en Wayback Machine , diapositiva 10
  23. ^ John Jumper et al., resumen de la conferencia (diciembre de 2020)
  24. ^ Se afirma que el módulo de estructura utiliza una "arquitectura de transformador equivariante 3-d" (John Jumper et al. (1 de diciembre de 2020), presentación de AlphaFold 2 Archivado el 3 de julio de 2022 en Wayback Machine , diapositiva 12).
    Un diseño para una red de transformadores con equivariancia SE(3) fue propuesto en Fabian Fuchs et al SE(3)-Transformers: 3D Roto-Translation Equivariant Attention Networks Archivado el 7 de octubre de 2021 en Wayback Machine , NeurIPS 2020; también sitio web Archivado el 3 de julio de 2022 en Wayback Machine . No se sabe qué tan similar puede o no ser esto a lo que se usó en AlphaFold. Véase también la publicación del blog Archivado el 8 de diciembre de 2020 en Wayback Machine por AlQuaraishi sobre este tema, o la publicación más detallada Archivado el 3 de julio de 2022 en Wayback Machine por Fabian Fuchs.
  25. ^ John Jumper et al. (1 de diciembre de 2020), presentación de AlphaFold 2 Archivado el 3 de julio de 2022 en Wayback Machine , diapositivas 12 a 20
  26. ^ Callaway, Ewen (13 de abril de 2022). "¿Qué es lo próximo para AlphaFold y la revolución del plegamiento de proteínas con IA?". Nature . 604 (7905): 234–238. Bibcode :2022Natur.604..234C. doi : 10.1038/d41586-022-00997-5 . PMID  35418629. S2CID  248156195.
  27. ^ Metz, Cade (8 de mayo de 2024). «Google presenta una IA para predecir el comportamiento de las moléculas humanas». The New York Times . ISSN  0362-4331. Archivado desde el original el 10 de octubre de 2024. Consultado el 9 de mayo de 2024 .
  28. ^ Abramson, Josh; Adler, Jonas; Dunger, Jack; Evans, Richard; Green, Tim; Pritzel, Alexander; Ronneberger, Olaf; Willmore, Lindsay; Ballard, Andrew J.; Bambrick, Joshua; Bodenstein, Sebastian W.; Evans, David A.; Hung, Chia-Chun; O'Neill, Michael; Reiman, David (8 de mayo de 2024). "Predicción precisa de la estructura de interacciones biomoleculares con AlphaFold 3". Nature . 630 (8016): 493–500. Bibcode :2024Natur.630..493A. doi : 10.1038/s41586-024-07487-w . ISSN  1476-4687. PMC 11168924 . PMID  38718835. 
  29. ^ Predicción precisa de la estructura de interacciones biomoleculares con AlphaFold 3 Archivado el 12 de mayo de 2024 en Wayback Machine , pdf de la preimpresión del artículo en Nature.
  30. ^ "Un servidor no comercial de AlphaFold-3". Archivado desde el original el 10 de octubre de 2024. Consultado el 12 de mayo de 2024 .
  31. ^ Rendimiento del grupo basado en puntuaciones z combinadas Archivado el 8 de marzo de 2022 en Wayback Machine , CASP 13, diciembre de 2018. (AlphaFold = Equipo 043: A7D)
  32. ^ ab Sample, Ian (2 de diciembre de 2018). «DeepMind de Google predice formas 3D de proteínas». The Guardian . Archivado desde el original el 18 de julio de 2019. Consultado el 30 de noviembre de 2020 .
  33. ^ "AlphaFold: Uso de la IA para el descubrimiento científico". Deepmind . Archivado desde el original el 10 de octubre de 2024 . Consultado el 30 de noviembre de 2020 .
  34. ^ Singh, Arunima (2020). "Estructuras 3D de aprendizaje profundo". Nature Methods . 17 (3): 249. doi : 10.1038/s41592-020-0779-y . ISSN  1548-7105. PMID  32132733. S2CID  212403708.
  35. ^ Consulte las tablas de datos CASP 13 archivadas el 14 de marzo de 2022 en Wayback Machine para 043 A7D, 322 Zhang y 089 MULTICOM
  36. ^ Wei Zheng et al , Predicción de la estructura de proteínas guiada por mapas de contacto de aprendizaje profundo en CASP13 Archivado el 22 de enero de 2022 en Wayback Machine , Proteínas: estructura, función y bioinformática , 87 (12) 1149–1164 doi :10.1002/prot.25792; y diapositivas Archivado el 26 de julio de 2022 en Wayback Machine
  37. ^ Hou, Jie; Wu, Tianqi; Cao, Renzhi; Cheng, Jianlin (25 de abril de 2019). "Modelado de la estructura terciaria de proteínas impulsado por aprendizaje profundo y predicción de la distancia de contacto en CASP13". Proteínas : estructura, función y bioinformática . 87 (12). Wiley: 1165–1178. bioRxiv 10.1101/552422 . doi :10.1002/prot.25697. ISSN  0887-3585. PMC 6800999 . PMID  30985027.  
  38. ^ ab "El avance de DeepMind ayuda a resolver cómo las enfermedades invaden las células". Bloomberg.com . 2020-11-30. Archivado desde el original el 2022-04-05 . Consultado el 2020-11-30 .
  39. ^ "deepmind/deepmind-research". GitHub . Archivado desde el original el 2022-02-01 . Consultado el 2020-11-30 .
  40. ^ abc «AlphaFold: una solución a un gran desafío de hace 50 años en biología». Deepmind . 30 de noviembre de 2020. Archivado desde el original el 30 de noviembre de 2020 . Consultado el 30 de noviembre de 2020 .
  41. ^ "La inteligencia artificial de DeepMind que plega proteínas ha resuelto un gran desafío de la biología que se remonta a 50 años atrás". MIT Technology Review . Archivado desde el original el 28 de agosto de 2021 . Consultado el 30 de noviembre de 2020 .
  42. ^ Para la medida GDT_TS utilizada, cada átomo en la predicción obtiene un cuarto de punto si está dentro de los 8 Å (0,80 nm) de la posición experimental; medio punto si está dentro de los 4 Å, tres cuartos de punto si está dentro de los 2 Å y un punto entero si está dentro de 1 Å.
  43. ^ Para lograr una puntuación GDT_TS de 92,5, matemáticamente al menos el 70 % de la estructura debe tener una precisión de 1 Å, y al menos el 85 % debe tener una precisión de 2 Å.
  44. ^ Callaway, Ewen (13 de diciembre de 2022). "Después de AlphaFold: el concurso de plegamiento de proteínas busca el próximo gran avance". Nature . 613 (7942): 13–14. doi : 10.1038/d41586-022-04438-1 . PMID  36513827. S2CID  254660427.
  45. ^ La solución de inteligencia artificial a un desafío científico de hace 50 años podría 'revolucionar' la investigación médica Archivado el 24 de abril de 2022 en Wayback Machine (nota de prensa), comité organizador de CASP , 30 de noviembre de 2020
  46. ^ Brigitte Nerlich, El plegamiento de proteínas y la comunicación científica: entre la publicidad exagerada y la humildad Archivado el 15 de febrero de 2022 en Wayback Machine , blog de la Universidad de Nottingham , 4 de diciembre de 2020
  47. ^ Michael Le Page, el biólogo de inteligencia artificial de DeepMind puede descifrar los secretos de la maquinaria de la vida Archivado el 2 de agosto de 2022 en Wayback Machine , New Scientist , 30 de noviembre de 2020
  48. ^ Las predicciones de la última IA de DeepMind podrían revolucionar la medicina Archivado el 7 de noviembre de 2021 en Wayback Machine , New Scientist , 2 de diciembre de 2020
  49. ^ Tom Whipple, Deepmind encuentra el "santo grial" de la biología con la respuesta al problema de las proteínas Archivado el 19 de enero de 2021 en Wayback Machine , The Times (en línea), 30 de noviembre de 2020.
    El editor de All Science, Tom Whipple, escribió seis artículos sobre el tema para The Times el día en que se conoció la noticia. (hilo Archivado el 8 de noviembre de 2021 en Wayback Machine ).
  50. ^ Cade Metz, Laboratorio de inteligencia artificial de Londres afirma haber logrado un avance que podría acelerar el descubrimiento de fármacos Archivado el 4 de agosto de 2022 en Wayback Machine , New York Times , 30 de noviembre de 2020
  51. ^ Ian Sample, DeepMind AI resuelve un problema de plegamiento de proteínas de hace 50 años Archivado el 30 de noviembre de 2020 en Wayback Machine , The Guardian , 30 de noviembre de 2020
  52. ^ Lizzie Roberts, "Un avance que se produce una vez en una generación" mientras los investigadores de inteligencia artificial de Google resuelven un desafío biológico de hace 50 años Archivado el 4 de agosto de 2022 en Wayback Machine . Daily Telegraph , 30 de noviembre de 2020
  53. ^ Tim Hubbard , El secreto de la vida, parte 2: la solución del problema del plegamiento de las proteínas. Archivado el 14 de mayo de 2022 en Wayback Machine , medium.com , 30 de noviembre de 2020
  54. ^ por ejemplo Greg Bowman, El plegamiento de proteínas y los problemas relacionados siguen sin resolverse a pesar del avance de AlphaFold Archivado el 13 de julio de 2022 en Wayback Machine , blog Folding@home , 8 de diciembre de 2020
  55. ^ Sample, Ian (21 de septiembre de 2023). «El equipo detrás del programa de inteligencia artificial AlphaFold gana el premio científico Lasker». The Guardian . ISSN  0261-3077. Archivado desde el original el 10 de octubre de 2024. Consultado el 9 de mayo de 2024 .
  56. ^ "El Premio Nobel de Química 2024". NobelPrize.org . Archivado desde el original el 2024-10-09 . Consultado el 2024-10-10 .
  57. ^ Domínguez, Nuño (2 de diciembre de 2020). "La inteligencia artificial arrasa en uno de los problemas más importantes de la biología". El País (en español). Archivado desde el original el 26 de julio de 2022 . Consultado el 12 de mayo de 2024 .
  58. ^ Briggs, David (4 de diciembre de 2020). «Si Alphafold2 de Google realmente ha resuelto el problema del plegamiento de proteínas, necesitan demostrar que funciona». The Skeptic . Archivado desde el original el 12 de mayo de 2024. Consultado el 12 de mayo de 2024 .
  59. ^ Demis Hassabis , "¡Breve actualización sobre algunos avances emocionantes en #AlphaFold!" Archivado el 22 de julio de 2022 en Wayback Machine (tuit), vía twitter , 18 de junio de 2021
  60. ^ "AlphaFold3: ¿por qué Nature lo publicó sin su código?". Archivado desde el original el 28 de junio de 2024. Consultado el 27 de mayo de 2024 .
  61. ^ "AlphaFold 3: Un paso hacia el futuro de la predicción de estructuras". Archivado desde el original el 2024-05-27 . Consultado el 2024-05-27 .
  62. ^ "Base de datos de estructura de proteínas AlphaFold". alphafold.ebi.ac.uk . Archivado desde el original el 2022-07-29 . Consultado el 2021-07-29 .
  63. ^ "Base de datos de estructura de proteínas AlphaFold". alphafold.ebi.ac.uk . Archivado desde el original el 29 de julio de 2022 . Consultado el 27 de julio de 2021 .
  64. ^ "Base de datos de estructura de proteínas AlphaFold". www.alphafold.ebi.ac.uk . Archivado desde el original el 2022-08-02 . Consultado el 2021-07-24 .
  65. ^ InterPro (22 de julio de 2021). «Predicciones de la estructura de pliegues alfa disponibles en Interpro». proteinwebteam.github.io . Archivado desde el original el 2021-11-05 . Consultado el 2021-07-29 .
  66. ^ "Poniendo el poder de AlphaFold en manos del mundo". Deepmind . 22 de julio de 2022. Archivado desde el original el 24 de julio de 2021 . Consultado el 24 de julio de 2021 .
  67. ^ Callaway, Ewen (28 de julio de 2022). «'Todo el universo proteico': la IA predice la forma de casi todas las proteínas conocidas». Nature . 608 (7921): 15–16. Bibcode :2022Natur.608...15C. doi : 10.1038/d41586-022-02083-2 . ​​PMID  35902752. S2CID  251159714.
  68. ^ ab "¿Qué casos de uso no admite AlphaFold?". Base de datos de estructura de proteínas AlphaFold . Archivado desde el original el 29 de julio de 2022. Consultado el 15 de mayo de 2022 .
  69. ^ AlphaFold anuncia una revolución basada en datos en biología y medicina Archivado el 10 de octubre de 2024 en Wayback Machine , por Janet M. Thornton , Roman A. Laskowski y Neera Borkakoti, Nature Medicine , volumen 12, páginas 1666–1669, 12 de octubre de 2021
  70. ^ McBride, John M.; Polev, Konstantin; Abdirasulov, Amirbek; Reinharz, Vladimir; Grzybowski, Bartosz A.; Tlusty, Tsvi (20 de noviembre de 2023). "AlphaFold2 puede predecir los efectos de una sola mutación". Physical Review Letters . 131 (21): 218401. arXiv : 2204.06860 . Código Bibliográfico :2023PhRvL.131u8401M. doi :10.1103/PhysRevLett.131.218401. ISSN  0031-9007. PMID  38072605. Archivado desde el original el 2024-06-09 . Consultado el 2023-11-26 .
  71. ^ "El último avance en inteligencia artificial de DeepMind podría impulsar el descubrimiento de fármacos". Fast Company . ISSN  1085-9241. Archivado desde el original el 2023-01-24 . Consultado el 2023-01-24 .
  72. ^ Bagdonas, Haroldas; Fogarty, Carl A.; Fadda, Elisa; Agirre, Jon (29 de octubre de 2021). "El caso de las modificaciones pospredictivas en la base de datos de estructura de proteínas AlphaFold" (PDF) . Nature Structural & Molecular Biology . 28 (11): 869–870. doi : 10.1038/s41594-021-00680-9 . ISSN  1545-9985. PMID  34716446. S2CID  240228913. Archivado (PDF) desde el original el 13 de enero de 2024 . Consultado el 13 de enero de 2024 .
  73. ^ An, Hyun Joo; Froehlich, John W; Lebrilla, Carlito B (1 de octubre de 2009). "Determinación de sitios de glicosilación y heterogeneidad específica de sitio en glicoproteínas". Current Opinion in Chemical Biology . Técnicas analíticas/mecanismos. 13 (4): 421–426. doi :10.1016/j.cbpa.2009.07.022. ISSN  1367-5931. PMC 2749913 . PMID  19700364. 
  74. ^ Hekkelman, Maarten L.; de Vries, Ida; Joosten, Robbie P.; Perrakis, Anastassis (febrero de 2023). "AlphaFill: enriquecimiento de modelos AlphaFold con ligandos y cofactores". Métodos de la naturaleza . 20 (2): 205–213. doi : 10.1038/s41592-022-01685-y . PMC 9911346 . PMID  36424442. 
  75. ^ Dabrowski-Tumanski, Pawel; Stasiak, Andrzej (7 de noviembre de 2023). "La ceguera de AlphaFold a las barreras topológicas afecta su capacidad para predecir correctamente la topología de las proteínas". Moléculas . 28 (22): 7462. doi : 10.3390/molecules28227462 . PMC 10672856 . PMID  38005184. 
  76. ^ "La IA puede ayudar a los científicos a encontrar una vacuna contra la COVID-19". Wired . ISSN  1059-1028. Archivado desde el original el 23 de abril de 2022 . Consultado el 1 de diciembre de 2020 .
  77. ^ ab "Predicciones computacionales de estructuras proteicas asociadas con COVID-19". Deepmind . 4 de agosto de 2020. Archivado desde el original el 25 de marzo de 2022 . Consultado el 1 de diciembre de 2020 .
  78. ^ "Cómo la nueva IA de plegamiento de proteínas de DeepMind ya está ayudando a combatir la pandemia del coronavirus". Fortune . Archivado desde el original el 2020-11-30 . Consultado el 2020-12-01 .

Lectura adicional

Enlaces externos