Rosetta@home es un proyecto informático voluntario que investiga la predicción de la estructura de las proteínas en la plataforma Berkeley Open Infrastructure for Network Computing (BOINC), dirigida por el laboratorio Baker. Rosetta@home tiene como objetivo predecir el acoplamiento proteína-proteína y diseñar nuevas proteínas con la ayuda de unas cincuenta y cinco mil computadoras voluntarias activas que procesan más de 487.946 Giga FLOPS en promedio al 19 de septiembre de 2020. [4] Foldit , un videojuego de Rosetta@home, tiene como objetivo alcanzar estos objetivos con un enfoque de colaboración colectiva . Aunque gran parte del proyecto está orientado a la investigación básica para mejorar la precisión y la solidez de los métodos de proteómica , Rosetta@home también realiza investigación aplicada sobre la malaria , la enfermedad de Alzheimer y otras patologías. [5]
Al igual que todos los proyectos BOINC, Rosetta@home utiliza recursos de procesamiento informático inactivos de las computadoras de los voluntarios para realizar cálculos en unidades de trabajo individuales . Los resultados completos se envían a un servidor de proyecto central donde se validan y se asimilan en las bases de datos del proyecto . El proyecto es multiplataforma y se ejecuta en una amplia variedad de configuraciones de hardware. Los usuarios pueden ver el progreso de su predicción de la estructura de proteínas individual en el protector de pantalla de Rosetta@home.
Además de la investigación relacionada con enfermedades, la red Rosetta@home sirve como marco de prueba para nuevos métodos en bioinformática estructural . Dichos métodos se utilizan luego en otras aplicaciones basadas en Rosetta, como RosettaDock o el Proyecto de Plegado del Proteoma Humano y el Proyecto de Inmunidad del Microbioma , después de haber sido suficientemente desarrollados y demostrados estables en el amplio y diverso conjunto de computadoras voluntarias de Rosetta@home. Dos pruebas especialmente importantes para los nuevos métodos desarrollados en Rosetta@home son los experimentos de Evaluación Crítica de Técnicas para la Predicción de la Estructura de Proteínas (CASP) y Evaluación Crítica de la Predicción de Interacciones (CAPRI), experimentos bienales que evalúan el estado del arte en la predicción de la estructura de proteínas y la predicción del acoplamiento proteína-proteína, respectivamente. Rosetta se clasifica constantemente entre los principales predictores de acoplamiento y es uno de los mejores predictores de estructura terciaria disponibles. [6]
Con una afluencia de nuevos usuarios que buscan participar en la lucha contra la pandemia de COVID-19 , causada por SARS-CoV-2 , Rosetta@home ha aumentado su poder de cómputo hasta 1,7 PetaFlops a partir del 28 de marzo de 2020. [7] [8] El 9 de septiembre de 2020, los investigadores de Rosetta@home publicaron un artículo que describe 10 potentes candidatos antivirales contra el SARS-CoV-2. Rosetta@home contribuyó a esta investigación y estos candidatos antivirales se dirigen hacia los ensayos clínicos de fase 1, que pueden comenzar a principios de 2022. [9] [10] [11] [12] Según el equipo de Rosetta@home, los voluntarios de Rosetta contribuyeron al desarrollo de una vacuna de nanopartículas. [9] Esta vacuna ha sido autorizada y se conoce como IVX-411 por Icosavax, que comenzó un ensayo clínico de fase I/II en junio de 2021, [13] y GBP510 que está siendo desarrollada por SK Bioscience y ya está aprobada para un ensayo clínico de fase III en Corea del Sur. [14] [15]
NL-201 , un candidato a fármaco contra el cáncer que se creó por primera vez en el Instituto de Diseño de Proteínas (IPD) y se publicó en un artículo de enero de 2019, [16] comenzó un ensayo clínico en humanos de fase 1 en mayo de 2021 con el apoyo de Neoleukin Therapeutics, una empresa derivada del IPD. [17] Rosetta@home desempeñó un papel en el desarrollo de NL-201 y contribuyó con experimentos de "plegado hacia adelante" que ayudaron a validar los diseños de proteínas. [18]
La aplicación Rosetta@home y la plataforma informática voluntaria BOINC están disponibles para los sistemas operativos Windows , Linux y macOS ; BOINC también se ejecuta en varios otros, por ejemplo, FreeBSD. [19] La participación en Rosetta@home requiere una unidad central de procesamiento (CPU) con una velocidad de reloj de al menos 500 MHz , 200 megabytes de espacio libre en disco , 512 megabytes de memoria física y conectividad a Internet. [20] Al 20 de julio de 2016, la versión actual de la aplicación Rosetta Mini es 3.73. [21] La versión actual recomendada del programa BOINC es 7.6.22. [19] El Protocolo de transferencia de hipertexto estándar (HTTP) ( puerto 80) se utiliza para la comunicación entre el cliente BOINC del usuario y los servidores Rosetta@home en la Universidad de Washington; HTTPS (puerto 443) se utiliza durante el intercambio de contraseñas. El control remoto y local del cliente BOINC utiliza el puerto 31416 y el puerto 1043, que podrían necesitar ser desbloqueados específicamente si están detrás de un firewall . [22] Las unidades de trabajo que contienen datos sobre proteínas individuales se distribuyen desde servidores ubicados en el laboratorio Baker en la Universidad de Washington a las computadoras de los voluntarios, que luego calculan una predicción de estructura para la proteína asignada. Para evitar predicciones de estructura duplicadas en una proteína dada, cada unidad de trabajo se inicializa con un número de semilla aleatorio . Esto le da a cada predicción una trayectoria única de descenso a lo largo del paisaje energético de la proteína . [23] Las predicciones de la estructura de la proteína de Rosetta@home son aproximaciones de un mínimo global en el paisaje energético de una proteína dada. Ese mínimo global representa la conformación energéticamente más favorable de la proteína, es decir, su estado nativo .
Una característica principal de la interfaz gráfica de usuario (GUI) de Rosetta@home es un protector de pantalla que muestra el progreso de una unidad de trabajo actual durante el proceso simulado de plegamiento de proteínas . En la parte superior izquierda del protector de pantalla actual, se muestra la proteína objetivo adoptando diferentes formas (conformaciones) en su búsqueda de la estructura de menor energía. Inmediatamente a la derecha se muestra la estructura de la proteína aceptada más recientemente. En la parte superior derecha se muestra la conformación de menor energía del señuelo actual; debajo de eso se muestra la estructura verdadera o nativa de la proteína si ya se ha determinado. Se incluyen tres gráficos en el protector de pantalla. Cerca del medio, se muestra un gráfico de la energía libre termodinámica del modelo aceptado, que fluctúa a medida que cambia el modelo aceptado. En el extremo derecho se muestra un gráfico de la desviación cuadrática media (RMSD) del modelo aceptado , que mide cuán estructuralmente similar es el modelo aceptado al modelo nativo. A la derecha del gráfico de energía aceptada y debajo del gráfico RMSD, los resultados de estas dos funciones se utilizan para producir un gráfico de energía vs. RMSD a medida que el modelo se refina progresivamente. [24]
Al igual que todos los proyectos BOINC, Rosetta@home se ejecuta en segundo plano en la computadora del usuario, utilizando la energía inactiva de la computadora, ya sea antes o durante el inicio de sesión en una cuenta en el sistema operativo anfitrión . El programa libera recursos de la CPU a medida que otras aplicaciones los necesitan, de modo que el uso normal de la computadora no se ve afectado. Se pueden especificar muchas configuraciones del programa a través de las preferencias de la cuenta de usuario, incluyendo: el porcentaje máximo de recursos de CPU que el programa puede usar (para controlar el consumo de energía o la producción de calor de una computadora que funciona a capacidad sostenida), las horas del día durante las cuales el programa puede ejecutarse y muchas más. [ cita requerida ]
Con la proliferación de proyectos de secuenciación genómica , los científicos pueden inferir la secuencia de aminoácidos, o estructura primaria , de muchas proteínas que realizan funciones dentro de la célula. Para comprender mejor la función de una proteína y ayudar en el diseño racional de fármacos , los científicos necesitan conocer la estructura terciaria tridimensional de la proteína .
Las estructuras 3D de las proteínas se determinan actualmente de forma experimental mediante cristalografía de rayos X o espectroscopia de resonancia magnética nuclear (RMN). El proceso es lento (puede llevar semanas o incluso meses descubrir cómo cristalizar una proteína por primera vez) y costoso (alrededor de 100.000 dólares estadounidenses por proteína). [25] Desafortunadamente, la velocidad a la que se descubren nuevas secuencias supera con creces la velocidad de determinación de la estructura: de más de 7.400.000 secuencias de proteínas disponibles en la base de datos de proteínas no redundantes (nr) del Centro Nacional de Información Biotecnológica (NCBI), menos de 52.000 estructuras 3D de proteínas se han resuelto y depositado en el Banco de Datos de Proteínas , el principal repositorio de información estructural sobre proteínas. [26] Uno de los principales objetivos de Rosetta@home es predecir las estructuras de las proteínas con la misma precisión que los métodos existentes, pero de una manera que requiere significativamente menos tiempo y dinero. Rosetta@home también desarrolla métodos para determinar la estructura y el acoplamiento de proteínas de membrana (por ejemplo, receptores acoplados a proteína G (GPCR)), [27] que son excepcionalmente difíciles de analizar con técnicas tradicionales como la cristalografía de rayos X y la espectroscopia de RMN, pero que representan la mayoría de los objetivos de los medicamentos modernos. [28]
El progreso en la predicción de la estructura de las proteínas se evalúa en el experimento bianual de Evaluación crítica de técnicas para la predicción de la estructura de las proteínas (CASP), en el que investigadores de todo el mundo intentan derivar la estructura de una proteína a partir de la secuencia de aminoácidos de la proteína. Los grupos con puntajes altos en este experimento a veces competitivo se consideran los abanderados de facto de lo que es el estado del arte en la predicción de la estructura de las proteínas. Rosetta, el programa en el que se basa Rosetta@home, se ha utilizado desde CASP5 en 2002. En el experimento CASP6 de 2004, Rosetta hizo historia al ser el primero en producir una predicción de la estructura de las proteínas ab initio con una resolución cercana al nivel atómico en su modelo presentado para el objetivo CASP T0281. [29] El modelado ab initio se considera una categoría especialmente difícil de predicción de la estructura de las proteínas, ya que no utiliza información de homología estructural y debe depender de información de homología de secuencia y modelado de interacciones físicas dentro de la proteína. Rosetta@home se ha utilizado en CASP desde 2006, donde estuvo entre los principales predictores en cada categoría de predicción de estructura en CASP7. [30] [31] [32] Estas predicciones de alta calidad fueron posibles gracias a la potencia informática que pusieron a disposición los voluntarios de Rosetta@home. [33] El aumento de la potencia informática permite a Rosetta@home muestrear más regiones del espacio de conformación (las posibles formas que puede asumir una proteína), que, según la paradoja de Levinthal , se predice que aumentará exponencialmente con la longitud de la proteína. [ cita requerida ]
Rosetta también se utiliza en la predicción del acoplamiento proteína-proteína , que determina la estructura de múltiples proteínas complejadas , o estructura cuaternaria . Este tipo de interacción proteica afecta a muchas funciones celulares, incluyendo la unión antígeno-anticuerpo y enzima-inhibidor y la importación y exportación celular. La determinación de estas interacciones es fundamental para el diseño de fármacos . Rosetta se utiliza en el experimento de Evaluación crítica de la predicción de interacciones (CAPRI), que evalúa el estado del campo del acoplamiento de proteínas de forma similar a cómo CASP mide el progreso en la predicción de la estructura de las proteínas. La potencia informática puesta a disposición por los voluntarios del proyecto Rosetta@home ha sido citada como un factor importante en el rendimiento de Rosetta en CAPRI 2007, donde sus predicciones de acoplamiento han estado entre las más precisas y completas. [34]
A principios de 2008, Rosetta se utilizó para diseñar computacionalmente una proteína con una función nunca antes observada en la naturaleza. [35] Esto se inspiró en parte en la retractación de un artículo de alto perfil de 2004 que originalmente describía el diseño computacional de una proteína con una actividad enzimática mejorada en relación con su forma natural. [36] El artículo de investigación de 2008 del grupo de David Baker que describe cómo se hizo la proteína, que citó a Rosetta@home por los recursos informáticos que puso a disposición, representó una prueba de concepto importante para este método de diseño de proteínas. [35] Este tipo de diseño de proteínas podría tener aplicaciones futuras en el descubrimiento de fármacos, la química verde y la biorremediación . [35]
El programa informático Rosetta fue citado en los antecedentes científicos del Premio Nobel de Química de 2024. [37]
Además de la investigación básica para predecir la estructura, el acoplamiento y el diseño de proteínas, Rosetta@home también se utiliza en investigaciones relacionadas con enfermedades de forma inmediata. [38] En la revista Rosetta@home de David Baker se describen numerosos proyectos de investigación menores. [39] A partir de febrero de 2014, se actualiza en el foro la información sobre publicaciones recientes y una breve descripción del trabajo. [40] El hilo del foro ya no se utiliza desde 2016, y las noticias sobre la investigación se pueden encontrar en la sección de noticias generales del proyecto. [41]
Un componente del paquete de software Rosetta, RosettaDesign, se utilizó para predecir con precisión qué regiones de proteínas amiloidogénicas tenían más probabilidades de formar fibrillas similares a amiloide . [42] Al tomar hexapéptidos (fragmentos de seis aminoácidos de longitud) de una proteína de interés y seleccionar la coincidencia de energía más baja con una estructura similar a la de un hexapéptido formador de fibrillas conocido, RosettaDesign pudo identificar péptidos con el doble de probabilidades de formar fibrillas que las proteínas aleatorias. [43] Rosetta@home se utilizó en el mismo estudio para predecir estructuras para beta amiloide , una proteína formadora de fibrillas que se ha postulado que causa la enfermedad de Alzheimer . [44] Se han producido resultados preliminares pero aún no publicados sobre proteínas diseñadas por Rosetta que pueden prevenir la formación de fibrillas, aunque se desconoce si puede prevenir la enfermedad. [45]
Otro componente de Rosetta, RosettaDock, [46] [47] [48] se utilizó junto con métodos experimentales para modelar las interacciones entre tres proteínas (factor letal [LF], factor de edema [EF] y antígeno protector [PA]) que componen la toxina del ántrax . El modelo informático predijo con precisión el acoplamiento entre LF y PA, lo que ayudó a establecer qué dominios de las proteínas respectivas están involucrados en el complejo LF-PA. Esta información se utilizó finalmente en la investigación que dio como resultado vacunas mejoradas contra el ántrax. [49] [50]
RosettaDock se utilizó para modelar el acoplamiento entre un anticuerpo ( inmunoglobulina G ) y una proteína de superficie expresada por el virus del herpes labial, el virus del herpes simple 1 (HSV-1), que sirve para degradar el anticuerpo antiviral. El complejo proteico predicho por RosettaDock coincidió estrechamente con los modelos experimentales especialmente difíciles de obtener, lo que llevó a los investigadores a concluir que el método de acoplamiento tiene potencial para abordar algunos de los problemas que tiene la cristalografía de rayos X con el modelado de las interfaces proteína-proteína. [51]
Como parte de una investigación financiada con una subvención de 19,4 millones de dólares de la Fundación Bill y Melinda Gates , [52] Rosetta@home se ha utilizado para diseñar múltiples vacunas posibles contra el virus de la inmunodeficiencia humana ( VIH ). [53] [54]
En una investigación relacionada con la iniciativa Grandes Desafíos en la Salud Global , [55] Rosetta se ha utilizado para diseñar computacionalmente nuevas proteínas endonucleasas homing , que podrían erradicar el Anopheles gambiae o hacer que el mosquito no pueda transmitir la malaria . [56] Ser capaz de modelar y alterar específicamente las interacciones proteína-ADN, como las de las endonucleasas homing, le da a los métodos de diseño computacional de proteínas como Rosetta un papel importante en la terapia génica (que incluye posibles tratamientos contra el cáncer). [38] [57]
En 2020, se utilizó la suite de modelado molecular Rosetta para predecir con precisión la estructura a escala atómica de la proteína de pico del SARS-CoV-2 semanas antes de que pudiera medirse en el laboratorio. [58] El 26 de junio de 2020, el proyecto anunció que había logrado crear proteínas antivirales que neutralizan los viriones del SARS-CoV-2 en el laboratorio y que estos medicamentos antivirales experimentales se estaban optimizando para ensayos de pruebas con animales. [59]
En un seguimiento, un artículo que describe 10 inhibidores de miniproteínas del SARS-CoV-2 se publicó en Science el 9 de septiembre. Dos de estos inhibidores, LCB1 y LCB3, son varias veces más potentes que los mejores anticuerpos monoclonales que se están desarrollando contra el SARS-CoV-2, tanto en términos de masa como de molar. Además, la investigación sugiere que estos inhibidores conservan su actividad a temperaturas elevadas, son 20 veces más pequeños que un anticuerpo y, por lo tanto, tienen 20 veces más sitios de neutralización potenciales, lo que aumenta la eficacia potencial de un fármaco administrado localmente. Se espera que el pequeño tamaño y la alta estabilidad de los inhibidores los hagan adecuados para una formulación de gel que se pueda aplicar por vía nasal o como un polvo para administrar directamente en el sistema respiratorio. Los investigadores trabajarán en el desarrollo de estos inhibidores en terapias y profilaxis en los próximos meses. [10] A julio de 2021, se preveía que estos candidatos antivirales comenzaran los ensayos clínicos a principios de 2022 y habían recibido financiación de la Fundación Bill y Melinda Gates para ensayos preclínicos y clínicos iniciales. [12] En ensayos de pruebas con animales, estos candidatos antivirales fueron eficaces contra variantes preocupantes, incluidas Alfa, Beta y Gamma. [12] [60] [61]
Rosetta@home se utilizó para ayudar a analizar más de 2 millones de proteínas de unión a la proteína Spike del SARS-CoV-2 que se diseñaron computacionalmente y, por lo tanto, contribuyeron a esta investigación. [62] [63]
Según el equipo Rosetta@home del Instituto de Diseño de Proteínas, los voluntarios de Rosetta@home contribuyeron al desarrollo de candidatos a fármacos antivirales [10] y a una vacuna de nanopartículas proteicas. [64] La vacuna IVX-411 ya se encuentra en un ensayo clínico de fase 1 a cargo de Icosavax [13], mientras que la misma vacuna, autorizada a otro fabricante y con el nombre GBP510, ha sido aprobada en Corea del Sur para un ensayo de fase III a cargo de SK Bioscience. [15] [14] Los candidatos a fármacos antivirales también están pasando a ensayos clínicos de fase 1. [9]
Los investigadores de Rosetta@home han diseñado un agonista del receptor de IL-2 llamado Neoleukin-2/15 que no interactúa con la subunidad alfa del receptor. Estas moléculas de señalización inmunitaria son útiles en el tratamiento del cáncer. Mientras que la IL-2 natural sufre toxicidad debido a una interacción con la subunidad alfa, la proteína diseñada es mucho más segura, al menos en modelos animales. [16] Rosetta@home contribuyó a los "experimentos de plegamiento hacia adelante" que ayudaron a validar los diseños. [18]
En un artículo de septiembre de 2020 en The New Yorker , David Baker afirmó que Neoleukin-2/15 comenzaría los ensayos clínicos en humanos "a finales de este año". Neoleukin-2/15 está siendo desarrollado por Neoleukin, una empresa derivada del laboratorio de Baker. [65] En diciembre de 2020, Neoleukin anunció que presentaría una solicitud de nuevo fármaco en investigación ante la Administración de Alimentos y Medicamentos para comenzar un ensayo clínico de fase 1 de NL-201, que es un desarrollo posterior de Neoleukin-2/15. Se presentó una solicitud similar en Australia y Neoleukin espera inscribir a 120 participantes en el ensayo clínico de fase 1. [66] El ensayo clínico en humanos de fase 1 comenzó el 5 de mayo de 2021. [17]
Rosetta es el software responsable de realizar predicciones de estructuras en Rosetta@home. Además de un clúster BOINC, Rosetta puede ejecutarse en una sola computadora local o en una supercomputadora local. Al igual que otros programas bioinformáticos, existen servidores públicos en línea que ofrecen ejecutar Rosetta desde una interfaz web. [71] El software tiene licencia gratuita para la comunidad académica y está disponible para las compañías farmacéuticas a cambio de una tarifa. [72]
Rosetta fue introducida originalmente por el laboratorio Baker de la Universidad de Washington en 1998 como un enfoque ab initio para la predicción de estructuras; desde entonces, se ha diversificado en varias corrientes de desarrollo y servicios distintos, proporcionando funciones como acoplamiento macromolecular y diseño de proteínas . [67] Muchos de los estudiantes de posgrado y otros investigadores involucrados en el desarrollo inicial de Rosetta se han mudado desde entonces a otras universidades e instituciones de investigación y, posteriormente, han mejorado diferentes partes del proyecto Rosetta.
La plataforma Rosetta deriva su nombre de la Piedra Rosetta , ya que intenta descifrar el "significado" estructural de las secuencias de aminoácidos de las proteínas. [73] El desarrollo del código Rosetta lo realiza Rosetta Commons. [72] Rosetta participa en CASP y CAPRI .
Rosetta fue reescrita en C++ para permitir un desarrollo más sencillo que el permitido por su versión original, que fue escrita en Fortran . Esta nueva versión está orientada a objetos y fue lanzada en Rosetta@Home el 8 de febrero de 2008. [21] [74]
RosettaDesign, un enfoque informático para el diseño de proteínas basado en Rosetta, comenzó en 2000 con un estudio para rediseñar la vía de plegamiento de la proteína G. [75] En 2002, RosettaDesign se utilizó para diseñar Top7 , una proteína α/β de 93 aminoácidos de longitud que tenía un plegamiento general nunca antes registrado en la naturaleza. Esta nueva conformación fue predicha por Rosetta con una precisión de 1,2 Å RMSD de la estructura determinada por cristalografía de rayos X , lo que representa una predicción de estructura inusualmente precisa. [76] Rosetta y RosettaDesign obtuvieron un amplio reconocimiento al ser los primeros en diseñar y predecir con precisión la estructura de una proteína novedosa de tal longitud, como se refleja en el artículo de 2002 que describe el enfoque dual que motivó dos cartas positivas en la revista Science , [77] [78] y ser citado por más de 240 otros artículos científicos. [79] El producto visible de esa investigación, Top7 , fue presentado como la "Molécula del mes" del RCSB PDB en octubre de 2006; [80] una superposición de los respectivos núcleos (residuos 60-79) de sus estructuras cristalinas predichas y de rayos X se presentan en el logotipo de Rosetta@home. [29]
Brian Kuhlman, ex asociado postdoctoral en el laboratorio de David Baker y ahora profesor asociado en la Universidad de Carolina del Norte, Chapel Hill , [81] ofrece RosettaDesign como un servicio en línea. [82]
RosettaDock se agregó al paquete de software Rosetta durante el primer experimento CAPRI en 2002 como el algoritmo del laboratorio Baker para la predicción del acoplamiento proteína-proteína . [83] En ese experimento, RosettaDock realizó una predicción de alta precisión para el acoplamiento entre la exotoxina piógena A estreptocócica y una cadena β del receptor de células T , y una predicción de precisión media para un complejo entre la α-amilasa porcina y un anticuerpo de camélido . Si bien el método RosettaDock solo realizó dos predicciones aceptablemente precisas de siete posibles, esto fue suficiente para ubicarlo en el séptimo lugar de diecinueve métodos de predicción en la primera evaluación CAPRI. [83]
El desarrollo de RosettaDock se dividió en dos ramas para las rondas CAPRI posteriores, ya que Jeffrey Gray, quien sentó las bases para RosettaDock mientras estaba en la Universidad de Washington , continuó trabajando en el método en su nuevo puesto en la Universidad Johns Hopkins . Los miembros del laboratorio Baker desarrollaron RosettaDock aún más en ausencia de Gray. Las dos versiones diferían ligeramente en el modelado de cadenas laterales, la selección de señuelos y otras áreas. [48] [84] A pesar de estas diferencias, tanto el método Baker como el de Gray tuvieron un buen desempeño en la segunda evaluación CAPRI, ubicándose en quinto y séptimo lugar respectivamente de 30 grupos de predictores. [85] El servidor RosettaDock de Jeffrey Gray está disponible como un servicio gratuito de predicción de acoplamiento para uso no comercial. [86]
En octubre de 2006, RosettaDock se integró en Rosetta@home. El método utilizó una fase de modelo de acoplamiento rápido y rudimentario utilizando solo la estructura principal de la proteína . A esto le siguió una fase de refinamiento lento de átomos completos en la que se optimizaron simultáneamente la orientación de las dos proteínas interactuantes entre sí y las interacciones de cadena lateral en la interfaz proteína-proteína para encontrar la conformación de energía más baja. [87] La gran mejora en la potencia de cálculo que ofrece la red Rosetta@home, combinada con representaciones revisadas de árboles de pliegues para la flexibilidad de la estructura principal y el modelado de bucles , hizo que RosettaDock quedara en sexto lugar entre 63 grupos de predicción en la tercera evaluación CAPRI. [6] [34]
El servidor Robetta (Rosetta Beta) es un servicio automatizado de predicción de la estructura de proteínas ofrecido por el laboratorio Baker para modelado comparativo y ab initio no comercial. [88] Ha participado como servidor de predicción automatizada en los experimentos bianuales CASP desde CASP5 en 2002, con un desempeño entre los mejores en la categoría de predicción de servidores automatizados. [89] Desde entonces, Robetta ha competido en CASP6 y 7, donde obtuvo mejores resultados que el promedio entre los grupos de servidores automatizados y predictores humanos. [32] [90] [91] También participa en la evaluación continua CAMEO3D . Las tareas de Robetta se ejecutan en servidores de laboratorio Baker, máquinas del campus de investigación Janelia y computadoras de los participantes de Rosetta@home. [88]
Para modelar la estructura de las proteínas a partir de CASP6, Robetta primero busca homólogos estructurales utilizando BLAST , PSI-BLAST y 3D-Jury , luego analiza la secuencia objetivo en sus dominios individuales , o unidades de proteínas que se pliegan independientemente, haciendo coincidir la secuencia con familias estructurales en la base de datos Pfam . Los dominios con homólogos estructurales luego siguen un protocolo de "modelo basado en plantillas" (es decir, modelado de homología ). Aquí, el programa de alineamiento interno del laboratorio Baker, K*sync, produce un grupo de homólogos de secuencia, y cada uno de estos se modela mediante el método de novo de Rosetta para producir un señuelo (posible estructura). La predicción de la estructura final se selecciona tomando el modelo de energía más baja según lo determinado por una función de energía de Rosetta de baja resolución. Para los dominios que no tienen homólogos estructurales detectados, se sigue un protocolo de novo en el que se selecciona el modelo de energía más baja de un conjunto de señuelos generados como predicción final. Estas predicciones de dominio se conectan entre sí para investigar las interacciones entre dominios de nivel terciario dentro de la proteína. Finalmente, las contribuciones de la cadena lateral se modelan utilizando un protocolo para la búsqueda conformacional de Monte Carlo . [92]
En CASP8, Robetta fue ampliado para utilizar el método de refinamiento de todos los átomos de alta resolución de Rosetta, [93] cuya ausencia fue citada como la causa principal de que Robetta fuera menos preciso que la red Rosetta@home en CASP7. [33] En CASP11, se agregó una forma de predecir el mapa de contacto de proteínas mediante la coevolución de residuos en proteínas relacionadas llamada GREMLIN, lo que permite más éxitos de plegamiento de novo . [94]
Rosetta está disponible como un servicio en línea desde varios otros servidores públicos. ROSIE ofrece una variedad de funciones, desde predicción y diseño de la estructura del ARN hasta acoplamiento de ligandos y modelado de anticuerpos. [95]
El 9 de mayo de 2008, después de que los usuarios de Rosetta@home sugirieran una versión interactiva del programa de computación voluntaria , el laboratorio Baker lanzó públicamente Foldit , un juego de predicción de la estructura de proteínas en línea basado en la plataforma Rosetta. [96] Al 25 de septiembre de 2008 [actualizar], Foldit tenía más de 59.000 usuarios registrados. [97] El juego ofrece a los usuarios un conjunto de controles (por ejemplo, agitar, menear, reconstruir) para manipular la estructura principal y las cadenas laterales de aminoácidos de la proteína objetivo en conformaciones energéticamente más favorables. Los usuarios pueden trabajar en soluciones individualmente como solistas o colectivamente como evolucionistas , acumulando puntos en cualquiera de las categorías a medida que mejoran sus predicciones de estructura. [98]
Foldit puede funcionar como una interfaz gráfica de usuario para Rosetta bajo un "modo profesional" personalizado. [71]
RoseTTAFold, que está inspirado en AlphaFold , utiliza una red neuronal para predecir la distancia y la orientación entre los residuos. Estas predicciones guían al software de Rosetta en la producción de una estructura. RoseTTAFold es de código abierto bajo la licencia MIT . [99]
El laboratorio Jianyi Yang en China ofrece una versión modificada de Rosetta denominada tr-RosettaX2 (Rosetta con restricción de transformación). [100] Utiliza un método de predicción de contacto basado en aprendizaje profundo diferente de RoseTTAFold para guiar el algoritmo de plegado de Rosetta habitual. trRosetta es anterior a RoseTTAFold. [101]
Hay varios proyectos computacionales voluntarios que tienen áreas de estudio similares a las de Rosetta@home, pero difieren en su enfoque de investigación:
De todos los principales proyectos de computación voluntarios involucrados en la investigación de proteínas, Folding@home es el único que no utiliza la plataforma BOINC . [102] [103] [104] Tanto Rosetta@home como Folding@home estudian enfermedades de plegamiento incorrecto de proteínas como la enfermedad de Alzheimer , pero Folding@home hace mucho más exclusivamente. [105] [106] Folding@home utiliza casi exclusivamente modelos de dinámica molecular de todos los átomos para entender cómo y por qué las proteínas se pliegan (o potencialmente se pliegan incorrectamente, y posteriormente se agregan para causar enfermedades). [107] [108] En otras palabras, la fortaleza de Folding@home es modelar el proceso de plegamiento de proteínas, mientras que la fortaleza de Rosetta@home es computar el diseño de proteínas y predecir la estructura y el acoplamiento de proteínas.
Algunos de los resultados de Rosetta@home se utilizan como base para algunos proyectos de Folding@home. Rosetta proporciona la estructura más probable, pero no se sabe con certeza si esa es la forma que adopta la molécula o si es viable o no. Folding@home puede utilizarse entonces para verificar los resultados de Rosetta@home y puede proporcionar información adicional a nivel atómico y detalles de cómo cambia de forma la molécula. [108] [109]
Los dos proyectos también difieren significativamente en su poder de cómputo y diversidad de host. Con un promedio de aproximadamente 6.650 tera FLOPS desde una base de host de unidades centrales de procesamiento (CPU), unidades de procesamiento gráfico (GPU) y (anteriormente) PS3 , [110] Folding@home tiene casi 108 veces más poder de cómputo que Rosetta@home. [111]
Tanto la Fase I como la Fase II del Proyecto de Plegado del Proteoma Humano (HPF), un subproyecto de World Community Grid , han utilizado el programa Rosetta para realizar anotaciones estructurales y funcionales de varios genomas . [112] [113] Aunque ahora lo utiliza para crear bases de datos para biólogos, Richard Bonneau , científico jefe del Proyecto de Plegado del Proteoma Humano, participó activamente en el desarrollo original de Rosetta en el laboratorio de David Baker mientras obtenía su doctorado. [114] Se puede encontrar más información sobre la relación entre HPF1, HPF2 y Rosetta@home en el sitio web de Richard Bonneau. [115]
Al igual que Rosetta@home, Predictor@home se especializó en la predicción de la estructura de proteínas. [116] Mientras que Rosetta@home utiliza el programa Rosetta para su predicción de estructura, Predictor@home utilizó la metodología dTASSER. [117] En 2009, Predictor@home cerró.
Otros proyectos de computación voluntaria relacionados con proteínas en BOINC incluyen QMC@home , Docking@home , POEM@home , SIMAP y TANPAKU . RALPH@home, el proyecto alfa de Rosetta@home que prueba nuevas versiones de aplicaciones, unidades de trabajo y actualizaciones antes de pasar a Rosetta@home, también se ejecuta en BOINC. [118]
Rosetta@home depende de la potencia informática donada por miembros individuales del proyecto para su investigación. Al 28 de marzo de 2020 [actualizar], alrededor de 53.000 usuarios de 150 países eran miembros activos de Rosetta@home, que en conjunto aportaban tiempo de procesador inactivo de alrededor de 54.800 computadoras para un rendimiento promedio combinado de más de 1,7 peta- FLOPS . [111] [119]
Los usuarios reciben créditos BOINC como medida de su contribución. El crédito otorgado por cada unidad de trabajo es la cantidad de señuelos producidos para esa unidad de trabajo multiplicada por el crédito promedio solicitado para los señuelos enviados por todos los hosts de computadora para esa unidad de trabajo. Este sistema personalizado fue diseñado para abordar las diferencias significativas entre el crédito otorgado a los usuarios con el cliente BOINC estándar y un cliente BOINC optimizado, y las diferencias de crédito entre los usuarios que ejecutan Rosetta@home en sistemas operativos Windows y Linux . [120] La cantidad de crédito otorgado por segundo de trabajo de CPU es menor para Rosetta@home que para la mayoría de los demás proyectos BOINC. [121] Rosetta@home ocupa el decimotercer lugar entre más de 40 proyectos BOINC en términos de crédito total. [122]
Los usuarios de Rosetta@home que predicen estructuras de proteínas enviadas para el experimento CASP son reconocidos en publicaciones científicas en relación con sus resultados. [33] Los usuarios que predicen la estructura de energía más baja para una unidad de trabajo dada aparecen en la página de inicio de Rosetta@home como Predictor del día , junto con cualquier equipo del que sean miembros. [123] Un Usuario del día es elegido aleatoriamente cada día para que también esté en la página de inicio, entre los usuarios que han creado un perfil de Rosetta@home. [124]
{{cite web}}
: CS1 maint: copia archivada como título ( enlace )Se llevó a cabo una gran cantidad de computación de acoplamiento para las predicciones de los objetivos 27 y 28 en Rosetta@Home (www.boinc.bakerlab.org), un proyecto de computación distribuida que ejecuta el software Rosetta en computadoras personales de voluntarios de todo el mundo utilizando la tecnología Berkeley Open Infrastructure for Network Computing (BOINC) (www.boinc.berkeley.edu).
No distribuimos archivos ejecutables ni binarios para la mayoría de los propósitos, distribuimos código fuente.
Los recursos informáticos son proporcionados por el laboratorio Baker, el Campus de Investigación Janelia del HHMI y por voluntarios del proyecto de computación distribuida Rosetta@home. Puedes ayudar a este servicio uniéndote a Rosetta@home.
{{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace )Servicios de Rosetta en línea