stringtranslate.com

Desafío SAMPL

SAMPL ( Statistical Assessment of the Modeling of Proteins and Ligands ) es un conjunto de desafíos ciegos para toda la comunidad destinados a promover técnicas computacionales como herramientas predictivas estándar en el diseño racional de fármacos . [1] [2] [3] [4] [5] Se ha seleccionado una amplia gama de sistemas biológicamente relevantes con diferentes tamaños y niveles de complejidad, incluidas proteínas , complejos huésped-huésped y pequeñas moléculas similares a fármacos, para probar los últimos métodos de modelado y campos de fuerza en SAMPL. Los nuevos datos experimentales, como la afinidad de unión y la energía libre de hidratación , se retienen de los participantes hasta la fecha límite de envío de predicciones, para que se pueda revelar el verdadero poder predictivo de los métodos. El desafío SAMPL5 más reciente contiene dos categorías de predicción: la afinidad de unión de los sistemas huésped-huésped y los coeficientes de distribución de moléculas similares a fármacos entre el agua y el ciclohexano. [6] [7] Desde 2008, la serie de desafíos SAMPL ha atraído el interés de los científicos involucrados en el campo del diseño de fármacos asistido por computadora (CADD) [8] [9] [10] Los organizadores actuales de SAMPL incluyen a John Chodera, Michael K. Gilson, David Mobley y Michael Shirts. [11]

Importancia del proyecto

El desafío SAMPL busca acelerar el progreso en el desarrollo de herramientas cuantitativas y precisas para el descubrimiento de fármacos, proporcionando validación prospectiva y comparaciones rigurosas para metodologías computacionales y campos de fuerza. Los métodos de diseño de fármacos asistidos por computadora han mejorado considerablemente con el tiempo, junto con el rápido crecimiento de las capacidades de computación de alto rendimiento. Sin embargo, su aplicabilidad en la industria farmacéutica aún es muy limitada, debido a la precisión insuficiente. Al carecer de validaciones prospectivas a gran escala, los métodos tienden a sufrir un ajuste excesivo de los datos experimentales preexistentes. Para superar esto, los desafíos SAMPL se han organizado como pruebas a ciegas: cada vez que se diseñan y recopilan nuevos conjuntos de datos cuidadosamente de laboratorios de investigación académicos o industriales, y las mediciones se publican poco después de la fecha límite de presentación de predicciones. Luego, los investigadores pueden comparar esos datos experimentales prospectivos de alta calidad con las estimaciones presentadas. Un énfasis clave está en las lecciones aprendidas, lo que permite que los participantes en futuros desafíos se beneficien de las mejoras de modelado realizadas en función de desafíos anteriores.

Históricamente, SAMPL se ha centrado en las propiedades de los sistemas huésped-huésped y de las moléculas pequeñas similares a fármacos. Estos sistemas de modelos simples requieren considerablemente menos recursos computacionales para simularse que los sistemas proteicos y, por lo tanto, convergen más rápidamente. Mediante un diseño cuidadoso, estos sistemas de modelos se pueden utilizar para centrarse en un desafío de simulación particular o en un subconjunto de desafíos de simulación. [ Se necesita más explicación ] [12] Los últimos desafíos de huésped-huésped, energía libre de hidratación y log D de SAMPL revelaron las limitaciones de los campos de fuerza generalizados, [13] [14] facilitaron el desarrollo de modelos de solventes, [15] [16] y destacaron la importancia de manejar adecuadamente los estados de protonación y los efectos de la sal. [17] [18]

Participación

La inscripción y la participación en los desafíos SAMPL son gratuitas. A partir de SAMPL7, los datos de participación en los desafíos se publicaron en el sitio web de SAMPL [19] , así como en la página de GitHub del desafío específico. Luego, las instrucciones, los archivos de entrada y los resultados se proporcionaron a través de GitHub (los desafíos anteriores proporcionaban contenido principalmente a través de D3R para SAMPL4-5, y a través de otros medios para los SAMPL anteriores). A los participantes se les permitió enviar múltiples predicciones a través del sitio web de D3R, ya sea de forma anónima o con afiliación a una investigación. Desde el desafío SAMPL2, todos los participantes han sido invitados a asistir a los talleres de SAMPL y enviar manuscritos para describir sus resultados. Después de un proceso de revisión por pares, los artículos resultantes, junto con los artículos de descripción general que resumen todos los datos enviados, se publicaron en los números especiales del Journal of Computer-Aided Molecular Design [20] .

Fondos

El proyecto SAMPL fue financiado recientemente por el NIH (subvención GM124270-01A1), para el período de septiembre de 2018 a agosto de 2022, para permitir el diseño de futuros desafíos SAMPL para impulsar avances en las áreas en las que son más necesarios para los esfuerzos de modelado. [9] [10] El esfuerzo está encabezado por David L. Mobley (UC Irvine) con los co-investigadores John D. Chodera (MSKCC), Bruce C. Gibb (Tulane) y Lyle Isaacs (Maryland). Actualmente, los desafíos y talleres se llevan a cabo en asociación con el Recurso de Datos de Diseño de Medicamentos financiado por el NIH, pero esto probablemente cambiará con el tiempo ya que la financiación para los dos proyectos no está acoplada.

La financiación también permitió ampliar el alcance de SAMPL; a través de SAMPL6, su función se había centrado principalmente en las propiedades físicas, con D3R manejando desafíos proteína-ligando. Sin embargo, el esfuerzo financiado amplió su enfoque para incluir sistemas que impulsarán mejoras en el modelado, incluidos sistemas proteína-ligando potencialmente adecuados. Esto sigue estando en contraste con D3R, que se basa en conjuntos de datos donados de interés farmacéutico, mientras que los desafíos de SAMPL están diseñados específicamente para centrarse en desafíos de modelado específicos.

Historia

Desafíos anteriores de SAMPL

El primer ejercicio SAMPL, SAMPL0 (2008) [21], se centró en las predicciones de energías libres de solvatación de 17 moléculas pequeñas. Un grupo de investigación de la Universidad de Stanford y científicos de OpenEye Scientific Software llevaron a cabo los cálculos. A pesar del formato informal, SAMPL0 sentó las bases para los siguientes desafíos SAMPL.

Los desafíos SAMPL1 (2009) [22] y SAMPL2 (2010) [1] fueron organizados por OpenEye y continuaron enfocándose en predecir energías libres de solvatación de moléculas pequeñas similares a fármacos. También se intentó predecir afinidades de unión, poses de unión y proporciones de tautómeros. Ambos desafíos atrajeron una participación significativa de científicos computacionales e investigadores del ámbito académico y de la industria.

SAMPL3 y SAMPL4

Los conjuntos de datos ciegos para las afinidades de unión entre huésped y anfitrión se introdujeron por primera vez en SAMPL3 (2011-2012), [3] junto con las energías libres de solvatación para moléculas pequeñas y los datos de afinidad de unión para 500 inhibidores de tirosina similares a fragmentos. Tres moléculas huésped eran todas de la familia de los cucurbiturilos . El desafío SAMPL3 recibió 103 propuestas de 23 grupos de investigación de todo el mundo. [2]

A diferencia de los tres eventos SAMPL anteriores, el ejercicio SAMPL4 (2013-2014) [4] [5] fue coordinado por investigadores académicos, con apoyo logístico de OpenEye. Los conjuntos de datos en SAMPL4 consistieron en afinidades de unión para sistemas huésped-huésped e inhibidores de la integrasa del VIH , así como energías libres de hidratación de moléculas pequeñas. Las moléculas huésped incluyeron cucurbitáceas[7]uril (CB7) y octaácido. El desafío de hidratación SAMPL4 involucró 49 presentaciones de 19 grupos. La participación en el desafío huésped-huésped también creció significativamente en comparación con SAMPL3. El taller se llevó a cabo en la Universidad de Stanford en septiembre de 2013.

MUESTRA5

Los desafíos proteína-ligando se separaron de SAMPL en SAMPL5 (2015-2016) [6] [7] y se distribuyeron como los nuevos Grandes Desafíos del Recurso de Datos de Diseño de Fármacos (D3R). [23] SAMPL5 permitió a los participantes hacer predicciones de las afinidades de unión de tres conjuntos de sistemas huésped-huésped: un derivado acíclico de CB7 y dos huéspedes de la familia de los octaácidos. También se alentó a los participantes a enviar predicciones para las entalpías de unión. Se probó una amplia gama de métodos computacionales, incluida la teoría funcional de la densidad (DFT), la dinámica molecular , el acoplamiento y la metadinámica. Las predicciones del coeficiente de distribución se introdujeron por primera vez, recibiendo un total de 76 presentaciones de 18 grupos de investigadores o científicos para un conjunto de 53 moléculas pequeñas. El taller se llevó a cabo en marzo de 2016 en la Universidad de California, San Diego, como parte del taller D3R. Los métodos de mejor desempeño en el desafío anfitrión-huésped produjeron correlaciones alentadoras aunque imperfectas con los datos experimentales, acompañadas de grandes cambios sistemáticos en relación con el experimento. [24] [25]

MUESTRA6

Los sistemas de prueba de SAMPL6 incluyen cucurbit[8]uril , octaácido, tetra-endo-metil octaácido y una serie de moléculas pequeñas similares a fragmentos. Los desafíos de predicción de pKa, muestreo conformacional y anfitrión-huésped de SAMPL6 ahora están cerrados. El taller de SAMPL6 se realizó conjuntamente con el taller de D3R en febrero de 2018 en la Institución Scripps de Oceanografía [26] y una edición especial de SAMPL del Journal of Computer Aided Molecular Design informó muchos de los resultados. Un desafío de SAMPL6 Parte II se centró en un pequeño conjunto de predicción de coeficientes de partición octanol-agua y fue seguido por un taller virtual el 16 de mayo de 2019 y un taller conjunto D3R/SAMPL en San Diego en agosto de 2019. Se planea una edición especial o una sección especial de JCAMD para informar los resultados. [ necesita actualización ] Las entradas y los resultados de SAMPL6 están disponibles a través del repositorio de GitHub de SAMPL6.

MUESTRA7

SAMPL7 volvió a incluir desafíos de anfitrión-huésped y un desafío de propiedades físicas. También se incluyó un desafío de unión proteína-ligando en fragmentos de PHIPA. La unión anfitrión-huésped se centró en varias moléculas pequeñas que se unen a octaácidos y exo-octaácidos; la unión de dos compuestos a una serie de derivados de ciclodextrina; y la unión de una serie de moléculas pequeñas a un huésped tipo clip conocido como TrimerTrip. Se llevó a cabo un taller virtual de SAMPL7 y está disponible en línea. Actualmente se está llevando a cabo un desafío de propiedades físicas de SAMPL7. Los planes para un taller presencial de EuroSAMPL en el otoño de 2020 se vieron frustrados por la COVID-19 y el taller se está llevando a cabo de forma virtual. Las aportaciones de SAMPL7 y (a medida que se completan los componentes del desafío, los resultados) están disponibles a través del repositorio de GitHub de SAMPL6.

MUESTRA8

SAMPL8 incluyó componentes host-guest en la unión de drogas de abuso a CB8 y una serie de moléculas pequeñas a Cavitandos de Cavidad Profunda de Gibb (GDCCs), como se detalla en el repositorio de GitHub de SAMPL8. Un desafío adicional de pKa y logD se centró en la predicción de pK y logD para una serie de moléculas similares a drogas.

MUESTRA9

SAMPL9 se encuentra en etapas de planificación, excepto que actualmente se está llevando a cabo un desafío host-guest de SAMPL9 en un host del grupo de Lyle Isaacs. Los detalles están disponibles en el repositorio de GitHub de SAMPL9

Números especiales de SAMPL

Publicaciones SAMPL

Los organizadores de SAMPL mantienen una lista relativamente completa de publicaciones relacionadas con SAMPL; se han publicado más de 150 artículos relacionados.

Desafíos futuros

Está previsto que SAMPL siga centrándose en la predicción de propiedades físicas, incluidos los valores logP y logD, la predicción de pKa, la unión huésped-anfitrión y otras propiedades, así como la ampliación para incluir un componente proteína-ligando. [9] Está previsto que algunos datos sean recopilados directamente por los coinvestigadores de SAMPL (Chodera, Gibb e Isaacs), pero también se proponen asociaciones y pasantías en la industria. [9]

Véase también

Referencias

  1. ^ ab Geballe, Matthew T.; Skillman, A. Geoffrey; Nicholls, Anthony; Guthrie, J. Peter; Taylor, Peter J. (9 de mayo de 2010). "El desafío de predicción a ciegas de SAMPL2: introducción y descripción general". Journal of Computer-Aided Molecular Design . 24 (4): 259–279. Bibcode :2010JCAMD..24..259G. doi :10.1007/s10822-010-9350-8. ISSN  0920-654X. PMID  20455007. S2CID  12363968.
  2. ^ ab Skillman, A. Geoffrey (24 de mayo de 2012). "SAMPL3: predicción ciega de las afinidades de unión entre el huésped y el anfitrión, las energías libres de hidratación y los inhibidores de tripsina". Revista de diseño molecular asistido por ordenador . 26 (5): 473–474. Bibcode :2012JCAMD..26..473S. doi :10.1007/s10822-012-9580-z. ISSN  0920-654X. PMID  22622621. S2CID  8335429.
  3. ^ ab Muddana, Hari S.; Varnado, C. Daniel; Bielawski, Christopher W .; Urbach, Adam R.; Isaacs, Lyle; Geballe, Matthew T.; Gilson, Michael K. (25 de febrero de 2012). "Predicción a ciegas de las afinidades de unión entre anfitrión y huésped: un nuevo desafío para SAMPL3". Journal of Computer-Aided Molecular Design . 26 (5): 475–487. Bibcode :2012JCAMD..26..475M. doi :10.1007/s10822-012-9554-1. ISSN  0920-654X. PMC 3383923 . PMID  22366955. 
  4. ^ ab Muddana, Hari S.; Fenley, Andrew T.; Mobley, David L.; Gilson, Michael K. (6 de marzo de 2014). "El desafío de la predicción ciega de anfitrión-huésped de SAMPL4: una descripción general". Journal of Computer-Aided Molecular Design . 28 (4): 305–317. Bibcode :2014JCAMD..28..305M. doi :10.1007/s10822-014-9735-1. ISSN  0920-654X. PMC 4053502 . PMID  24599514. 
  5. ^ ab Mobley, David L.; Wymer, Karisa L.; Lim, Nathan M.; Guthrie, J. Peter (11 de marzo de 2014). "Predicción a ciegas de energías libres de solvatación a partir del desafío SAMPL4". Revista de diseño molecular asistido por computadora . 28 (3): 135–150. Código Bibliográfico :2014JCAMD..28..135M. doi :10.1007/s10822-014-9718-2. ISSN  0920-654X. PMC 4006301 . PMID  24615156. 
  6. ^ ab Yin, Jian; Henriksen, Niel M.; Slochower, David R.; Shirts, Michael R.; Chiu, Michael W.; Mobley, David L.; Gilson, Michael K. (22 de septiembre de 2016). "Descripción general del desafío anfitrión-huésped de SAMPL5: ¿lo estamos haciendo mejor?". Journal of Computer-Aided Molecular Design . 31 (1): 1–19. doi :10.1007/s10822-016-9974-4. ISSN  0920-654X. PMC 5241188 . PMID  27658802. 
  7. ^ ab Bannan, Caitlin C.; Burley, Kalistyn H.; Chiu, Michael; Shirts, Michael R.; Gilson, Michael K.; Mobley, David L. (27 de septiembre de 2016). "Predicción a ciegas de los coeficientes de distribución de ciclohexano-agua a partir del desafío SAMPL5". Journal of Computer-Aided Molecular Design . 30 (11): 927–944. Bibcode :2016JCAMD..30..927B. doi :10.1007/s10822-016-9954-8. ISSN  0920-654X. PMC 5209301 . PMID  27677750. 
  8. ^ L, Mobley, David; D, Chodera, John; K, Gilson, Michael (21 de junio de 2017). "Resultados de la encuesta de la Hoja de ruta de 2017 de la comunidad de desafío de la Evaluación estadística del modelado de proteínas y ligandos (SAMPL)". EScholarship .{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
  9. ^ abcd Mobley, David L.; Chodera, John D.; Isaacs, Lyle; Gibb, Bruce C. (2016). "Avanzando en el modelado predictivo a través del desarrollo enfocado de sistemas de modelos para impulsar nuevas innovaciones en modelado". Zenodo . doi :10.5281/zenodo.163963.
  10. ^ ab Mobley, David L. (5 de octubre de 2016). "Avanzar en el modelado predictivo mediante el desarrollo enfocado de sistemas de modelos para impulsar nuevas innovaciones en modelado". eScholarship.
  11. ^ "D3R | MUESTRA".
  12. ^ Mobley, David L.; Gilson, Michael K. (8 de diciembre de 2016). "Predicción de energías libres de enlace: fronteras y puntos de referencia". bioRxiv 10.1101/074625 . 
  13. ^ Muddana, Hari S.; Gilson, Michael K. (25 de enero de 2012). "Predicción de las afinidades de unión entre el huésped y el anfitrión de SAMPL3: evaluación de la precisión de los campos de fuerza generalizados". Journal of Computer-Aided Molecular Design . 26 (5): 517–525. Bibcode :2012JCAMD..26..517M. doi :10.1007/s10822-012-9544-3. ISSN  0920-654X. PMC 3383906 . PMID  22274835. 
  14. ^ Mobley, David L.; Liu, Shaui; Cerutti, David S.; Swope, William C.; Rice, Julia E. (24 de diciembre de 2011). "Predicción alquímica de energías libres de hidratación para SAMPL". Revista de diseño molecular asistido por computadora . 26 (5): 551–562. doi :10.1007/s10822-011-9528-8. ISSN  0920-654X. PMC 3583515 . PMID  22198475. 
  15. ^ Pal, Rajat Kumar; Haider, Kamran; Kaur, Divya; Flynn, William; Xia, Junchao; Levy, Ronald M.; Taran, Tetiana ; Wickstrom, Lauren; Kurtzman, Tom; Gallicchio, Emilio (30 de septiembre de 2016). "Un tratamiento combinado de hidratación y efectos dinámicos para el modelado de la termodinámica de la unión anfitrión-huésped: el desafío ciego SAMPL5". Revista de diseño molecular asistido por computadora . 31 (1): 29–44. doi :10.1007/s10822-016-9956-6. ISSN  0920-654X. PMC 5477994 . PMID  27696239. 
  16. ^ Brini, Emiliano; Paranahewage, S. Shanaka; Fennell, Christopher J.; Dill, Ken A. (8 de septiembre de 2016). "Adaptación del modelo de solvatación de ensamblaje semiexplícito para estimar la partición de agua-ciclohexano con las moléculas SAMPL5". Journal of Computer-Aided Molecular Design . 30 (11): 1067–1077. Bibcode :2016JCAMD..30.1067B. doi :10.1007/s10822-016-9961-9. ISSN  0920-654X. PMC 5261860 . PMID  27632227. 
  17. ^ Sure, Rebecca; Antony, Jens; Grimme, Stefan (27 de marzo de 2014). "Predicción a ciegas de las afinidades de unión para sistemas huésped-anfitrión supramoleculares cargados: logros y deficiencias de DFT-D3". The Journal of Physical Chemistry B . 118 (12): 3431–3440. doi :10.1021/jp411616b. ISSN  1520-6106. PMID  24588346.
  18. ^ Klamt, Andreas; Eckert, Frank; Reinisch, Jens; Wichmann, Karin (26 de julio de 2016). "Predicción de coeficientes de distribución de ciclohexano-agua con COSMO-RS en el conjunto de datos SAMPL5". Journal of Computer-Aided Molecular Design . 30 (11): 959–967. Bibcode :2016JCAMD..30..959K. doi :10.1007/s10822-016-9927-y. ISSN  0920-654X. PMID  27460058. S2CID  33238269.
  19. ^ "SAMPL | Desafíos". samplchallenges.github.io . Consultado el 3 de julio de 2020 .
  20. ^ "Journal of Computer-Aided Molecular Design - Todos los volúmenes y números - Springer". link.springer.com . Consultado el 12 de enero de 2017 .
  21. ^ Nicholls, Anthony; Mobley, David L.; Guthrie, J. Peter; Chodera, John D.; Bayly, Christopher I.; Cooper, Matthew D.; Pande, Vijay S. (1 de febrero de 2008). "Predicción de energías libres de solvatación de moléculas pequeñas: una prueba ciega informal para química computacional". Revista de química medicinal . 51 (4): 769–779. doi :10.1021/jm070549+. ISSN  0022-2623. PMID  18215013. S2CID  35414610.
  22. ^ Guthrie, J. Peter (9 de abril de 2009). "Un desafío ciego para las energías libres de solvatación computacional: Introducción y descripción general" . The Journal of Physical Chemistry B. 113 ( 14): 4501–4507. doi :10.1021/jp806724u. ISSN  1520-6106. PMID  19338360.
  23. ^ Gathiaka, Symon; Liu, Shuai; Chiu, Michael; Yang, Huanwang; Stuckey, Jeanne A.; Kang, You Na; Delproposto, Jim; Kubish, Ginger; Dunbar, James B. (30 de septiembre de 2016). "Gran desafío D3R 2015: evaluación de la posición proteína-ligando y predicciones de afinidad". Revista de diseño molecular asistido por computadora . 30 (9): 651–668. Código Bibliográfico :2016JCAMD..30..651G. doi :10.1007/s10822-016-9946-8. ISSN  0920-654X. PMC 5562487 . PMID  27696240. 
  24. ^ Yin, Jian; Henriksen, Niel M.; Slochower, David R.; Gilson, Michael K. (16 de septiembre de 2016). "El desafío anfitrión-huésped de SAMPL5: cálculo de energías libres de enlace y entalpías a partir de simulaciones explícitas de solventes mediante el método de unión-extracción-liberación (APR)". Revista de diseño molecular asistido por computadora . 31 (1): 133–145. doi :10.1007/s10822-016-9970-8. ISSN  0920-654X. PMC 5241238 . PMID  27638809. 
  25. ^ Bosisio, Stefano; Mey, Antonia SJS; Michel, Julien (8 de agosto de 2016). "Predicciones ciegas de las energías libres estándar de enlace anfitrión-huésped en el desafío SAMPL5" (PDF) . Revista de diseño molecular asistido por computadora . 31 (1): 61–70. doi :10.1007/s10822-016-9933-0. ISSN  0920-654X. PMID  27503495. S2CID  31110594.
  26. ^ "Taller D3R 2018". D3R . 2018-02-22 . Consultado el 2022-03-27 .

Enlaces externos