SAMPL ( Statistical Assessment of the Modeling of Proteins and Ligands ) es un conjunto de desafíos ciegos para toda la comunidad destinados a promover técnicas computacionales como herramientas predictivas estándar en el diseño racional de fármacos . [1] [2] [3] [4] [5] Se ha seleccionado una amplia gama de sistemas biológicamente relevantes con diferentes tamaños y niveles de complejidad, incluidas proteínas , complejos huésped-huésped y pequeñas moléculas similares a fármacos, para probar los últimos métodos de modelado y campos de fuerza en SAMPL. Los nuevos datos experimentales, como la afinidad de unión y la energía libre de hidratación , se retienen de los participantes hasta la fecha límite de envío de predicciones, para que se pueda revelar el verdadero poder predictivo de los métodos. El desafío SAMPL5 más reciente contiene dos categorías de predicción: la afinidad de unión de los sistemas huésped-huésped y los coeficientes de distribución de moléculas similares a fármacos entre el agua y el ciclohexano. [6] [7] Desde 2008, la serie de desafíos SAMPL ha atraído el interés de los científicos involucrados en el campo del diseño de fármacos asistido por computadora (CADD) [8] [9] [10] Los organizadores actuales de SAMPL incluyen a John Chodera, Michael K. Gilson, David Mobley y Michael Shirts. [11]
El desafío SAMPL busca acelerar el progreso en el desarrollo de herramientas cuantitativas y precisas para el descubrimiento de fármacos, proporcionando validación prospectiva y comparaciones rigurosas para metodologías computacionales y campos de fuerza. Los métodos de diseño de fármacos asistidos por computadora han mejorado considerablemente con el tiempo, junto con el rápido crecimiento de las capacidades de computación de alto rendimiento. Sin embargo, su aplicabilidad en la industria farmacéutica aún es muy limitada, debido a la precisión insuficiente. Al carecer de validaciones prospectivas a gran escala, los métodos tienden a sufrir un ajuste excesivo de los datos experimentales preexistentes. Para superar esto, los desafíos SAMPL se han organizado como pruebas a ciegas: cada vez que se diseñan y recopilan nuevos conjuntos de datos cuidadosamente de laboratorios de investigación académicos o industriales, y las mediciones se publican poco después de la fecha límite de presentación de predicciones. Luego, los investigadores pueden comparar esos datos experimentales prospectivos de alta calidad con las estimaciones presentadas. Un énfasis clave está en las lecciones aprendidas, lo que permite que los participantes en futuros desafíos se beneficien de las mejoras de modelado realizadas en función de desafíos anteriores.
Históricamente, SAMPL se ha centrado en las propiedades de los sistemas huésped-huésped y de las moléculas pequeñas similares a fármacos. Estos sistemas de modelos simples requieren considerablemente menos recursos computacionales para simularse que los sistemas proteicos y, por lo tanto, convergen más rápidamente. Mediante un diseño cuidadoso, estos sistemas de modelos se pueden utilizar para centrarse en un desafío de simulación particular o en un subconjunto de desafíos de simulación. [ Se necesita más explicación ] [12] Los últimos desafíos de huésped-huésped, energía libre de hidratación y log D de SAMPL revelaron las limitaciones de los campos de fuerza generalizados, [13] [14] facilitaron el desarrollo de modelos de solventes, [15] [16] y destacaron la importancia de manejar adecuadamente los estados de protonación y los efectos de la sal. [17] [18]
La inscripción y la participación en los desafíos SAMPL son gratuitas. A partir de SAMPL7, los datos de participación en los desafíos se publicaron en el sitio web de SAMPL [19] , así como en la página de GitHub del desafío específico. Luego, las instrucciones, los archivos de entrada y los resultados se proporcionaron a través de GitHub (los desafíos anteriores proporcionaban contenido principalmente a través de D3R para SAMPL4-5, y a través de otros medios para los SAMPL anteriores). A los participantes se les permitió enviar múltiples predicciones a través del sitio web de D3R, ya sea de forma anónima o con afiliación a una investigación. Desde el desafío SAMPL2, todos los participantes han sido invitados a asistir a los talleres de SAMPL y enviar manuscritos para describir sus resultados. Después de un proceso de revisión por pares, los artículos resultantes, junto con los artículos de descripción general que resumen todos los datos enviados, se publicaron en los números especiales del Journal of Computer-Aided Molecular Design [20] .
El proyecto SAMPL fue financiado recientemente por el NIH (subvención GM124270-01A1), para el período de septiembre de 2018 a agosto de 2022, para permitir el diseño de futuros desafíos SAMPL para impulsar avances en las áreas en las que son más necesarios para los esfuerzos de modelado. [9] [10] El esfuerzo está encabezado por David L. Mobley (UC Irvine) con los co-investigadores John D. Chodera (MSKCC), Bruce C. Gibb (Tulane) y Lyle Isaacs (Maryland). Actualmente, los desafíos y talleres se llevan a cabo en asociación con el Recurso de Datos de Diseño de Medicamentos financiado por el NIH, pero esto probablemente cambiará con el tiempo ya que la financiación para los dos proyectos no está acoplada.
La financiación también permitió ampliar el alcance de SAMPL; a través de SAMPL6, su función se había centrado principalmente en las propiedades físicas, con D3R manejando desafíos proteína-ligando. Sin embargo, el esfuerzo financiado amplió su enfoque para incluir sistemas que impulsarán mejoras en el modelado, incluidos sistemas proteína-ligando potencialmente adecuados. Esto sigue estando en contraste con D3R, que se basa en conjuntos de datos donados de interés farmacéutico, mientras que los desafíos de SAMPL están diseñados específicamente para centrarse en desafíos de modelado específicos.
El primer ejercicio SAMPL, SAMPL0 (2008) [21], se centró en las predicciones de energías libres de solvatación de 17 moléculas pequeñas. Un grupo de investigación de la Universidad de Stanford y científicos de OpenEye Scientific Software llevaron a cabo los cálculos. A pesar del formato informal, SAMPL0 sentó las bases para los siguientes desafíos SAMPL.
Los desafíos SAMPL1 (2009) [22] y SAMPL2 (2010) [1] fueron organizados por OpenEye y continuaron centrándose en predecir las energías libres de solvatación de pequeñas moléculas similares a fármacos. También se intentó predecir las afinidades de unión, las poses de unión y las proporciones de tautómeros. Ambos desafíos atrajeron una participación significativa de científicos computacionales e investigadores del ámbito académico y de la industria.
Los conjuntos de datos ciegos para las afinidades de unión entre huésped y anfitrión se introdujeron por primera vez en SAMPL3 (2011-2012), [3] junto con las energías libres de solvatación para moléculas pequeñas y los datos de afinidad de unión para 500 inhibidores de tirosina similares a fragmentos. Tres moléculas huésped eran todas de la familia de los cucurbiturilos . El desafío SAMPL3 recibió 103 propuestas de 23 grupos de investigación de todo el mundo. [2]
A diferencia de los tres eventos SAMPL anteriores, el ejercicio SAMPL4 (2013-2014) [4] [5] fue coordinado por investigadores académicos, con apoyo logístico de OpenEye. Los conjuntos de datos en SAMPL4 consistieron en afinidades de unión para sistemas huésped-huésped e inhibidores de la integrasa del VIH , así como energías libres de hidratación de moléculas pequeñas. Las moléculas huésped incluyeron cucurbitáceas[7]uril (CB7) y octaácido. El desafío de hidratación SAMPL4 involucró 49 presentaciones de 19 grupos. La participación en el desafío huésped-huésped también creció significativamente en comparación con SAMPL3. El taller se llevó a cabo en la Universidad de Stanford en septiembre de 2013.
Los desafíos proteína-ligando se separaron de SAMPL en SAMPL5 (2015-2016) [6] [7] y se distribuyeron como los nuevos Grandes Desafíos del Recurso de Datos de Diseño de Fármacos (D3R). [23] SAMPL5 permitió a los participantes hacer predicciones de las afinidades de unión de tres conjuntos de sistemas huésped-huésped: un derivado acíclico de CB7 y dos huéspedes de la familia de los octaácidos. También se alentó a los participantes a enviar predicciones para las entalpías de unión. Se probó una amplia gama de métodos computacionales, incluida la teoría funcional de la densidad (DFT), la dinámica molecular , el acoplamiento y la metadinámica. Las predicciones del coeficiente de distribución se introdujeron por primera vez, recibiendo un total de 76 presentaciones de 18 grupos de investigadores o científicos para un conjunto de 53 moléculas pequeñas. El taller se llevó a cabo en marzo de 2016 en la Universidad de California, San Diego, como parte del taller D3R. Los métodos de mejor desempeño en el desafío anfitrión-huésped produjeron correlaciones alentadoras aunque imperfectas con los datos experimentales, acompañadas de grandes cambios sistemáticos en relación con el experimento. [24] [25]
Los sistemas de prueba de SAMPL6 incluyen cucurbit[8]uril , octaácido, tetra-endo-metil octaácido y una serie de moléculas pequeñas similares a fragmentos. Los desafíos de predicción de pKa, muestreo conformacional y anfitrión-huésped de SAMPL6 ahora están cerrados. El taller de SAMPL6 se realizó conjuntamente con el taller de D3R en febrero de 2018 en la Institución Scripps de Oceanografía [26] y una edición especial de SAMPL del Journal of Computer Aided Molecular Design informó muchos de los resultados. Un desafío de SAMPL6 Parte II se centró en un pequeño conjunto de predicción de coeficientes de partición octanol-agua y fue seguido por un taller virtual el 16 de mayo de 2019 y un taller conjunto D3R/SAMPL en San Diego en agosto de 2019. Se planea una edición especial o una sección especial de JCAMD para informar los resultados. [ necesita actualización ] Las entradas y los resultados de SAMPL6 están disponibles a través del repositorio de GitHub de SAMPL6.
SAMPL7 volvió a incluir desafíos de anfitrión-huésped y un desafío de propiedades físicas. También se incluyó un desafío de unión proteína-ligando en fragmentos de PHIPA. La unión anfitrión-huésped se centró en varias moléculas pequeñas que se unen a octaácidos y exo-octaácidos; la unión de dos compuestos a una serie de derivados de ciclodextrina; y la unión de una serie de moléculas pequeñas a un huésped tipo clip conocido como TrimerTrip. Se llevó a cabo un taller virtual de SAMPL7 y está disponible en línea. Actualmente se está llevando a cabo un desafío de propiedades físicas de SAMPL7. Los planes para un taller presencial de EuroSAMPL en el otoño de 2020 se vieron frustrados por la COVID-19 y el taller se está llevando a cabo de forma virtual. Las aportaciones de SAMPL7 y (a medida que se completan los componentes del desafío, los resultados) están disponibles a través del repositorio de GitHub de SAMPL6.
SAMPL8 incluyó componentes host-guest en la unión de drogas de abuso a CB8 y una serie de moléculas pequeñas a Cavitandos de Cavidad Profunda de Gibb (GDCCs), como se detalla en el repositorio de GitHub de SAMPL8. Un desafío adicional de pKa y logD se centró en la predicción de pK y logD para una serie de moléculas similares a drogas.
SAMPL9 se encuentra en etapas de planificación, excepto que actualmente se está llevando a cabo un desafío host-guest de SAMPL9 en un host del grupo de Lyle Isaacs. Los detalles están disponibles en el repositorio de GitHub de SAMPL9
Los organizadores de SAMPL mantienen una lista relativamente completa de publicaciones relacionadas con SAMPL; se han publicado más de 150 artículos relacionados.
Está previsto que SAMPL siga centrándose en la predicción de propiedades físicas, incluidos los valores logP y logD, la predicción de pKa, la unión huésped-anfitrión y otras propiedades, así como la ampliación para incluir un componente proteína-ligando. [9] Está previsto que algunos datos sean recopilados directamente por los coinvestigadores de SAMPL (Chodera, Gibb e Isaacs), pero también se proponen asociaciones y pasantías en la industria. [9]
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )