stringtranslate.com

Relación cuantitativa estructura-actividad

Los modelos cuantitativos de relación estructura-actividad ( modelos QSAR ) son modelos de regresión o clasificación que se utilizan en las ciencias químicas y biológicas y en la ingeniería. Al igual que otros modelos de regresión, los modelos de regresión QSAR relacionan un conjunto de variables "predictoras" (X) con la potencia de la variable de respuesta (Y), mientras que los modelos QSAR de clasificación relacionan las variables predictoras con un valor categórico de la variable de respuesta.

En el modelado QSAR, los predictores consisten en propiedades físico-químicas o descriptores moleculares teóricos [1] [2] de sustancias químicas; la variable de respuesta QSAR podría ser una actividad biológica de las sustancias químicas. Los modelos QSAR primero resumen una supuesta relación entre las estructuras químicas y la actividad biológica en un conjunto de datos de sustancias químicas. En segundo lugar, los modelos QSAR predicen las actividades de nuevas sustancias químicas. [3] [4]

Los términos relacionados incluyen relaciones cuantitativas estructura-propiedad ( QSPR ) cuando una propiedad química se modela como la variable de respuesta. [5] [6] "Se han investigado diferentes propiedades o comportamientos de moléculas químicas en el campo de QSPR. Algunos ejemplos son las relaciones cuantitativas estructura-reactividad (QSRR), las relaciones cuantitativas estructura-cromatografía (QSCR) y las relaciones cuantitativas estructura-toxicidad (QSTR), las relaciones cuantitativas estructura-electroquímica (QSER) y las relaciones cuantitativas estructura- biodegradabilidad (QSBR)". [7]

Por ejemplo, la actividad biológica se puede expresar cuantitativamente como la concentración de una sustancia necesaria para dar una determinada respuesta biológica. Además, cuando las propiedades o estructuras fisicoquímicas se expresan mediante números, se puede encontrar una relación matemática, o una relación cuantitativa estructura-actividad, entre ambas. La expresión matemática, si se valida cuidadosamente, [8] [9] [10] [11] se puede utilizar para predecir la respuesta modelada de otras estructuras químicas. [12]

Un QSAR tiene la forma de un modelo matemático :

El error incluye el error del modelo ( sesgo ) y la variabilidad observacional, es decir, la variabilidad de las observaciones incluso en un modelo correcto.

Pasos esenciales en los estudios QSAR

Los pasos principales del QSAR/QSPR incluyen: [7]

  1. Selección de conjunto de datos y extracción de descriptores estructurales/empíricos
  2. Selección de variables
  3. Construcción de modelos
  4. Evaluación de validación

SAR y la paradoja SAR

El supuesto básico de todas las hipótesis basadas en moléculas es que moléculas similares tienen actividades similares. Este principio también se denomina relación estructura-actividad ( SAR ). El problema subyacente es, por tanto, cómo definir una pequeña diferencia a nivel molecular, ya que cada tipo de actividad, por ejemplo, capacidad de reacción , capacidad de biotransformación , solubilidad , actividad diana, etc., podría depender de otra diferencia. Se dieron ejemplos en las revisiones del bioisosterismo de Patanie/LaVoie [13] y Brown. [14]

En general, uno está más interesado en encontrar tendencias fuertes. Las hipótesis creadas generalmente se basan en un número finito de sustancias químicas, por lo que se debe tener cuidado para evitar el sobreajuste : la generación de hipótesis que se ajustan muy bien a los datos de entrenamiento pero que funcionan mal cuando se aplican a datos nuevos.

La paradoja SAR se refiere al hecho de que no es el caso que todas las moléculas similares tengan actividades similares [ cita requerida ] .

Tipos

Basado en fragmentos (contribución grupal)

De manera análoga, el " coeficiente de partición " (una medida de la solubilidad diferencial y en sí misma un componente de las predicciones de QSAR) se puede predecir mediante métodos atómicos (conocidos como "XLogP" o "ALogP") o mediante métodos de fragmentos químicos (conocidos como "CLogP" y otras variaciones). Se ha demostrado que el logP de un compuesto se puede determinar mediante la suma de sus fragmentos; los métodos basados ​​en fragmentos se aceptan generalmente como mejores predictores que los métodos basados ​​en átomos. [15] Los valores fragmentarios se han determinado estadísticamente, basándose en datos empíricos para valores de logP conocidos. Este método arroja resultados mixtos y, en general, no se confía en que tenga una precisión de más de ±0,1 unidades. [16]

El QSAR basado en grupos o fragmentos también se conoce como GQSAR. [17] El GQSAR permite la flexibilidad para estudiar varios fragmentos moleculares de interés en relación con la variación en la respuesta biológica. Los fragmentos moleculares podrían ser sustituyentes en varios sitios de sustitución en un conjunto congenérico de moléculas o podrían basarse en reglas químicas predefinidas en el caso de conjuntos no congenéricos. El GQSAR también considera descriptores de fragmentos de términos cruzados, que podrían ser útiles en la identificación de interacciones clave de fragmentos para determinar la variación de la actividad. [17] El descubrimiento de pistas mediante fragnomics es un paradigma emergente. En este contexto, el FB-QSAR demuestra ser una estrategia prometedora para el diseño de bibliotecas de fragmentos y en los esfuerzos de identificación de fragmentos a pistas. [18]

Se ha desarrollado un enfoque avanzado sobre QSAR basado en fragmentos o grupos, basado en el concepto de similitud de farmacóforos. [19] Este método, QSAR basado en similitud de farmacóforos (PS-QSAR), utiliza descriptores farmacofóricos topológicos para desarrollar modelos QSAR. Esta predicción de la actividad puede ayudar a la contribución de ciertas características de los farmacóforos codificadas por los respectivos fragmentos hacia la mejora de la actividad y/o los efectos perjudiciales. [19]

SAR-3D

El acrónimo 3D-QSAR o 3-D QSAR se refiere a la aplicación de cálculos de campos de fuerza que requieren estructuras tridimensionales de un conjunto dado de moléculas pequeñas con actividades conocidas (conjunto de entrenamiento). El conjunto de entrenamiento debe superponerse (alinearse) con datos experimentales (por ejemplo, basados ​​en cristalografía de ligando-proteína ) o software de superposición de moléculas . Utiliza potenciales calculados, por ejemplo, el potencial de Lennard-Jones , en lugar de constantes experimentales y se ocupa de la molécula general en lugar de un solo sustituyente. El primer QSAR 3-D fue llamado Análisis comparativo del campo molecular (CoMFA) por Cramer et al. Examinó los campos estéricos (forma de la molécula) y los campos electrostáticos [20] que se correlacionaron por medio de regresión de mínimos cuadrados parciales (PLS).

El espacio de datos creado se reduce luego normalmente mediante una extracción de características posterior (véase también reducción de dimensionalidad ). El siguiente método de aprendizaje puede ser cualquiera de los métodos de aprendizaje automático ya mencionados, por ejemplo, máquinas de vectores de soporte . [21] Un enfoque alternativo utiliza el aprendizaje de múltiples instancias codificando moléculas como conjuntos de instancias de datos, cada una de las cuales representa una posible conformación molecular. Se asigna una etiqueta o respuesta a cada conjunto correspondiente a la actividad de la molécula, que se supone que está determinada por al menos una instancia en el conjunto (es decir, alguna conformación de la molécula). [22]

El 18 de junio de 2011, la patente de Análisis Comparativo de Campo Molecular (CoMFA) eliminó cualquier restricción al uso de las tecnologías GRID y de mínimos cuadrados parciales (PLS). [ cita requerida ]

Descriptor químico basado

En este enfoque, se calculan descriptores que cuantifican varias propiedades electrónicas, geométricas o estéricas de una molécula y se utilizan para desarrollar un QSAR. [23] Este enfoque es diferente del enfoque de fragmentos (o contribución de grupo) en que los descriptores se calculan para el sistema en su conjunto en lugar de a partir de las propiedades de fragmentos individuales. Este enfoque es diferente del enfoque 3D-QSAR en que los descriptores se calculan a partir de cantidades escalares (por ejemplo, energías, parámetros geométricos) en lugar de a partir de campos 3D.

Un ejemplo de este enfoque son los QSAR desarrollados para la polimerización de olefinas mediante compuestos de medio sándwich . [24] [25]

Basado en cadenas

Se ha demostrado que la predicción de actividad es posible incluso basándose únicamente en la cadena SMILES . [26] [27] [28]

Basado en gráficos

De manera similar a los métodos basados ​​en cadenas, el gráfico molecular se puede utilizar directamente como entrada para los modelos QSAR, [29] [30] pero generalmente produce un rendimiento inferior en comparación con los modelos QSAR basados ​​en descriptores. [31] [32]

Modelado

En la literatura se puede encontrar a menudo que los químicos tienen preferencia por los métodos de mínimos cuadrados parciales (PLS), [ cita requerida ] ya que aplica la extracción de características y la inducción en un solo paso.

Enfoque de minería de datos

Los modelos informáticos SAR suelen calcular una cantidad relativamente grande de características. Debido a que carecen de capacidad de interpretación estructural, los pasos de preprocesamiento enfrentan un problema de selección de características (es decir, qué características estructurales deben interpretarse para determinar la relación estructura-actividad). La selección de características se puede lograr mediante inspección visual (selección cualitativa por parte de un humano), mediante minería de datos o mediante minería de moléculas.

Una predicción típica basada en minería de datos utiliza, por ejemplo, máquinas de vectores de soporte , árboles de decisión y redes neuronales artificiales para inducir un modelo de aprendizaje predictivo.

Los métodos de minería de moléculas , un caso especial de métodos de minería de datos estructurados , aplican una predicción basada en una matriz de similitud o un esquema de fragmentación automática en subestructuras moleculares. Además, también existen métodos que utilizan búsquedas de máximos subgrafos comunes o núcleos de grafos . [33] [34]

Protocolo QSAR

Análisis de pares moleculares emparejados

Por lo general, los modelos QSAR derivados del aprendizaje automático no lineal se consideran una "caja negra" que no sirve de guía a los químicos farmacéuticos. Recientemente, existe un concepto relativamente nuevo de análisis de pares moleculares emparejados [35] o MMPA impulsado por predicción que se combina con el modelo QSAR para identificar los picos de actividad. [36]

Evaluación de la calidad de los modelos QSAR

El modelado QSAR produce modelos predictivos derivados de la aplicación de herramientas estadísticas que correlacionan la actividad biológica (incluido el efecto terapéutico deseable y los efectos secundarios indeseables) o las propiedades fisicoquímicas en modelos QSPR de sustancias químicas (fármacos/tóxicos/contaminantes ambientales) con descriptores representativos de la estructura o propiedades moleculares . Los QSAR se están aplicando en muchas disciplinas, por ejemplo: evaluación de riesgos , predicción de toxicidad y decisiones regulatorias [37] además del descubrimiento de fármacos y optimización de clientes potenciales . [38] La obtención de un modelo QSAR de buena calidad depende de muchos factores, como la calidad de los datos de entrada, la elección de descriptores y métodos estadísticos para el modelado y la validación. Cualquier modelado QSAR debe conducir en última instancia a modelos estadísticamente robustos y predictivos capaces de hacer predicciones precisas y confiables de la respuesta modelada de nuevos compuestos.

Para la validación de los modelos QSAR, normalmente se adoptan diversas estrategias: [39]

  1. validación interna o validación cruzada (en realidad, al extraer datos, la validación cruzada es una medida de la robustez del modelo: cuanto más robusto es un modelo (mayor q2), menos perturba la extracción de datos el modelo original);
  2. validación externa mediante la división del conjunto de datos disponibles en un conjunto de entrenamiento para el desarrollo del modelo y un conjunto de predicción para la verificación de la predictibilidad del modelo;
  3. Validación externa ciega mediante la aplicación del modelo a nuevos datos externos y
  4. aleatorización de datos o codificación Y para verificar la ausencia de correlación aleatoria entre la respuesta y los descriptores de modelado.

El éxito de cualquier modelo QSAR depende de la precisión de los datos de entrada, la selección de descriptores y herramientas estadísticas adecuados y, lo más importante, la validación del modelo desarrollado. La validación es el proceso mediante el cual se establece la confiabilidad y la relevancia de un procedimiento para un propósito específico; para los modelos QSAR, la validación debe ser principalmente para la robustez, el rendimiento de predicción y el dominio de aplicabilidad (AD) de los modelos. [8] [9] [11] [40] [41]

Algunas metodologías de validación pueden resultar problemáticas. Por ejemplo, la validación cruzada con un único parámetro en la base de datos suele dar lugar a una sobrestimación de la capacidad predictiva. Incluso con la validación externa, resulta difícil determinar si la selección de los conjuntos de entrenamiento y prueba se manipuló para maximizar la capacidad predictiva del modelo que se publica.

Los diferentes aspectos de la validación de los modelos QSAR que requieren atención incluyen los métodos de selección de los compuestos del conjunto de entrenamiento, [42] la configuración del tamaño del conjunto de entrenamiento [43] y el impacto de la selección de variables [44] para los modelos del conjunto de entrenamiento para determinar la calidad de la predicción. El desarrollo de nuevos parámetros de validación para juzgar la calidad de los modelos QSAR también es importante. [11] [45] [46]

Solicitud

Químico

Una de las primeras aplicaciones históricas del QSAR fue predecir puntos de ebullición . [47]

Por ejemplo, es bien sabido que dentro de una familia particular de compuestos químicos , especialmente de la química orgánica , existen fuertes correlaciones entre la estructura y las propiedades observadas. Un ejemplo sencillo es la relación entre el número de carbonos en los alcanos y sus puntos de ebullición . Existe una clara tendencia al aumento del punto de ebullición con un aumento en el número de carbonos, y esto sirve como medio para predecir los puntos de ebullición de los alcanos superiores .

Una aplicación todavía muy interesante es la ecuación de Hammett , la ecuación de Taft y los métodos de predicción de pKa . [48]

Biológico

La actividad biológica de las moléculas se mide habitualmente en ensayos para establecer el nivel de inhibición de determinadas vías metabólicas o de transducción de señales . El descubrimiento de fármacos a menudo implica el uso de QSAR para identificar estructuras químicas que podrían tener buenos efectos inhibidores sobre objetivos específicos y tener una baja toxicidad (actividad no específica). De especial interés es la predicción del coeficiente de partición log P , que es una medida importante utilizada para identificar la " similitud con un fármaco " según la regla de cinco de Lipinski . [ cita requerida ]

Si bien muchos análisis cuantitativos de la relación estructura-actividad involucran las interacciones de una familia de moléculas con una enzima o un sitio de unión a un receptor , la QSAR también se puede utilizar para estudiar las interacciones entre los dominios estructurales de las proteínas. Las interacciones proteína-proteína se pueden analizar cuantitativamente para detectar variaciones estructurales resultantes de la mutagénesis dirigida al sitio . [49]

Es parte del método de aprendizaje automático reducir el riesgo de una paradoja SAR, especialmente teniendo en cuenta que solo hay una cantidad finita de datos disponibles (ver también MVUE ). En general, todos los problemas QSAR se pueden dividir en codificación [50] y aprendizaje . [51]

Aplicaciones

Los modelos (Q)SAR se han utilizado para la gestión de riesgos . Las autoridades reguladoras sugieren los QSAR; en la Unión Europea , los QSAR se sugieren en el reglamento REACH , donde "REACH" significa "Registro, evaluación, autorización y restricción de sustancias químicas". La aplicación reglamentaria de los métodos QSAR incluye la evaluación toxicológica in silico de impurezas genotóxicas. [52] El software de evaluación QSAR de uso común, como DEREK o CASE Ultra (MultiCASE), se utiliza para la genotoxicidad de impurezas de acuerdo con ICH M7. [53]

El espacio de descriptores químicos cuya envoltura convexa se genera a partir de un conjunto de entrenamiento particular de sustancias químicas se denomina dominio de aplicabilidad del conjunto de entrenamiento . La predicción de propiedades de sustancias químicas nuevas que se encuentran fuera del dominio de aplicabilidad utiliza la extrapolación y, por lo tanto, es menos confiable (en promedio) que la predicción dentro del dominio de aplicabilidad. La evaluación de la confiabilidad de las predicciones de QSAR sigue siendo un tema de investigación. [ cita requerida ]

Las ecuaciones QSAR se pueden utilizar para predecir las actividades biológicas de moléculas más nuevas antes de su síntesis.

Algunos ejemplos de herramientas de aprendizaje automático para el modelado QSAR incluyen: [54]

Véase también

Referencias

  1. ^ Todeschini, Roberto; Consonni, Viviana (2009). Descriptores moleculares para quimioinformática. Métodos y principios en química medicinal. Vol. 41. Wiley. doi :10.1002/9783527628766. ISBN 978-3-527-31852-0.
  2. ^ Mauri, Andrea; Consonni, Viviana; Todeschini, Roberto (2017). "Descriptores moleculares". Manual de química computacional. Springer International Publishing. págs. 2065–2093. doi :10.1007/978-3-319-27282-5_51. ISBN 978-3-319-27282-5.
  3. ^ Roy K, Kar S, Das RN (2015). "Capítulo 1.2: ¿Qué es QSAR? Definiciones y formulismo". Introducción al modelado QSAR/QSPR: conceptos fundamentales . Nueva York: Springer-Verlag Inc., págs. 2-6. ISBN 978-3-319-17281-1.
  4. ^ Ghasemi, Pérez-Sánchez; Mehri, Pérez-Garrido (2018). "Redes neuronales y algoritmos de aprendizaje profundo utilizados en estudios QSAR: ventajas y desventajas". Drug Discovery Today . 23 (10): 1784–1790. doi :10.1016/j.drudis.2018.06.016. PMID  29936244. S2CID  49418479.
  5. ^ Nantasenamat C, Isarankura-Na-Ayudhya C, Naenna T, Prachayasittikul V (2009). "Una descripción práctica de la relación cuantitativa estructura-actividad". Revista Excli . 8 : 74–88. doi :10.17877/DE290R-690.
  6. ^ Nantasenamat C, Isarankura-Na-Ayudhya C, Prachayasittikul V (julio de 2010). "Avances en métodos computacionales para predecir la actividad biológica de compuestos". Opinión de expertos sobre el descubrimiento de fármacos . 5 (7): 633–54. doi :10.1517/17460441.2010.492827. PMID  22823204. S2CID  17622541.
  7. ^ ab Yousefinejad S, Hemmateenejad B (2015). "Herramientas quimiométricas en estudios QSAR/QSPR: una perspectiva histórica". Quimiometría y sistemas de laboratorio inteligentes . 149, Parte B: 177–204. doi :10.1016/j.chemolab.2015.06.016.
  8. ^ ab Tropsha A , Gramatica P, Gombar VJ (2003). "La importancia de ser serio: la validación es absolutamente esencial para la aplicación e interpretación exitosas de los modelos QSPR". QSAR Comb. Sci . 22 : 69–77. doi :10.1002/qsar.200390007.
  9. ^ ab Gramatica P (2007). "Principios de validación de modelos QSAR: internos y externos". QSAR Comb. Sci . 26 (5): 694–701. doi :10.1002/qsar.200610151. hdl : 11383/1668881 .
  10. ^ Ruusmann, V.; Sild, S.; Maran, U. (2015). "Repositorio QSAR DataBank: modelos de relación estructura-actividad cualitativos y cuantitativos abiertos y vinculados". Journal of Cheminformatics . 7 : 32. doi : 10.1186/s13321-015-0082-6 . PMC 4479250 . PMID  26110025. 
  11. ^ abc Chirico N, Gramatica P (agosto de 2012). "Predicción externa real de los modelos QSAR. Parte 2. Nuevos umbrales intercomparables para diferentes criterios de validación y la necesidad de inspección de diagramas de dispersión". Journal of Chemical Information and Modeling . 52 (8): 2044–58. doi :10.1021/ci300084j. PMID  22721530.
  12. ^ Tropsha, Alexander (2010). "Mejores prácticas para el desarrollo, validación y explotación de modelos QSAR". Informática molecular . 29 (6–7): 476–488. doi :10.1002/minf.201000061. ISSN  1868-1743. PMID  27463326. S2CID  23564249.
  13. ^ Patani GA, LaVoie EJ (diciembre de 1996). "Bioisosterismo: un enfoque racional en el diseño de fármacos". Chemical Reviews . 96 (8): 3147–3176. doi :10.1021/cr950066q. PMID  11848856.
  14. ^ Marrón N (2012). Bioisosteres en Química Medicinal . Weinheim: Wiley-VCH. ISBN 978-3-527-33015-7.
  15. ^ Thompson SJ, Hattotuwagama CK, Holliday JD, Flower DR (2006). "Sobre la hidrofobicidad de los péptidos: comparación de las predicciones empíricas de los valores de log P de los péptidos". Bioinformación . 1 (7): 237–41. doi :10.6026/97320630001237. PMC 1891704 . PMID  17597897. 
  16. ^ Wildman SA, Crippen GM (1999). "Predicción de parámetros fisicoquímicos mediante contribuciones atómicas". J. Chem. Inf. Comput. Sci . 39 (5): 868–873. doi :10.1021/ci990307l.
  17. ^ ab Ajmani S, Jadhav K, Kulkarni SA, QSAR basado en grupo (G-QSAR)
  18. ^ Manoharan P, Vijayan RS, Ghoshal N (octubre de 2010). "Racionalización del descubrimiento de fármacos basado en fragmentos para BACE1: perspectivas de los estudios FB-QSAR, FB-QSSR, multiobjetivo (MO-QSPR) y MIF". Journal of Computer-Aided Molecular Design . 24 (10): 843–64. Bibcode :2010JCAMD..24..843M. doi :10.1007/s10822-010-9378-9. PMID  20740315. S2CID  1171860.
  19. ^ ab Prasanth Kumar S, Jasrai YT, Pandya HA, Rawal RM (noviembre de 2013). "QSAR basado en la similitud de farmacóforos (PS-QSAR) para predicciones de actividad biológica específicas de grupo". Journal of Biomolecular Structure & Dynamics . 33 (1): 56–69. doi :10.1080/07391102.2013.849618. PMID  24266725. S2CID  45364247.
  20. ^ Leach AR (2001). Modelado molecular: principios y aplicaciones . Englewood Cliffs, NJ: Prentice Hall. ISBN 978-0-582-38210-7.
  21. ^ Vert JP, Schölkopf B, Tsuda K (2004). Métodos kernel en biología computacional . Cambridge, Masa: MIT Press. ISBN 978-0-262-19509-6.
  22. ^ Dietterich TG, Lathrop RH, Lozano-Pérez T (1997). "Resolución del problema de instancias múltiples con rectángulos de ejes paralelos". Inteligencia Artificial . 89 (1–2): 31–71. doi :10.1016/S0004-3702(96)00034-3.
  23. ^ Caruthers JM, Lauterbach JA, Thomson KT, Venkatasubramanian V, Snively CM, Bhan A, Katare S, Oskarsdottir G (2003). "Diseño de catalizadores: extracción de conocimiento a partir de la experimentación de alto rendimiento". J. Catal . 216 (1–2): 3776–3777. doi :10.1016/S0021-9517(02)00036-2.
  24. ^ Manz TA, Phomphrai K, Medvedev G, Krishnamurthy BB, Sharma S, Haq J, Novstrup KA, Thomson KT, Delgass WN, Caruthers JM, Abu-Omar MM (abril de 2007). "Correlación estructura-actividad en catalizadores de polimerización de olefinas de sitio único de titanio que contienen ligación mixta de ciclopentadienilo/arilóxido". Journal of the American Chemical Society . 129 (13): 3776–7. doi :10.1021/ja0640849. PMID  17348648.
  25. ^ Manz TA, Caruthers JM, Sharma S, Phomphrai K, Thomson KT, Delgass WN, Abu-Omar MM (2012). "Correlación estructura-actividad para la iniciación relativa de la cadena y las tasas de propagación en la catálisis de polimerización de olefinas de un solo sitio". Organometallics . 31 (2): 602–618. doi :10.1021/om200884x.
  26. ^ Jastrzębski, Estanislao; Leśniak, Damián; Czarnecki, Wojciech Marian (8 de marzo de 2018). "Aprender a SONREÍR (S)". arXiv : 1602.06289 [cs.CL].
  27. ^ Bjerrum, Esben Jannik (17 de mayo de 2017). "Enumeración SMILES como aumento de datos para el modelado de redes neuronales de moléculas". arXiv : 1703.07076 [cs.LG].
  28. ^ Mayr, Andreas; Klambauer, Günter; Unterthiner, Thomas; Steijaert, Marvin; Wegner, Jörg K.; Ceulemans, Hugo; Clevert, Djork-Arné; Hochreiter, Sepp (20 de junio de 2018). "Comparación a gran escala de métodos de aprendizaje automático para la predicción de dianas farmacológicas en ChEMBL". Chemical Science . 9 (24): 5441–5451. doi :10.1039/c8sc00148k. PMC 6011237 . PMID  30155234. 
  29. ^ Merkwirth, Christian; Lengauer, Thomas (1 de septiembre de 2005). "Generación automática de descriptores complementarios con redes de grafos moleculares". Revista de información y modelado químico . 45 (5): 1159–1168. doi :10.1021/ci049613b. PMID  16180893.
  30. ^ Kearnes, Steven; McCloskey, Kevin; Berndl, Marc; Pande, Vijay; Riley, Patrick (1 de agosto de 2016). "Convoluciones de grafos moleculares: más allá de las huellas dactilares". Journal of Computer-Aided Molecular Design . 30 (8): 595–608. arXiv : 1603.00856 . Bibcode :2016JCAMD..30..595K. doi :10.1007/s10822-016-9938-8. PMC 5028207 . PMID  27558503. 
  31. ^ Jiang, Dejun; Wu, Zhenxing; Hsieh, Chang-Yu; Chen, Guangyong; Liao, Ben; Wang, Zhe; Shen, Chao; Cao, Dongsheng; Wu, Jian; Hou, Tingjun (17 de febrero de 2021). "¿Podrían las redes neuronales gráficas aprender una mejor representación molecular para el descubrimiento de fármacos? Un estudio comparativo de modelos basados ​​en descriptores y basados ​​en gráficos". Journal of Cheminformatics . 13 (1): 12. doi : 10.1186/s13321-020-00479-8 . PMC 7888189 . PMID  33597034. 
  32. ^ van Tilborg, Derek; Alenicheva, Alisa; Grisoni, Francesca (12 de diciembre de 2022). "Exposición de las limitaciones del aprendizaje automático molecular con Activity Cliffs". Revista de información y modelado químico . 62 (23): 5938–5951. doi :10.1021/acs.jcim.2c01073. PMC 9749029 . PMID  36456532. 
  33. ^ Gusfield D (1997). Algoritmos sobre cadenas, árboles y secuencias: informática y biología computacional . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-58519-4.
  34. ^ Helma C (2005). Toxicología predictiva . Washington, DC: Taylor & Francis. ISBN 978-0-8247-2397-2.
  35. ^ Dossetter AG, Griffen EJ, Leach AG (2013). "Análisis de pares moleculares emparejados en el descubrimiento de fármacos". Drug Discovery Today . 18 (15–16): 724–31. doi :10.1016/j.drudis.2013.03.003. PMID  23557664.
  36. ^ Sushko Y, Novotarskyi S, Körner R, Vogt J, Abdelaziz A, Tetko IV (2014). "Pares moleculares emparejados basados ​​en predicción para interpretar QSAR y ayudar al proceso de optimización molecular". Journal of Cheminformatics . 6 (1): 48. doi : 10.1186/s13321-014-0048-0 . PMC 4272757 . PMID  25544551. 
  37. ^ Tong W, Hong H, Xie Q, Shi L, Fang H, Perkins R (abril de 2005). "Evaluación de las limitaciones de QSAR: una perspectiva regulatoria". Diseño actual de fármacos asistido por computadora . 1 (2): 195–205. doi :10.2174/1573409053585663.
  38. ^ Dearden JC (2003). "Predicción in silico de la toxicidad de fármacos". Revista de diseño molecular asistido por ordenador . 17 (2–4): 119–27. Bibcode :2003JCAMD..17..119D. doi :10.1023/A:1025361621494. PMID  13677480. S2CID  21518449.
  39. ^ Wold S, Eriksson L (1995). "Validación estadística de los resultados de QSAR". En Waterbeemd, Han van de (ed.). Métodos quimiométricos en el diseño molecular . Weinheim: VCH. págs. 309–318. ISBN. 978-3-527-30044-0.
  40. ^ Roy K (diciembre de 2007). "Sobre algunos aspectos de la validación de modelos predictivos cuantitativos de relación estructura-actividad". Opinión de expertos sobre el descubrimiento de fármacos . 2 (12): 1567–77. doi :10.1517/17460441.2.12.1567. PMID  23488901. S2CID  21305783.
  41. ^ Sahigara, Faizan; Mansouri, Kamel; Ballabio, Davide; Mauri, Andrea; Consonni, Viviana; Todeschini, Roberto (2012). "Comparación de diferentes enfoques para definir el dominio de aplicabilidad de los modelos QSAR". Moléculas . 17 (5): 4791–4810. doi : 10.3390/molecules17054791 . PMC 6268288 . PMID  22534664. 
  42. ^ Leonard JT, Roy K (2006). "Sobre la selección de conjuntos de entrenamiento y prueba para el desarrollo de modelos predictivos QSAR". QSAR & Combinatorial Science . 25 (3): 235–251. doi :10.1002/qsar.200510161.
  43. ^ Roy PP, Leonard JT, Roy K (2008). "Explorando el impacto del tamaño de los conjuntos de entrenamiento para el desarrollo de modelos predictivos QSAR". Quimiometría y sistemas de laboratorio inteligentes . 90 (1): 31–42. doi :10.1016/j.chemolab.2007.07.004.
  44. ^ Put R, Vander Heyden Y (octubre de 2007). "Revisión de los aspectos de modelado en las relaciones cuantitativas de retención de estructura en cromatografía líquida de fase reversa". Analytica Chimica Acta . 602 (2): 164–72. doi :10.1016/j.aca.2007.09.014. PMID  17933600.
  45. ^ Pratim Roy P, Paul S, Mitra I, Roy K (2009). "Sobre dos nuevos parámetros para la validación de modelos predictivos QSAR". Moléculas . 14 (5): 1660–701. doi : 10.3390/molecules14051660 . PMC 6254296 . PMID  19471190. 
  46. ^ Chirico N, Gramatica P (septiembre de 2011). "Predictividad externa real de los modelos QSAR: ¿cómo evaluarla? Comparación de diferentes criterios de validación y propuesta de uso del coeficiente de correlación de concordancia". Journal of Chemical Information and Modeling . 51 (9): 2320–35. doi :10.1021/ci200211n. PMID  21800825.
  47. ^ Rouvray DH, Bonchev D (1991). Teoría de grafos químicos: introducción y fundamentos . Tunbridge Wells, Kent, Inglaterra: Abacus Press. ISBN 978-0-85626-454-2.
  48. ^ Fraczkiewicz, R (2013). "Predicción in silico de la ionización". En Reedijk, J (ed.). Módulo de referencia en química, ciencias moleculares e ingeniería química . Módulo de referencia en química, ciencias moleculares e ingeniería química [En línea] . Vol. 5. Ámsterdam, Países Bajos: Elsevier. doi :10.1016/B978-0-12-409547-2.02610-X. ISBN 9780124095472.
  49. ^ Freyhult EK, Andersson K, Gustafsson MG (abril de 2003). "El modelado estructural extiende el análisis QSAR de las interacciones anticuerpo-lisozima al 3D-QSAR". Biophysical Journal . 84 (4): 2264–72. Bibcode :2003BpJ....84.2264F. doi :10.1016/S0006-3495(03)75032-2. PMC 1302793 . PMID  12668435. 
  50. ^ Timmerman H, Todeschini R, Consonni V, Mannhold R, Kubinyi H (2002). Manual de descriptores moleculares . Weinheim: Wiley-VCH. ISBN 978-3-527-29913-3.
  51. ^ Duda RO, Hart PW, Stork DG (2001). Clasificación de patrones . Chichester: John Wiley & Sons. ISBN 978-0-471-05669-0.
  52. ^ Fioravanzo, E.; Bassan, A.; Pavan, M.; Mostrag-Szlichtyng, A.; Worth, AP (1 de abril de 2012). "El papel de las herramientas de genotoxicidad in silico en la evaluación regulatoria de impurezas farmacéuticas". SAR y QSAR en la investigación medioambiental . 23 (3–4): 257–277. doi :10.1080/1062936X.2012.657236. ISSN  1062-936X. PMID  22369620. S2CID  2714861.
  53. ^ ICH M7 Evaluación y control de impurezas reactivas al ADN (mutagénicas) en productos farmacéuticos para limitar el riesgo potencial de carcinogenicidad - Directriz científica [1]
  54. ^ Lavecchia A (marzo de 2015). "Enfoques de aprendizaje automático en el descubrimiento de fármacos: métodos y aplicaciones". Drug Discovery Today . 20 (3): 318–31. doi :10.1016/j.drudis.2014.10.012. PMID  25448759.
  55. ^ Stålring JC, Carlsson LA, Almeida P, Boyer S (2011). "AZOrange: aprendizaje automático de código abierto de alto rendimiento para modelado QSAR en un entorno de programación gráfica". Journal of Cheminformatics . 3 : 28. doi : 10.1186/1758-2946-3-28 . PMC 3158423 . PMID  21798025. 
  56. ^ Mauri, Andrea; Bertola, Matteo (2022). "Alvascience: un nuevo paquete de software para el flujo de trabajo QSAR aplicado a la permeabilidad de la barrera hematoencefálica". Revista internacional de ciencias moleculares . 23 (12882): 12882. doi : 10.3390/ijms232112882 . PMC 9655980 . PMID  36361669. 
  57. ^ Fabian Pedregosa; Gaël Varoquaux; Alexandre Gramfort; Vincent Michel; Bertrand Thirion; Olivier Grisel; Mathieu Blondel; Peter Prettenhofer; Ron Weiss; Vincent Dubourg; Jake Vanderplas; Alexandre Passos; David Cournapeau; Matthieu Perrot; Édouard Duchesnay (2011). "scikit-learn: Aprendizaje automático en Python". Revista de investigación en aprendizaje automático . 12 : 2825–2830.

Lectura adicional

Enlaces externos