stringtranslate.com

Relación estructura cuantitativa-actividad

Los modelos cuantitativos de relación estructura-actividad ( modelos QSAR ) son modelos de regresión o clasificación utilizados en las ciencias e ingeniería químicas y biológicas. Al igual que otros modelos de regresión, los modelos de regresión QSAR relacionan un conjunto de variables "predictoras" (X) con la potencia de la variable de respuesta (Y), mientras que los modelos de clasificación QSAR relacionan las variables predictoras con un valor categórico de la variable de respuesta.

En el modelado QSAR, los predictores consisten en propiedades fisicoquímicas o descriptores moleculares teóricos [1] [2] de sustancias químicas; la variable de respuesta QSAR podría ser una actividad biológica de las sustancias químicas. Los modelos QSAR primero resumen una supuesta relación entre las estructuras químicas y la actividad biológica en un conjunto de datos de sustancias químicas. En segundo lugar, los modelos QSAR predicen las actividades de nuevas sustancias químicas. [3] [4]

Los términos relacionados incluyen relaciones cuantitativas estructura-propiedad ( QSPR ) cuando una propiedad química se modela como variable de respuesta. [5] [6] "Se han investigado diferentes propiedades o comportamientos de moléculas químicas en el campo de QSPR. Algunos ejemplos son las relaciones estructura cuantitativa-reactividad (QSRR), relaciones estructura cuantitativa-cromatografía (QSCR) y relaciones estructura cuantitativa-toxicidad. (QSTR), relaciones estructura cuantitativa-electroquímica (QSER) y relaciones estructura cuantitativa- biodegradabilidad (QSBR)". [7]

Por ejemplo, la actividad biológica se puede expresar cuantitativamente como la concentración de una sustancia necesaria para dar una determinada respuesta biológica. Además, cuando las propiedades o estructuras fisicoquímicas se expresan mediante números, se puede encontrar una relación matemática, o relación cuantitativa estructura-actividad, entre ambas. La expresión matemática, si se valida cuidadosamente, [8] [9] [10] [11] puede usarse para predecir la respuesta modelada de otras estructuras químicas. [12]

Un QSAR tiene la forma de un modelo matemático :

El error incluye el error del modelo ( sesgo ) y la variabilidad observacional, es decir, la variabilidad en las observaciones incluso en un modelo correcto.

Pasos esenciales en los estudios QSAR

Los principales pasos de QSAR/QSPR incluyen: [7]

  1. Selección de conjunto de datos y extracción de descriptores estructurales/empíricos.
  2. selección de variables
  3. Construcción de modelos
  4. Evaluación de validación

SAR y la paradoja del SAR

El supuesto básico de todas las hipótesis basadas en moléculas es que moléculas similares tienen actividades similares. Este principio también se llama relación estructura-actividad ( SAR ). Por lo tanto, el problema subyacente es cómo definir una pequeña diferencia a nivel molecular, ya que cada tipo de actividad, por ejemplo, capacidad de reacción , capacidad de biotransformación , solubilidad , actividad objetivo, etc., podría depender de otra diferencia. Patanie/LaVoie [13] y Brown dieron ejemplos en las revisiones de bioisosterismo . [14]

En general, uno está más interesado en encontrar tendencias fuertes . Las hipótesis creadas generalmente se basan en un número finito de sustancias químicas, por lo que se debe tener cuidado para evitar el sobreajuste : la generación de hipótesis que se ajustan muy estrechamente a los datos de entrenamiento pero que funcionan mal cuando se aplican a datos nuevos.

La paradoja SAR se refiere al hecho de que no es cierto que todas las moléculas similares tengan actividades similares [ cita requerida ] .

Tipos

Basado en fragmentos (contribución grupal)

De manera análoga, el " coeficiente de partición ", una medida de solubilidad diferencial y en sí misma un componente de las predicciones QSAR, puede predecirse mediante métodos atómicos (conocidos como "XLogP" o "ALogP") o mediante métodos de fragmentos químicos (conocidos como "CLogP"). y otras variaciones). Se ha demostrado que el logP de un compuesto puede determinarse mediante la suma de sus fragmentos; Los métodos basados ​​en fragmentos se aceptan generalmente como mejores predictores que los métodos basados ​​en átomos. [15] Los valores fragmentarios se han determinado estadísticamente, basándose en datos empíricos para valores logP conocidos. Este método proporciona resultados mixtos y generalmente no se confía en que tenga una precisión superior a ±0,1 unidades. [dieciséis]

QSAR basado en grupos o fragmentos también se conoce como GQSAR. [17] GQSAR permite flexibilidad para estudiar varios fragmentos moleculares de interés en relación con la variación en la respuesta biológica. Los fragmentos moleculares podrían ser sustituyentes en varios sitios de sustitución en conjuntos congenéricos de moléculas o podrían basarse en reglas químicas predefinidas en el caso de conjuntos no congenéricos. GQSAR también considera descriptores de fragmentos de términos cruzados, que podrían ser útiles en la identificación de interacciones de fragmentos clave para determinar la variación de la actividad. [17] El descubrimiento de clientes potenciales mediante fragnomía es un paradigma emergente. En este contexto, FB-QSAR demuestra ser una estrategia prometedora para el diseño de bibliotecas de fragmentos y en los esfuerzos de identificación de fragmentos a clientes potenciales. [18]

Se desarrolla un enfoque avanzado sobre QSAR basado en fragmentos o grupos basado en el concepto de similitud de farmacóforo. [19] Este método, QSAR basado en similitud de farmacóforos (PS-QSAR), utiliza descriptores farmacofóricos topológicos para desarrollar modelos QSAR. Esta predicción de la actividad puede ayudar a la contribución de ciertas características del farmacóforo codificadas por los respectivos fragmentos hacia la mejora de la actividad y/o efectos perjudiciales. [19]

3D-QSAR

El acrónimo 3D-QSAR o 3-D QSAR se refiere a la aplicación de cálculos de campos de fuerza que requieren estructuras tridimensionales de un conjunto determinado de moléculas pequeñas con actividades conocidas (conjunto de entrenamiento). El conjunto de entrenamiento debe superponerse (alinearse) mediante datos experimentales (por ejemplo, basados ​​en cristalografía de ligando-proteína ) o software de superposición de moléculas. Utiliza potenciales calculados, por ejemplo, el potencial de Lennard-Jones , en lugar de constantes experimentales y se ocupa de la molécula en general más que de un único sustituyente. El primer QSAR 3-D fue denominado Análisis Comparativo de Campo Molecular (CoMFA) por Cramer et al. Examinó los campos estéricos (forma de la molécula) y los campos electrostáticos [20] que se correlacionaron mediante regresión de mínimos cuadrados parciales (PLS).

El espacio de datos creado generalmente se reduce mediante una siguiente extracción de características (consulte también reducción de dimensionalidad ). El siguiente método de aprendizaje puede ser cualquiera de los métodos de aprendizaje automático ya mencionados , por ejemplo, máquinas de vectores de soporte . [21] Un enfoque alternativo utiliza el aprendizaje de instancias múltiples codificando moléculas como conjuntos de instancias de datos, cada una de las cuales representa una posible conformación molecular. Se asigna una etiqueta o respuesta a cada conjunto correspondiente a la actividad de la molécula, que se supone está determinada por al menos una instancia del conjunto (es decir, alguna conformación de la molécula). [22]

El 18 de junio de 2011, la patente Comparative Molecular Field Analysis (CoMFA) eliminó cualquier restricción en el uso de tecnologías GRID y de mínimos cuadrados parciales (PLS). [ cita necesaria ]

Basado en descriptores químicos

En este enfoque, se calculan y utilizan descriptores que cuantifican diversas propiedades electrónicas, geométricas o estéricas de una molécula para desarrollar un QSAR. [23] Este enfoque es diferente del enfoque de fragmento (o contribución de grupo) en que los descriptores se calculan para el sistema en su conjunto en lugar de las propiedades de los fragmentos individuales. Este enfoque se diferencia del enfoque 3D-QSAR en que los descriptores se calculan a partir de cantidades escalares (por ejemplo, energías, parámetros geométricos) en lugar de campos 3D.

Un ejemplo de este enfoque son los QSAR desarrollados para la polimerización de olefinas mediante compuestos de medio sándwich . [24] [25]

Basado en cadenas

Se ha demostrado que la predicción de actividad es incluso posible basándose únicamente en la cadena SMILES . [26] [27] [28]

Basado en gráficos

De manera similar a los métodos basados ​​en cadenas, el gráfico molecular se puede utilizar directamente como entrada para los modelos QSAR, [29] [30] pero generalmente produce un rendimiento inferior en comparación con los modelos QSAR basados ​​en descriptores. [31] [32]

Modelado

En la literatura se puede encontrar a menudo que los químicos tienen preferencia por los métodos de mínimos cuadrados parciales (PLS), [ cita necesaria ] ya que aplica la extracción e inducción de características en un solo paso.

Enfoque de minería de datos

Los modelos SAR por computadora normalmente calculan una cantidad relativamente grande de características. Debido a que carecen de capacidad de interpretación estructural, los pasos de preprocesamiento enfrentan un problema de selección de características (es decir, qué características estructurales deben interpretarse para determinar la relación estructura-actividad). La selección de características se puede realizar mediante inspección visual (selección cualitativa por parte de un humano); mediante minería de datos; o por minería de moléculas.

Una predicción típica basada en minería de datos utiliza, por ejemplo, máquinas de vectores de soporte , árboles de decisión y redes neuronales artificiales para inducir un modelo de aprendizaje predictivo.

Los enfoques de minería de moléculas , un caso especial de enfoques de minería de datos estructurados , aplican una predicción basada en una matriz de similitud o un esquema de fragmentación automática en subestructuras moleculares. Además, también existen enfoques que utilizan la máxima búsqueda de subgrafos comunes o núcleos de gráficos . [33] [34]

protocolo QSAR

Análisis de pares moleculares emparejados.

Normalmente, los modelos QSAR derivados del aprendizaje automático no lineal se consideran una "caja negra" que no sirve de guía a los químicos medicinales. Recientemente existe un concepto relativamente nuevo de análisis de pares moleculares coincidentes [35] o MMPA impulsado por predicción que se combina con el modelo QSAR para identificar acantilados de actividad. [36]

Evaluación de la calidad de los modelos QSAR.

El modelado QSAR produce modelos predictivos derivados de la aplicación de herramientas estadísticas que correlacionan la actividad biológica (incluidos los efectos terapéuticos deseables y los efectos secundarios indeseables) o las propiedades fisicoquímicas en modelos QSPR de sustancias químicas (drogas/tóxicos/contaminantes ambientales) con descriptores representativos de la estructura o propiedades moleculares . . Los QSAR se están aplicando en muchas disciplinas, por ejemplo: evaluación de riesgos , predicción de toxicidad y decisiones regulatorias [37], además del descubrimiento de fármacos y la optimización de clientes potenciales . [38] La obtención de un modelo QSAR de buena calidad depende de muchos factores, como la calidad de los datos de entrada, la elección de los descriptores y los métodos estadísticos para el modelado y la validación. Cualquier modelado QSAR debería conducir en última instancia a modelos predictivos y estadísticamente sólidos capaces de hacer predicciones precisas y confiables de la respuesta modelada de nuevos compuestos.

Para la validación de los modelos QSAR, normalmente se adoptan varias estrategias: [39]

  1. validación interna o validación cruzada (en realidad, mientras se extraen datos, la validación cruzada es una medida de la robustez del modelo, cuanto más robusto es un modelo (q2 más alto), menos perturba la extracción de datos el modelo original);
  2. validación externa dividiendo el conjunto de datos disponible en un conjunto de entrenamiento para el desarrollo del modelo y un conjunto de predicción para la verificación de la predictividad del modelo;
  3. Validación externa ciega mediante la aplicación del modelo sobre nuevos datos externos y
  4. aleatorización de datos o codificación Y para verificar la ausencia de correlación aleatoria entre la respuesta y los descriptores del modelado.

El éxito de cualquier modelo QSAR depende de la precisión de los datos de entrada, la selección de descriptores y herramientas estadísticas apropiados y, lo más importante, la validación del modelo desarrollado. La validación es el proceso mediante el cual se establece la confiabilidad y relevancia de un procedimiento para un propósito específico; Para los modelos QSAR, la validación debe centrarse principalmente en la robustez, el rendimiento de predicción y el dominio de aplicabilidad (AD) de los modelos. [8] [9] [11] [40] [41]

Algunas metodologías de validación pueden resultar problemáticas. Por ejemplo, dejar una validación cruzada generalmente conduce a una sobreestimación de la capacidad predictiva. Incluso con validación externa, es difícil determinar si la selección de conjuntos de entrenamiento y prueba fue manipulada para maximizar la capacidad predictiva del modelo que se publica.

Los diferentes aspectos de la validación de los modelos QSAR que necesitan atención incluyen los métodos de selección de compuestos del conjunto de entrenamiento, [42] el establecimiento del tamaño del conjunto de entrenamiento [43] y el impacto de la selección de variables [44] para los modelos de conjuntos de entrenamiento para determinar la calidad de la predicción. También es importante el desarrollo de nuevos parámetros de validación para juzgar la calidad de los modelos QSAR. [11] [45] [46]

Solicitud

Químico

Una de las primeras aplicaciones históricas de QSAR fue la predicción de puntos de ebullición . [47]

Es bien sabido, por ejemplo, que dentro de una familia particular de compuestos químicos , especialmente de química orgánica , existen fuertes correlaciones entre la estructura y las propiedades observadas. Un ejemplo sencillo es la relación entre el número de carbonos de los alcanos y sus puntos de ebullición . Existe una tendencia clara en el aumento del punto de ebullición con un aumento en el número de carbonos, y esto sirve como medio para predecir los puntos de ebullición de los alcanos superiores .

Una aplicación todavía muy interesante son la ecuación de Hammett , la ecuación de Taft y los métodos de predicción de pKa . [48]

Biológico

La actividad biológica de las moléculas generalmente se mide en ensayos para establecer el nivel de inhibición de determinadas vías metabólicas o de transducción de señales . El descubrimiento de fármacos a menudo implica el uso de QSAR para identificar estructuras químicas que podrían tener buenos efectos inhibidores sobre objetivos específicos y tener baja toxicidad (actividad no específica). De especial interés es la predicción del coeficiente de partición log P , que es una medida importante utilizada para identificar la " similaridad a las drogas " según la Regla de Cinco de Lipinski . [ cita necesaria ]

Si bien muchos análisis cuantitativos de relaciones estructura-actividad implican las interacciones de una familia de moléculas con una enzima o un sitio de unión al receptor , QSAR también se puede utilizar para estudiar las interacciones entre los dominios estructurales de las proteínas. Las interacciones proteína-proteína se pueden analizar cuantitativamente para detectar variaciones estructurales resultantes de la mutagénesis dirigida al sitio . [49]

Es parte del método de aprendizaje automático reducir el riesgo de una paradoja SAR, especialmente teniendo en cuenta que solo está disponible una cantidad finita de datos (ver también MVUE ). En general, todos los problemas QSAR se pueden dividir en codificación [50] y aprendizaje . [51]

Aplicaciones

Los modelos (Q)SAR se han utilizado para la gestión de riesgos . Los QSARS son sugeridos por las autoridades reguladoras; En la Unión Europea , los QSAR son sugeridos por el reglamento REACH , donde "REACH" abrevia "Registro, Evaluación, Autorización y Restricción de Productos Químicos". La aplicación reglamentaria de los métodos QSAR incluye la evaluación toxicológica in silico de impurezas genotóxicas. [52] El software de evaluación QSAR de uso común, como DEREK o CASE Ultra (MultiCASE), se utiliza para determinar la genotoxicidad de las impurezas de acuerdo con ICH M7. [53]

El espacio de descriptores químicos cuyo casco convexo es generado por un conjunto de químicos de entrenamiento particular se llama dominio de aplicabilidad del conjunto de entrenamiento . La predicción de las propiedades de nuevas sustancias químicas que se encuentran fuera del dominio de aplicabilidad utiliza la extrapolación y, por lo tanto, es menos confiable (en promedio) que la predicción dentro del dominio de aplicabilidad. La evaluación de la fiabilidad de las predicciones QSAR sigue siendo un tema de investigación. [ cita necesaria ]

Las ecuaciones QSAR se pueden utilizar para predecir las actividades biológicas de moléculas más nuevas antes de su síntesis.

Ejemplos de herramientas de aprendizaje automático para el modelado QSAR incluyen: [54]

Ver también

Referencias

  1. ^ Todeschini, Roberto; Consonni, Viviana (2009). Descriptores moleculares para quimioinformática. Métodos y principios de química medicinal. vol. 41. Wiley. doi :10.1002/9783527628766. ISBN 978-3-527-31852-0.
  2. ^ Mauri, Andrea; Consonni, Viviana; Todeschini, Roberto (2017). "Descriptores moleculares". Manual de química computacional. Publicaciones internacionales Springer. págs. 2065-2093. doi :10.1007/978-3-319-27282-5_51. ISBN 978-3-319-27282-5.
  3. ^ Roy K, Kar S, Das RN (2015). "Capítulo 1.2: ¿Qué es QSAR? Definiciones y formulismo". Introducción al modelado QSAR/QSPR: conceptos fundamentales . Nueva York: Springer-Verlag Inc. págs. 2–6. ISBN 978-3-319-17281-1.
  4. ^ Ghasemi, Pérez-Sánchez; Mehri, Pérez-Garrido (2018). "Redes neuronales y algoritmos de aprendizaje profundo utilizados en estudios QSAR: ventajas e inconvenientes". Descubrimiento de fármacos hoy . 23 (10): 1784-1790. doi :10.1016/j.drudis.2018.06.016. PMID  29936244. S2CID  49418479.
  5. ^ Nantasenamat C, Isarankura-Na-Ayudhya C, Naenna T, Prachayasittikul V (2009). "Una descripción práctica de la relación cuantitativa estructura-actividad". Diario Excl . 8 : 74–88. doi :10.17877/DE290R-690.
  6. ^ Nantasenamat C, Isarankura-Na-Ayudhya C, Prachayasittikul V (julio de 2010). "Avances en métodos computacionales para predecir la actividad biológica de compuestos". Opinión de expertos sobre el descubrimiento de fármacos . 5 (7): 633–54. doi :10.1517/17460441.2010.492827. PMID  22823204. S2CID  17622541.
  7. ^ ab Yousefinejad S, Hemmateenejad B (2015). "Herramientas de quimiometría en estudios QSAR/QSPR: una perspectiva histórica". Quimiometría y Sistemas Inteligentes de Laboratorio . 149, Parte B: 177–204. doi :10.1016/j.chemolab.2015.06.016.
  8. ^ ab Tropsha A , Gramatica P, Gombar VJ (2003). "La importancia de ser serio: la validación es absolutamente esencial para la aplicación e interpretación exitosa de los modelos QSPR". Peine QSAR. Ciencia . 22 : 69–77. doi :10.1002/qsar.200390007.
  9. ^ ab Gramatica P (2007). "Principios de validación de modelos QSAR: internos y externos". Peine QSAR. Ciencia . 26 (5): 694–701. doi :10.1002/qsar.200610151. hdl : 11383/1668881 .
  10. ^ Ruusmann, V.; Sild, S.; Marán, U. (2015). "Repositorio QSAR DataBank: modelos de relación estructura-actividad cualitativos y cuantitativos abiertos y vinculados". Revista de quimioinformática . 7 : 32. doi : 10.1186/s13321-015-0082-6 . PMC 4479250 . PMID  26110025. 
  11. ^ abc Chirico N, Gramatica P (agosto de 2012). "Predictividad externa real de los modelos QSAR. Parte 2. Nuevos umbrales intercomparables para diferentes criterios de validación y la necesidad de inspección de diagramas de dispersión". Revista de información y modelado químico . 52 (8): 2044–58. doi :10.1021/ci300084j. PMID  22721530.
  12. ^ Tropsha, Alejandro (2010). "Mejores prácticas para el desarrollo, validación y explotación de modelos QSAR". Informática Molecular . 29 (6–7): 476–488. doi :10.1002/minf.201000061. ISSN  1868-1743. PMID  27463326. S2CID  23564249.
  13. ^ Patani GA, LaVoie EJ (diciembre de 1996). "Bioisosterismo: un enfoque racional en el diseño de fármacos". Reseñas químicas . 96 (8): 3147–3176. doi :10.1021/cr950066q. PMID  11848856.
  14. ^ Marrón N (2012). Bioisosteres en Química Medicinal . Weinheim: Wiley-VCH. ISBN 978-3-527-33015-7.
  15. ^ Thompson SJ, Hattotuwagama CK, Holliday JD, Flower DR (2006). "Sobre la hidrofobicidad de los péptidos: comparación de predicciones empíricas de valores de log P de péptidos". Bioinformación . 1 (7): 237–41. doi :10.6026/97320630001237. PMC 1891704 . PMID  17597897. 
  16. ^ Wildman SA, Crippen GM (1999). "Predicción de parámetros fisicoquímicos por aportaciones atómicas". J. química. inf. Computadora. Ciencia . 39 (5): 868–873. doi :10.1021/ci990307l.
  17. ^ ab Ajmani S, Jadhav K, Kulkarni SA, QSAR basado en grupo (G-QSAR)
  18. ^ Manoharan P, Vijayan RS, Ghoshal N (octubre de 2010). "Racionalización del descubrimiento de fármacos basado en fragmentos para BACE1: conocimientos de estudios FB-QSAR, FB-QSSR, multiobjetivo (MO-QSPR) y MIF". Revista de diseño molecular asistido por computadora . 24 (10): 843–64. Código Bib : 2010JCAMD..24..843M. doi :10.1007/s10822-010-9378-9. PMID  20740315. S2CID  1171860.
  19. ^ ab Prasanth Kumar S, Jasrai YT, Pandya HA, Rawal RM (noviembre de 2013). "QSAR basado en similitudes de farmacóforos (PS-QSAR) para predicciones de actividad biológica específicas de un grupo". Revista de estructura y dinámica biomoleculares . 33 (1): 56–69. doi :10.1080/07391102.2013.849618. PMID  24266725. S2CID  45364247.
  20. ^ Lixiviación AR (2001). Modelado molecular: principios y aplicaciones . Englewood Cliffs, Nueva Jersey: Prentice Hall. ISBN 978-0-582-38210-7.
  21. ^ Vert JP, Schölkopf B, Tsuda K (2004). Métodos kernel en biología computacional . Cambridge, Masa: MIT Press. ISBN 978-0-262-19509-6.
  22. ^ Dietterich TG, Lathrop RH, Lozano-Pérez T (1997). "Resolver el problema de instancias múltiples con rectángulos paralelos a los ejes". Inteligencia artificial . 89 (1–2): 31–71. doi :10.1016/S0004-3702(96)00034-3.
  23. ^ Caruthers JM, Lauterbach JA, Thomson KT, Venkatasubramanian V, Snively CM, Bhan A, Katare S, Oskarsdottir G (2003). "Diseño de catalizador: extracción de conocimientos a partir de experimentación de alto rendimiento". J. Catal . 216 (1–2): 3776–3777. doi :10.1016/S0021-9517(02)00036-2.
  24. ^ Manz TA, Phomphrai K, Medvedev G, Krishnamurthy BB, Sharma S, Haq J, Novstrup KA, Thomson KT, Delgass WN, Caruthers JM, Abu-Omar MM (abril de 2007). "Correlación estructura-actividad en catalizadores de polimerización de olefinas de sitio único de titanio que contienen ligadura mixta de ciclopentadienilo/arilóxido". Revista de la Sociedad Química Estadounidense . 129 (13): 3776–7. doi :10.1021/ja0640849. PMID  17348648.
  25. ^ Manz TA, Caruthers JM, Sharma S, Phomphrai K, Thomson KT, Delgass WN, Abu-Omar MM (2012). "Correlación estructura-actividad para el inicio relativo de la cadena y las tasas de propagación en catálisis de polimerización de olefinas en un solo sitio". Organometálicos . 31 (2): 602–618. doi :10.1021/om200884x.
  26. ^ Jastrzębski, Estanislao; Leśniak, Damián; Czarnecki, Wojciech Marian (8 de marzo de 2018). "Aprender a SONREÍR (S)". arXiv : 1602.06289 [cs.CL].
  27. ^ Bjerrum, Esben Jannik (17 de mayo de 2017). "Enumeración de SMILES como aumento de datos para el modelado de moléculas de redes neuronales". arXiv : 1703.07076 [cs.LG].
  28. ^ Mayr, Andrés; Klambauer, Günter; Unterthiner, Thomas; Steijaert, Marvin; Wegner, Jörg K.; Ceulemans, Hugo; Inteligente, Djork-Arné; Hochreiter, Sepp (20 de junio de 2018). "Comparación a gran escala de métodos de aprendizaje automático para la predicción de objetivos de fármacos en ChEMBL". Ciencia Química . 9 (24): 5441–5451. doi :10.1039/c8sc00148k. PMC 6011237 . PMID  30155234. 
  29. ^ Merkwith, cristiano; Lengauer, Thomas (1 de septiembre de 2005). "Generación automática de descriptores complementarios con redes de gráficos moleculares". Revista de información y modelado químico . 45 (5): 1159-1168. doi :10.1021/ci049613b. PMID  16180893.
  30. ^ Kearnes, Steven; McCloskey, Kevin; Berndl, Marc; Pande, Vijay; Riley, Patrick (1 de agosto de 2016). "Convoluciones de gráficos moleculares: más allá de las huellas dactilares". Revista de diseño molecular asistido por computadora . 30 (8): 595–608. arXiv : 1603.00856 . Código Bib : 2016JCAMD..30..595K. doi :10.1007/s10822-016-9938-8. PMC 5028207 . PMID  27558503. 
  31. ^ Jiang, Dejun; Wu, Zhenxing; Hsieh, Chang-Yu; Chen, Guangyong; Liao, Ben; Wang, Zhe; Shen, Chao; Cao, Dongsheng; Wu, Jian; Hou, Tingjun (17 de febrero de 2021). "¿Podrían las redes neuronales gráficas aprender una mejor representación molecular para el descubrimiento de fármacos? Un estudio comparativo de modelos basados ​​en descriptores y basados ​​en gráficos". Revista de quimioinformática . 13 (1): 12. doi : 10.1186/s13321-020-00479-8 . PMC 7888189 . PMID  33597034. 
  32. ^ van Tilborg, Derek; Alenicheva, Alisa; Grisoni, Francesca (12 de diciembre de 2022). "Exponiendo las limitaciones del aprendizaje automático molecular con acantilados de actividad". Revista de información y modelado químico . 62 (23): 5938–5951. doi :10.1021/acs.jcim.2c01073. PMC 9749029 . PMID  36456532. 
  33. ^ Gusfield D (1997). Algoritmos sobre cadenas, árboles y secuencias: informática y biología computacional . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-58519-4.
  34. ^ Helma C (2005). Toxicología predictiva . Washington, DC: Taylor y Francis. ISBN 978-0-8247-2397-2.
  35. ^ Dossetter AG, Griffen EJ, Leach AG (2013). "Análisis de pares moleculares coincidentes en el descubrimiento de fármacos". Descubrimiento de fármacos hoy . 18 (15–16): 724–31. doi :10.1016/j.drudis.2013.03.003. PMID  23557664.
  36. ^ Sushko Y, Novotarskyi S, Körner R, Vogt J, Abdelaziz A, Tetko IV (2014). "Pares moleculares coincidentes basados ​​en predicciones para interpretar QSAR y ayudar en el proceso de optimización molecular". Revista de quimioinformática . 6 (1): 48. doi : 10.1186/s13321-014-0048-0 . PMC 4272757 . PMID  25544551. 
  37. ^ Tong W, Hong H, Xie Q, Shi L, Fang H, Perkins R (abril de 2005). "Evaluación de las limitaciones de QSAR: una perspectiva regulatoria". Diseño actual de fármacos asistido por computadora . 1 (2): 195–205. doi :10.2174/1573409053585663.
  38. ^ DeardenJC (2003). "Predicción in silico de la toxicidad de los fármacos". Revista de diseño molecular asistido por computadora . 17 (2–4): 119–27. Código Bib : 2003JCAMD..17..119D. doi :10.1023/A:1025361621494. PMID  13677480. S2CID  21518449.
  39. ^ Mundo S, Eriksson L (1995). "Validación estadística de resultados QSAR". En Waterbeemd, Han van de (ed.). Métodos quimiométricos en diseño molecular . Weinheim: VCH. págs. 309–318. ISBN 978-3-527-30044-0.
  40. ^ Roy K (diciembre de 2007). "Sobre algunos aspectos de la validación de modelos predictivos cuantitativos de relación estructura-actividad". Opinión de expertos sobre el descubrimiento de fármacos . 2 (12): 1567–77. doi :10.1517/17460441.2.12.1567. PMID  23488901. S2CID  21305783.
  41. ^ Sahigara, Faizán; Mansouri, Kamel; Ballabio, Davide; Mauri, Andrea; Consonni, Viviana; Todeschini, Roberto (2012). "Comparación de diferentes enfoques para definir el dominio de aplicabilidad de los modelos QSAR". Moléculas . 17 (5): 4791–4810. doi : 10,3390/moléculas17054791 . PMC 6268288 . PMID  22534664. 
  42. ^ Leonard JT, Roy K (2006). "Sobre la selección de conjuntos de entrenamiento y prueba para el desarrollo de modelos QSAR predictivos". QSAR y ciencia combinatoria . 25 (3): 235–251. doi :10.1002/qsar.200510161.
  43. ^ Roy PP, Leonard JT, Roy K (2008). "Explorando el impacto del tamaño de los conjuntos de entrenamiento para el desarrollo de modelos QSAR predictivos". Quimiometría y Sistemas Inteligentes de Laboratorio . 90 (1): 31–42. doi :10.1016/j.chemolab.2007.07.004.
  44. ^ Pon R, Vander Heyden Y (octubre de 2007). "Revisión sobre aspectos de modelado en relaciones cuantitativas estructura-retención de cromatografía líquida de fase reversa". Analytica Chimica Acta . 602 (2): 164–72. doi :10.1016/j.aca.2007.09.014. PMID  17933600.
  45. ^ Pratim Roy P, Paul S, Mitra I, Roy K (2009). "Sobre dos parámetros novedosos para la validación de modelos QSAR predictivos". Moléculas . 14 (5): 1660–701. doi : 10,3390/moléculas14051660 . PMC 6254296 . PMID  19471190. 
  46. ^ Chirico N, Gramatica P (septiembre de 2011). "Predictividad externa real de los modelos QSAR: ¿cómo evaluarla? Comparación de diferentes criterios de validación y propuesta de uso del coeficiente de correlación de concordancia". Revista de información y modelado químico . 51 (9): 2320–35. doi :10.1021/ci200211n. PMID  21800825.
  47. ^ Rouvray DH, Bonchev D (1991). Teoría de grafos químicos: introducción y fundamentos . Tunbridge Wells, Kent, Inglaterra: Abacus Press. ISBN 978-0-85626-454-2.
  48. ^ Fraczkiewicz, R (2013). "Predicción in silico de la ionización". En Reedijk, J (ed.). Módulo de Referencia en Química, Ciencias Moleculares e Ingeniería Química . Módulo de Referencia en Química, Ciencias Moleculares e Ingeniería Química [En línea] . vol. 5. Ámsterdam, Países Bajos: Elsevier. doi :10.1016/B978-0-12-409547-2.02610-X. ISBN 9780124095472.
  49. ^ Freyhult EK, Andersson K, Gustafsson MG (abril de 2003). "El modelado estructural amplía el análisis QSAR de las interacciones anticuerpo-lisozima a 3D-QSAR". Revista Biofísica . 84 (4): 2264–72. Código Bib : 2003BpJ....84.2264F. doi :10.1016/S0006-3495(03)75032-2. PMC 1302793 . PMID  12668435. 
  50. ^ Timmerman H, Todeschini R, Consonni V, Mannhold R, Kubinyi H (2002). Manual de descriptores moleculares . Weinheim: Wiley-VCH. ISBN 978-3-527-29913-3.
  51. ^ Duda RO, Hart PW, Cigüeña DG (2001). Clasificación de patrones . Chichester: John Wiley e hijos. ISBN 978-0-471-05669-0.
  52. ^ Fioravanzo, E.; Bassán, A.; Pavan, M.; Mostrag-Szlichtyng, A.; Vale la pena, AP (1 de abril de 2012). "Papel de las herramientas de genotoxicidad in silico en la evaluación regulatoria de impurezas farmacéuticas". SAR y QSAR en Investigación Ambiental . 23 (3–4): 257–277. doi :10.1080/1062936X.2012.657236. ISSN  1062-936X. PMID  22369620. S2CID  2714861.
  53. ^ ICH M7 Evaluación y control de impurezas reactivas (mutagénicas) del ADN en productos farmacéuticos para limitar el riesgo cancerígeno potencial - Directriz científica [1]
  54. ^ Lavecchia A (marzo de 2015). "Enfoques de aprendizaje automático en el descubrimiento de fármacos: métodos y aplicaciones". Descubrimiento de fármacos hoy . 20 (3): 318–31. doi :10.1016/j.drudis.2014.10.012. PMID  25448759.
  55. ^ Stålring JC, Carlsson LA, Almeida P, Boyer S (2011). "AZOrange: aprendizaje automático de código abierto de alto rendimiento para modelado QSAR en un entorno de programación gráfica". Revista de quimioinformática . 3 : 28. doi : 10.1186/1758-2946-3-28 . PMC 3158423 . PMID  21798025. 
  56. ^ Mauri, Andrea; Bertola, Matteo (2022). "Alvascience: un nuevo paquete de software para el flujo de trabajo QSAR aplicado a la permeabilidad de la barrera hematoencefálica". Revista Internacional de Ciencias Moleculares . 23 (12882): 12882. doi : 10.3390/ijms232112882 . PMC 9655980 . PMID  36361669. 
  57. ^ Fabián Pedregosa; Gaël Varoquaux; Alejandro Gramfort; Vicente Michel; Bertrand Thirion; Olivier Grisel; Mathieu Blondel; Peter Prettenhofer; Ron Weiss; Vicente Dubourg; Jake Vanderplas; Alejandro Passos; David Cournapeau; Matthieu Perrot; Édouard Duchesnay (2011). "scikit-learn: aprendizaje automático en Python". Revista de investigación sobre aprendizaje automático . 12 : 2825–2830.

Otras lecturas

enlaces externos