stringtranslate.com

SMILES especificación de objetivo arbitraria

La especificación de objetivo arbitrario SMILES (SMARTS) es un lenguaje para especificar patrones subestructurales en moléculas . La notación de líneas SMARTS es expresiva y permite una especificación subestructural y una tipificación de átomos extremadamente precisas y transparentes.

SMARTS está relacionado con la notación de líneas SMILES que se utiliza para codificar estructuras moleculares y, al igual que SMILES, fue desarrollado originalmente por David Weininger y sus colegas de Daylight Chemical Information Systems. Las descripciones más completas del lenguaje SMARTS se pueden encontrar en el manual de teoría SMARTS de Daylight, [1] tutorial [2] y ejemplos. [3] OpenEye Scientific Software ha desarrollado su propia versión de SMARTS que difiere de la versión original Daylight en cómo Rse define el descriptor (ver ciclicidad a continuación).

Sintaxis inteligente

Propiedades atómicas

Los átomos se pueden especificar mediante símbolo o número atómico. El carbono alifático coincide con [C], el carbono aromático con [c]y cualquier carbono con [#6]o [C,c]. Los símbolos comodín *y coinciden Acon acualquier átomo, cualquier átomo alifático y cualquier átomo aromático respectivamente. Los hidrógenos implícitos se consideran una característica de los átomos y el SMARTS para un grupo amino se puede escribir como [NH2]. La carga se especifica mediante los descriptores +y -como lo ejemplifican los SMARTS [nH+]( átomo de nitrógeno aromático protonado ) y [O-]C(=O)c( ácido carboxílico aromático desprotonado ).

Cautiverio

Se pueden especificar varios tipos de enlaces: -(simple), =(doble), #(triple), :(aromático) y ~(cualquiera).

Conectividad

Los descriptores Xy Dse utilizan para especificar el número total de conexiones (incluidos los átomos de hidrógeno implícitos) y las conexiones a átomos explícitos. Por lo tanto, [CX4]empareja átomos de carbono con enlaces a otros cuatro átomos cualesquiera, mientras que [CD4]empareja carbono cuaternario.

ciclicidad

Tal como lo definió originalmente Daylight, el Rdescriptor se utiliza para especificar la membresía del anillo. En el modelo Daylight para sistemas cíclicos, el conjunto más pequeño de anillos más pequeños (SSSR) [4] se utiliza como base para la pertenencia al anillo. Por ejemplo, el indol se percibe como un anillo de 5 miembros fusionado con un anillo de 6 miembros en lugar de un anillo de 9 miembros. Los dos átomos de carbono que forman la fusión del anillo coincidirían [cR2]y los otros átomos de carbono coincidirían [cR1].

El modelo SSSR ha sido criticado por OpenEye [5] quien, en su implementación de SMARTS, utiliza Rpara denotar el número de enlaces de anillo de un átomo. Los dos átomos de carbono en la fusión del anillo coinciden [cR3]y los otros carbonos coinciden [cR2]en la implementación OpenEye de SMARTS. Usado sin número, Respecifica un átomo en un anillo en ambas implementaciones, por ejemplo [CR](átomo de carbono alifático en el anillo).

Las minúsculas respecifican el tamaño del anillo más pequeño del que forma parte el átomo. Los átomos de carbono de la fusión del anillo coincidirían [cr5]. Los enlaces se pueden especificar como cíclicos, por ejemplo, C@Ccoinciden con átomos unidos directamente en un anillo.

Operadores logicos

Cuatro operadores lógicos permiten combinar descriptores de átomos y enlaces. El operador 'y' ;se puede utilizar para definir una amina primaria protonada como [N;H3;+][C;X4]. El operador 'o' ,tiene una prioridad más alta, por lo que [c,n;H]define (carbono aromático o nitrógeno aromático) con hidrógeno implícito. El operador 'y' &tiene mayor prioridad que ,la que [c,n&H]define el carbono aromático o (nitrógeno aromático con hidrógeno implícito).

El operador 'no' !se puede utilizar para definir carbono alifático insaturado como [C;!X4]y enlaces acíclicos como *-!@*.

INTELIGENTES recursivos

Los SMARTS recursivos permiten una especificación detallada del entorno de un átomo. Por ejemplo, los átomos de carbono orto y para del fenol más reactivos (con respecto a la sustitución aromática electrófila ) se pueden definir como .[$(c1c([OH])cccc1),$(c1ccc([OH])cc1)]

Ejemplos de INTELIGENCIAS

Daylight ha recopilado varios ejemplos ilustrativos de SMARTS.

Las definiciones de donantes y aceptores de enlaces de hidrógeno utilizadas para aplicar la Regla de Cinco de Lipinski [6] se codifican fácilmente en SMARTS. Los donantes se definen como átomos de nitrógeno u oxígeno que tienen al menos un átomo de hidrógeno unido directamente:

[N,n,O;!H0]o [#7,#8;!H0](el oxígeno aromático no puede tener un hidrógeno unido)

Los aceptores se definen como nitrógeno u oxígeno:

[N,n,O,o]o[#7,#8]

Una definición simple de aminas alifáticas que probablemente protonen a pH fisiológico se puede escribir como el siguiente SMARTS recursivo:

[$([NH2][CX4]),$([NH]([CX4])[CX4]),$([NX3]([CX4])([CX4])[CX4])]

En aplicaciones reales, los CX4átomos necesitarían definirse con mayor precisión para evitar la coincidencia con grupos aceptores de electrones como el CF 3 que haría que la amina no fuera lo suficientemente básica para protonar a pH fisiológico .

SMARTS se puede utilizar para codificar elementos farmacóforos , como los centros aniónicos. En el siguiente ejemplo, se utiliza la notación SMARTS recursiva para combinar oxígeno ácido y nitrógeno de tetrazol en una definición de átomos de oxígeno que probablemente sean aniónicos en condiciones fisiológicas normales.

[$([OH][C,S,P]=O),$([nH]1nnnc1)]

El SMARTS anterior solo coincidiría con el hidroxilo ácido y el tetrazol N-H. Cuando un ácido carboxílico se desprotona, la carga negativa se deslocaliza sobre ambos átomos de oxígeno y puede ser deseable designarlos a ambos como aniónicos. Esto se puede lograr utilizando los siguientes SMARTS.

[$([OH])C=O),$(O=C[OH])]

Aplicaciones de SMARTS

La especificación subestructural precisa y transparente que permite SMARTS se ha aprovechado en varias aplicaciones.

Los filtros subestructurales definidos en SMARTS se han utilizado [7] para identificar compuestos indeseables al realizar agrupaciones estratégicas de compuestos para una detección de alto rendimiento. El procedimiento REOS (eliminación rápida de desechos) [8] utiliza SMARTS para filtrar restos reactivos, tóxicos y no deseados de bases de datos de estructuras químicas.

RECAP [9] (Procedimiento de análisis combinatorio retrosintético) utiliza SMARTS para definir los tipos de enlaces. RECAP es un editor de moléculas que genera fragmentos de estructuras rompiendo enlaces de tipos definidos y los puntos de enlace originales en estos se especifican mediante etiquetas isotópicas. La búsqueda de fragmentos en bases de datos de compuestos biológicamente activos permite identificar motivos estructurales privilegiados. El Molecular Slicer [10] es similar a RECAP y se ha utilizado para identificar fragmentos que se encuentran comúnmente en medicamentos orales comercializados.

El programa Leatherface [11] es un editor de moléculas de propósito general que permite la modificación automatizada de una serie de características subestructurales de moléculas en bases de datos, incluido el estado de protonación, el recuento de hidrógeno, la carga formal, el peso isotópico y el orden de los enlaces. Las reglas de edición molecular utilizadas por Leatherface están definidas en SMARTS. Leatherface se puede utilizar para estandarizar estados tautoméricos y de ionización y para establecerlos y enumerarlos en la preparación de bases de datos [12] para detección virtual . Leatherface se ha utilizado en el análisis de pares moleculares emparejados , que permite cuantificar los efectos de los cambios estructurales (por ejemplo, sustitución de hidrógeno por cloro), [13] en una variedad de tipos estructurales.

ALADDIN [14] es un programa de comparación de farmacóforos que utiliza SMARTS para definir puntos de reconocimiento (por ejemplo, aceptor de enlaces de hidrógeno neutro ) de farmacóforos. Un problema clave en la comparación de farmacóforos es que los grupos funcionales que probablemente estén ionizados a pH fisiológico generalmente se registran en sus formas neutras en bases de datos estructurales. El programa de coincidencia de formas ROCS permite definir tipos de átomos utilizando SMARTS. [15]

notas y referencias

  1. ^ Manual de teoría SMARTS, Sistemas de información química diurna, Santa Fe, Nuevo México
  2. ^ Tutorial SMARTS, Sistemas de información química diurna, Santa Fe, Nuevo México
  3. ^ Ejemplos de SMARTS, Sistemas de información química diurna, Santa Fe, Nuevo México.
  4. ^ Downs, director general; Gillet, VJ; Holliday, JD; Lynch, MF (1989). "Una revisión de los algoritmos de percepción de anillos para gráficos químicos". J. química. inf. Computadora. Ciencia. 29 (3): 172–187. doi :10.1021/ci00063a007.
  5. ^ "El conjunto más pequeño de anillos más pequeños (SSSR) se considera nocivo". Archivado desde el original el 14 de octubre de 2007 . Consultado el 8 de febrero de 2017 .{{cite web}}: CS1 maint: bot: original URL status unknown (link), OEChem - Manual de C++, Versión 1.5.1, Software científico OpenEye, Santa Fe, Nuevo México
  6. ^ Lipinski, Christopher A.; Lombardo, Franco; Dominy, Beryl W.; Feeney, Paul J. (2001). "Enfoques experimentales y computacionales para estimar la solubilidad y la permeabilidad en entornos de descubrimiento y desarrollo de fármacos". Reseñas de administración avanzada de medicamentos . 46 (1–3): 3–26. doi :10.1016/S0169-409X(00)00129-0. PMID  11259830.
  7. ^ Hann, Mike; Hudson, Brian; Lewell, Xiao; Vivo, Rob; Molinero, Lucas; Ramsden, Nigel (1999). "Agrupación estratégica de compuestos para el cribado de alto rendimiento". Revista de Información Química y Ciencias de la Computación . 39 (5): 897–902. doi :10.1021/ci990423o. PMID  10529988.
  8. ^ Walters, W. Patrick; Murcko, Mark A. (2002). "Predicción de 'parecido a las drogas'". Revisiones de administración avanzada de medicamentos . 54 (3): 255–271. doi :10.1016/S0169-409X(02)00003-0. PMID  11922947.
  9. ^ Lewell, Xiao Qing; Judd, Duncan B.; Watson, Stephen P.; Hann, Michael M. (1998). "Procedimiento de análisis combinatorio retrosintético RECAP: una nueva y poderosa técnica para identificar fragmentos moleculares privilegiados con aplicaciones útiles en química combinatoria". Revista de Información Química y Ciencias de la Computación . 38 (3): 511–522. doi :10.1021/ci970429i. PMID  9611787.
  10. ^ Vieth, Mical; Siegel, millas G.; Higgs, Richard E.; Watson, Ian A.; Robertson, Daniel H.; Savin, Kenneth A.; Durst, Gregory L.; Hipskind, Philip A. (2004). "Propiedades físicas características y fragmentos estructurales de fármacos orales comercializados". Revista de Química Medicinal . 47 (1): 224–232. doi :10.1021/jm030267j. PMID  14695836.
  11. ^ Kenny, Peter W.; Sadowski, Jens (2005). "Modificación de estructura en bases de datos químicas". Quimioinformática en el descubrimiento de fármacos. Métodos y principios de química medicinal. págs. 271–285. doi :10.1002/3527603743.ch11. ISBN 9783527307531.
  12. ^ Lyne, Paul D.; Kenny, Peter W.; Cosgrove, David A.; Deng, Chun; Zabludoff, Sonya; Wendoloski, John J.; Ashwell, Susan (2004). "Identificación de compuestos con afinidad de unión nanomolar para el punto de control quinasa-1 mediante un cribado virtual basado en el conocimiento". Revista de Química Medicinal . 47 (8): 1962–1968. doi :10.1021/jm030504i. PMID  15055996.
  13. ^ Leach, Andrew G.; Jones, Huw D.; Cosgrove, David A.; Kenny, Peter W.; Ruston, Linette; MacFaul, Philip; Madera, J. Mateo; Colclough, Nicola; Ley, Brian (2006). "Pares moleculares coincidentes como guía en la optimización de propiedades farmacéuticas; un estudio de solubilidad acuosa, unión a proteínas plasmáticas y exposición oral". Revista de Química Medicinal . 49 (23): 6672–6682. doi :10.1021/jm0605233. PMID  17154498.
  14. ^ Van Drie, John H.; Weininger, David; Martín, Yvonne C. (1989). "ALADDIN: una herramienta integrada para el diseño molecular asistido por computadora y el reconocimiento de farmacóforos a partir de la búsqueda geométrica, estérica y de subestructuras de estructuras moleculares tridimensionales". Revista de diseño molecular asistido por computadora . 3 (3): 225–251. doi :10.1007/BF01533070. PMID  2573695. S2CID  206795998.
  15. ^ Software científico OpenEye | ROCS