stringtranslate.com

Notación de línea SYBYL

La notación de líneas SYBYL o SLN es una especificación para describir sin ambigüedades la estructura de moléculas químicas utilizando cadenas ASCII cortas . SLN se diferencia de SMILES en varios aspectos importantes. SLN puede especificar moléculas, consultas moleculares y reacciones en una notación de una sola línea, mientras que SMILES las maneja a través de extensiones de lenguaje. SLN admite la estereoquímica relativa; puede distinguir mezclas de enantiómeros de moléculas puras con estereoquímica pura pero no resuelta. En SMILES la aromaticidad se considera una propiedad tanto de los átomos como de los enlaces, mientras que en SLN es una propiedad de los enlaces.

Descripción

Al igual que SMILES, SLN es un lenguaje lineal que describe moléculas. Esto proporciona muchas similitudes con SMILES a pesar de las muchas diferencias de SLN con SMILES y, como resultado, esta descripción comparará en gran medida SLN con SMILES y sus extensiones.

Atributos

Los atributos, cadenas entre corchetes con datos adicionales como [key1=value1, key2...], son una característica principal de SLN. Los atributos se pueden aplicar a átomos y enlaces. Los atributos no definidos oficialmente están disponibles para los usuarios para extensiones privadas.

Al buscar moléculas, se pueden utilizar operadores de comparación como fcharge>-0.125en lugar del habitual signo igual. Un !grupo de clave/valor que precede a un grupo de clave/valor invierte el resultado de la comparación.

Moléculas o reacciones enteras también pueden tener atributos. Los corchetes se cambian por un par de <>signos.

átomos

Todo lo que comienza con una letra mayúscula identifica un átomo en SLN. Los hidrógenos no se añaden automáticamente, pero los enlaces simples con hidrógeno pueden abreviarse para compuestos orgánicos, lo que resulta en CH4lugar C(H)(H)(H)Hde metano . El autor sostiene que los hidrógenos explícitos permiten un análisis más sólido.

Los atributos definidos para los átomos incluyen I=el número de masa del isótopo, charge=la carga formal, fchargela carga parcial, s=la estereoquímica y spin=los radicales ( s, drespectivamente t, singlete , doblete , triplete ). Una carga formal de charge=2puede abreviarse como +2y viceversa para cargas negativas; -y +además se reconoce como cargos −1 o +1. *es una abreviatura de spin=d. La estereoquímica de los átomos es mayoritariamente tetraédrica, estando R/ Sy D/ Ldisponibles, entre otros; puede ser explícito ( E) o relativo ( R), o especificar una mezcla ( M) de estereoisómeros en este átomo. Se proporciona una notación normal/invertida ( N/ I), equivalente a @@y @en SMILES. Se proporcionan muchos atributos adicionales para la búsqueda.

Además de los átomos elementales, SLN admite la especificación de átomos comodín: Any(coincide con cualquier átomo) y Hev(coincide con cualquier átomo pesado). También tiene una sintaxis Markush extensa para especificar bibliotecas combinatorias y consultas RGROUP. SLN tiene varios tipos de átomos de consulta para hacer coincidir grupos de átomos. Cada tipo tiene el nombre del grupo, seguido de un entero positivo opcional.

El " 0" número de masa denota el isótopo habitual, por lo que N[I=0]equivale N[I=14]a 14 N y N[!I=0]a cualquier otro isótopo.

Cautiverio

SLN utiliza en gran medida la misma notación de enlace que SMILES, con -, =, #y :para enlaces simples, dobles, triples y aromáticos. .se usa para enlaces de orden cero, de manera similar a la reacción SMILES, aunque +se prefiere a para moléculas distintas.

La mayoría de los enlaces simples están implícitos, por lo que se puede usar CH3CH3(CH 3 CH 3CH3-CH3 ) en lugar de (CH 3 –CH 3 ) para el etano . Los enlaces simples explícitos son útiles para enlaces de tres centros.

El s=atributo se define para dobles enlaces, para transmitir información estereoquímica en notación EZ ( E/ Z) o cistrans ( c/ t). N/ Iestá disponible y representa la cadena "principal", que es trans o cis entre sí.

Anillos

SLN escribe anillos en un patrón más explícito que SMILES, con benceno especificado como C[1]H:CH:CH:CH:CH:CH:@1. Un átomo se etiqueta como un ancla en el anillo con un único atributo numérico y @1luego se puede usar para especificar este átomo (en nuestro caso, el "número uno") al que volver a unirse.

Derivación

Las ramas SLN son idénticas a las ramas SMILES, y los paréntesis las especifican. El ácido propiónico es CH3CH2C(=O)OH( ).

Reacciones

SLN apoya reacciones ->conectando los reactivos y los productos. El mapeo de átomos es posible con el uso de atributos. El atributo del centro de reacción (rc) se puede agregar a los enlaces y el atributo de conversión quiral (cc) a los átomos.[#num]

Varios.

Se pueden fusionar varias líneas en una línea sintáctica escribiendo una \(barra invertida) al final de cada línea. Esto permite dividir una línea larga en múltiples líneas, por ejemplo en una reacción con cada molécula en su propia línea.

Ver también

Referencias