La notación de línea SYBYL o SLN es una especificación para describir de forma inequívoca la estructura de las moléculas químicas mediante cadenas ASCII cortas . SLN difiere de SMILES en varios aspectos importantes. SLN puede especificar moléculas, consultas moleculares y reacciones en una notación de una sola línea, mientras que SMILES las maneja mediante extensiones del lenguaje. SLN admite la estereoquímica relativa, puede distinguir mezclas de enantiómeros de moléculas puras con estereoquímica pura pero no resuelta. En SMILES, la aromaticidad se considera una propiedad tanto de los átomos como de los enlaces, mientras que en SLN es una propiedad de los enlaces.
Al igual que SMILES, SLN es un lenguaje lineal que describe moléculas. Esto ofrece muchas similitudes con SMILES a pesar de las muchas diferencias que existen entre SLN y SMILES y, como resultado, esta descripción comparará en gran medida SLN con SMILES y sus extensiones.
Los atributos, cadenas entre corchetes con datos adicionales como [key1=value1, key2...]
, son una característica fundamental de SLN. Los atributos se pueden aplicar a átomos y enlaces. Los atributos no definidos oficialmente están disponibles para los usuarios en extensiones privadas.
Al buscar moléculas, se pueden utilizar operadores de comparación como fcharge>-0.125
en lugar del signo igual habitual. Un !
precedente de un grupo clave/valor invierte el resultado de la comparación.
Las moléculas o reacciones enteras también pueden tener atributos. Los corchetes se sustituyen por un par de <>
signos.
Cualquier cosa que comience con una letra mayúscula identifica un átomo en SLN. Los hidrógenos no se agregan automáticamente, pero los enlaces simples con hidrógeno se pueden abreviar para compuestos orgánicos, lo que da como resultado en CH4
lugar de C(H)(H)(H)H
para metano . El autor sostiene que los hidrógenos explícitos permiten un análisis sintáctico más sólido.
Los atributos definidos para los átomos incluyen I=
el número de masa del isótopo, charge=
la carga formal, fcharge
la carga parcial, s=
la estereoquímica y spin=
los radicales ( s
, d
, t
respectivamente para singlete , doblete , triplete ). Una carga formal de charge=2
puede abreviarse como +2
, y viceversa para cargas negativas; -
y +
se reconoce adicionalmente como cargas −1 o +1. *
es una abreviatura de spin=d
. La estereoquímica en los átomos es principalmente tetraédrica, con R
/ S
y D
/ L
disponibles entre otros; puede ser explícita ( E
) o relativa ( R
), o especificar una mezcla ( M
) de estereoisómeros en este átomo. Se proporciona una notación normal/invertida ( N
/ I
), equivalente a @@
y @
en SMILES. Se proporcionan muchos atributos adicionales para la búsqueda.
Además de los átomos elementales, SLN admite la especificación de átomos comodín: Any
(coincidir con cualquier átomo) y Hev
(coincidir con cualquier átomo pesado). También tiene una sintaxis Markush extensa para especificar bibliotecas combinatorias y consultas RGROUP. SLN tiene varios tipos de átomos de consulta para hacer coincidir grupos de átomos. Cada tipo tiene el nombre del grupo, seguido de un entero positivo opcional.
El 0
número de masa " " denota el isótopo habitual, por lo que N[I=0]
equivale N[I=14]
a 14 N y N[!I=0]
a cualquier otro isótopo.
SLN utiliza en gran medida la misma notación de enlace que SMILES, con -
, =
, #
, y :
para enlaces simples, dobles, triples y aromáticos. .
se utiliza para enlaces de orden cero, de manera similar a la reacción SMILES, aunque +
se prefiere a para moléculas distintas.
La mayoría de los enlaces simples son implícitos, por lo que se puede utilizar CH3CH3
(CH 3 CH 3CH3-CH3
) en lugar de (CH 3 –CH 3 ) para el etano . Los enlaces simples explícitos son útiles para los enlaces de tres centros.
El s=
atributo se define para enlaces dobles, para transmitir información estereoquímica en notación E – Z ( E
/ Z
) o cis – trans ( c
/ ). / está disponible y representa la cadena "principal", que es trans o cis entre sí.t
N
I
SLN escribe anillos en un patrón más explícito que SMILES, donde el benceno se especifica como C[1]H:CH:CH:CH:CH:CH:@1
. Un átomo se etiqueta como ancla en el anillo con un solo atributo numérico y @1
luego se puede usar para especificar este átomo (en nuestro caso, el "número uno") para volver a unirse.
Las ramas SLN son idénticas a las ramas SMILES, con paréntesis que las especifican. El ácido propiónico es CH3CH2C(=O)OH
( ).
SLN admite reacciones que ->
conectan los reactivos y los productos. El mapeo de átomos es posible con el uso de atributos. El atributo de centro de reacción (rc) se puede agregar a los enlaces y el atributo de conversión quiral (cc) a los átomos.[#num]
Se pueden fusionar varias líneas en una sola línea sintáctica escribiendo una \
barra invertida al final de cada línea. Esto permite dividir una línea larga en varias líneas, por ejemplo, en una reacción en la que cada molécula ocupa su propia línea.