SMILES

Ha sido modificada y extendida por otros, destacando Daylight Chemical Information Systems Inc.

Los términos describen atributos diferentes de las cadenas SMILES y no son mutuamente excluyentes.

Generalmente se puede escribir un número de cadenas SMILES igualmente válidas para una molécula.

Estos algoritmos convierten primero el SMILES a una representación interna de la estructura molecular y no simplemente manipulan las cadenas como se piensa algunas veces.

Los átomos están representados por la abreviatura estándar de cada elemento químico, entre corchetes, tales como [Au] para el oro.

Los corchetes pueden ser omitidos para "subconjuntos orgánicos" de B, C, N, O, P, S, F, Cl, Br, y I.

Un átomo que lleva una o varias carga(s) eléctrica(s) es encerrado en corchetes (cualquiera que sea), seguido del símbolo H si es ligado a uno o varios átomo(s) de hidrógeno (estos son entonces seguidos de su número, excepto si no hay que uno: NH4 para el amonio), luego del signo '+' para una carga positiva, o del signo '-' para una carga negativa.

Los átomos aromáticos pueden estar unidos por enlace simple a otros, con lo que el bifenilo puede ser representado por c1ccccc1-c2ccccc2.

Los anillos sustituidos pueden ser escritos con el punto de ramificación en el anillo, como se ilustra en las cadenas SMILES COc(c1)cccc1C#N (ver representación) y COc(cc1)ccc1C#N (ver representación), que codifican a los isómeros 3-cianoanisol y 4-cianoanisol.

Al escribir las cadenas SMILES para anillos sustituidos en esta forma se pueden hacerlas más legibles.

La configuración de los enlaces dobles se especifica usando los caracteres "/" y "\".

La configuración del átomo de carbono tetraédrico se especifica mediante @ o @@.

Hay muchas utilidades de conversión disponibles, basadas en web y descargables.

Ejemplo de derivación de representación SMILES. A. Estructura de la molécula, la ciprofloxacina . B. Supresión de los átomos de hidrógeno, abertura de anillos y numeración. C. Árbol cubriendo la estructura de-ciclisado. D. Cadena SMILES correspondiente, el código de color corresponde al color de las ramas el tablero C.
Visualización del 3-cianoanisol como COc(c1)cccc1C#N.