Ha sido modificada y extendida por otros, destacando Daylight Chemical Information Systems Inc.
Los términos describen atributos diferentes de las cadenas SMILES y no son mutuamente excluyentes.
Generalmente se puede escribir un número de cadenas SMILES igualmente válidas para una molécula.
Estos algoritmos convierten primero el SMILES a una representación interna de la estructura molecular y no simplemente manipulan las cadenas como se piensa algunas veces.
Los átomos están representados por la abreviatura estándar de cada elemento químico, entre corchetes, tales como [Au] para el oro.
Los corchetes pueden ser omitidos para "subconjuntos orgánicos" de B, C, N, O, P, S, F, Cl, Br, y I.
Un átomo que lleva una o varias carga(s) eléctrica(s) es encerrado en corchetes (cualquiera que sea), seguido del símbolo H si es ligado a uno o varios átomo(s) de hidrógeno (estos son entonces seguidos de su número, excepto si no hay que uno: NH4 para el amonio), luego del signo '+' para una carga positiva, o del signo '-' para una carga negativa.
Los átomos aromáticos pueden estar unidos por enlace simple a otros, con lo que el bifenilo puede ser representado por c1ccccc1-c2ccccc2.
Los anillos sustituidos pueden ser escritos con el punto de ramificación en el anillo, como se ilustra en las cadenas SMILES COc(c1)cccc1C#N (ver representación) y COc(cc1)ccc1C#N (ver representación), que codifican a los isómeros 3-cianoanisol y 4-cianoanisol.
Al escribir las cadenas SMILES para anillos sustituidos en esta forma se pueden hacerlas más legibles.
La configuración de los enlaces dobles se especifica usando los caracteres "/" y "\".
La configuración del átomo de carbono tetraédrico se especifica mediante @ o @@.
Hay muchas utilidades de conversión disponibles, basadas en web y descargables.