Las letras son A, C, G y T, que simbolizan las cuatro subunidades de nucleótidos de una banda ADN - adenina, citosina, guanina, timina, que son bases covalentemente ligadas a cadenas fosfóricas.
En el típico caso, las secuencias se presentan pegadas unas a las otras, sin espacios, como en la secuencia AAAGTCTGAC, yendo de 5' a 3' de izquierda a derecha.
En relación con su función biológica, que puede depender del contexto, una secuencia puede tener sentido o contrasentido, y ser tanto codificante o no codificante.
En algunos casos especiales, las letras seguidas de A, T, C y G se presentan en una secuencia.
Las reglas de la Unión Internacional de Química Pura y Aplicada (IUPAC).