SOLiD (secuenciación por ligación y detección de oligonucleótidos) es una tecnología de secuenciación de ADN de última generación desarrollada por Life Technologies y que está disponible comercialmente desde 2006. Esta tecnología de última generación genera entre 108 y 109 lecturas de secuencias pequeñas a la vez. Utiliza una codificación de 2 bases para decodificar los datos sin procesar generados por la plataforma de secuenciación y convertirlos en datos de secuencia.
Este método no debe confundirse con la "secuenciación por síntesis", un principio utilizado por la pirosecuenciación Roche-454 (introducida en 2005, generando millones de lecturas de 200-400 pb en 2009), y el sistema Solexa (ahora propiedad de Illumina) (introducido en 2006, generando cientos de millones de lecturas de 50-100 pb en 2009).
Estos métodos han reducido el costo de $0.01/base en 2004 a casi $0.0001/base en 2006 y han aumentado la capacidad de secuenciación de 1,000,000 bases/máquina/día en 2004 a más de 5,000,000,000 bases/máquina/día en 2009. Existen más de 30 publicaciones que describen su uso primero para posicionamiento de nucleosomas de Valouev et al., [1] perfil transcripcional o RNA-Seq sensible a la cadena con Cloonan et al., [2] perfil transcripcional de células individuales con Tang et al. [3] y finalmente resecuenciación humana con McKernan et al. [4]
Se ha informado que el método utilizado por esta máquina (secuenciación por ligadura) tiene algunos problemas al secuenciar secuencias palindrómicas. [5]
Se prepara una biblioteca de fragmentos de ADN a partir de la muestra que se va a secuenciar y se utiliza para preparar poblaciones de perlas clonales. Es decir, solo habrá una especie de fragmento presente en la superficie de cada perla magnética. Los fragmentos unidos a las perlas magnéticas tendrán una secuencia adaptadora P1 universal unida, de modo que la secuencia de inicio de cada fragmento sea conocida e idéntica. La PCR en emulsión se lleva a cabo en microrreactores que contienen todos los reactivos necesarios para la PCR. Las perlas con los productos de PCR resultantes se depositan en un portaobjetos de vidrio.
Los cebadores se hibridan con la secuencia adaptadora P1 dentro de la plantilla de la biblioteca. Un conjunto de cuatro sondas de dibase marcadas con fluorescencia compiten por la ligación con el cebador de secuenciación. La especificidad de la sonda de dibase se logra interrogando cada primera y segunda base en cada reacción de ligación. Se realizan múltiples ciclos de ligación, detección y escisión, y la cantidad de ciclos determina la longitud de lectura final. Después de una serie de ciclos de ligación, se elimina el producto de extensión y la plantilla se restablece con un cebador complementario a la posición n-1 para una segunda ronda de ciclos de ligación.
Se completan cinco rondas de reinicio de cebadores para cada etiqueta de secuencia. A través del proceso de reinicio de cebadores, cada base se analiza en dos reacciones de ligadura independientes mediante dos cebadores diferentes. Por ejemplo, la base en la posición de lectura 5 se analiza mediante el cebador número 2 en el ciclo de ligadura 2 y mediante el cebador número 3 en el ciclo de ligadura 1.
Según ABI, la plataforma SOLiD 3plus produce 60 gigabases de datos de ADN utilizables por ejecución. Debido al sistema de codificación de dos bases, la tecnología incorpora una comprobación de precisión inherente y ofrece una precisión del 99,94 %. La química de los sistemas también significa que no se ve obstaculizada por homopolímeros a diferencia del sistema Roche 454 FLX, por lo que las regiones repetidas de homopolímeros grandes y difíciles ya no son un problema para la secuenciación.
Naturalmente, la tecnología se utilizará para secuenciar ADN, pero debido a la alta naturaleza paralela de todas las tecnologías de próxima generación, también tienen aplicaciones en transcriptómica y epigenómica .
Los microarrays fueron el pilar de la transcriptómica en los últimos diez años y la tecnología basada en arrays se ha expandido posteriormente a otras áreas. Sin embargo, tienen la limitación de que solo se puede obtener información de las sondas que están en el chip. Solo se puede obtener información de los organismos para los que hay chips disponibles, y conllevan todos los problemas de hibridar grandes cantidades de moléculas (diferentes temperaturas de hibridación). La transcriptómica de ARN-Seq mediante la secuenciación de última generación hará que estas barreras ya no sean válidas. El transcriptoma completo de cualquier organismo podría secuenciarse potencialmente en una sola ejecución (para genomas bacterianos muy pequeños) y no solo estaría disponible la identificación de cada transcripción, sino que también es posible realizar perfiles de expresión, ya que se pueden lograr lecturas cuantitativas.
La inmunoprecipitación de cromatina (ChIP) es un método para determinar los sitios de unión de los factores de transcripción y las interacciones entre el ADN y las proteínas. En el pasado, se ha combinado con la tecnología de matrices (ChIP-chip) con cierto éxito. La secuenciación de última generación también se puede aplicar en esta área. La inmunoprecipitación de metilación (MeDIP) también se puede realizar en matrices.
La capacidad de aprender más sobre la metilación y los sitios de unión de TF a escala del genoma es un recurso valioso y podría enseñarnos mucho sobre las enfermedades y la biología molecular en general.