stringtranslate.com

Secuenciación sólida ABI

Preparación de la biblioteca para la plataforma SOLiD
Esquema de codificación de dos bases. En la codificación de dos bases, a cada par único de bases en el extremo 3' de la sonda se le asigna uno de los cuatro colores posibles. Por ejemplo, "AA" se asigna al azul, "AC" se asigna al verde, y así sucesivamente para los 16 pares únicos. Durante la secuenciación, cada base de la plantilla se secuencia dos veces y los datos resultantes se decodifican de acuerdo con este esquema.

SOLiD (secuenciación por ligación y detección de oligonucleótidos) es una tecnología de secuenciación de ADN de última generación desarrollada por Life Technologies y que está disponible comercialmente desde 2006. Esta tecnología de última generación genera entre 108 y 109 lecturas de secuencias pequeñas a la vez. Utiliza una codificación de 2 bases para decodificar los datos sin procesar generados por la plataforma de secuenciación y convertirlos en datos de secuencia.

Este método no debe confundirse con la "secuenciación por síntesis", un principio utilizado por la pirosecuenciación Roche-454 (introducida en 2005, generando millones de lecturas de 200-400 pb en 2009), y el sistema Solexa (ahora propiedad de Illumina) (introducido en 2006, generando cientos de millones de lecturas de 50-100 pb en 2009).

Estos métodos han reducido el costo de $0.01/base en 2004 a casi $0.0001/base en 2006 y han aumentado la capacidad de secuenciación de 1,000,000 bases/máquina/día en 2004 a más de 5,000,000,000 bases/máquina/día en 2009. Existen más de 30 publicaciones que describen su uso primero para posicionamiento de nucleosomas de Valouev et al., [1] perfil transcripcional o RNA-Seq sensible a la cadena con Cloonan et al., [2] perfil transcripcional de células individuales con Tang et al. [3] y finalmente resecuenciación humana con McKernan et al. [4]

Se ha informado que el método utilizado por esta máquina (secuenciación por ligadura) tiene algunos problemas al secuenciar secuencias palindrómicas. [5]

Química

Se prepara una biblioteca de fragmentos de ADN a partir de la muestra que se va a secuenciar y se utiliza para preparar poblaciones de perlas clonales. Es decir, solo habrá una especie de fragmento presente en la superficie de cada perla magnética. Los fragmentos unidos a las perlas magnéticas tendrán una secuencia adaptadora P1 universal unida, de modo que la secuencia de inicio de cada fragmento sea conocida e idéntica. La PCR en emulsión se lleva a cabo en microrreactores que contienen todos los reactivos necesarios para la PCR. Las perlas con los productos de PCR resultantes se depositan en un portaobjetos de vidrio.

Los cebadores se hibridan con la secuencia adaptadora P1 dentro de la plantilla de la biblioteca. Un conjunto de cuatro sondas de dibase marcadas con fluorescencia compiten por la ligación con el cebador de secuenciación. La especificidad de la sonda de dibase se logra interrogando cada primera y segunda base en cada reacción de ligación. Se realizan múltiples ciclos de ligación, detección y escisión, y la cantidad de ciclos determina la longitud de lectura final. Después de una serie de ciclos de ligación, se elimina el producto de extensión y la plantilla se restablece con un cebador complementario a la posición n-1 para una segunda ronda de ciclos de ligación.

Se completan cinco rondas de reinicio de cebadores para cada etiqueta de secuencia. A través del proceso de reinicio de cebadores, cada base se analiza en dos reacciones de ligadura independientes mediante dos cebadores diferentes. Por ejemplo, la base en la posición de lectura 5 se analiza mediante el cebador número 2 en el ciclo de ligadura 2 y mediante el cebador número 3 en el ciclo de ligadura 1.

Rendimiento y precisión

Según ABI, la plataforma SOLiD 3plus produce 60 gigabases de datos de ADN utilizables por ejecución. Debido al sistema de codificación de dos bases, la tecnología incorpora una comprobación de precisión inherente y ofrece una precisión del 99,94 %. La química de los sistemas también significa que no se ve obstaculizada por homopolímeros a diferencia del sistema Roche 454 FLX, por lo que las regiones repetidas de homopolímeros grandes y difíciles ya no son un problema para la secuenciación.

Aplicaciones

Naturalmente, la tecnología se utilizará para secuenciar ADN, pero debido a la alta naturaleza paralela de todas las tecnologías de próxima generación, también tienen aplicaciones en transcriptómica y epigenómica .

Los microarrays fueron el pilar de la transcriptómica en los últimos diez años y la tecnología basada en arrays se ha expandido posteriormente a otras áreas. Sin embargo, tienen la limitación de que solo se puede obtener información de las sondas que están en el chip. Solo se puede obtener información de los organismos para los que hay chips disponibles, y conllevan todos los problemas de hibridar grandes cantidades de moléculas (diferentes temperaturas de hibridación). La transcriptómica de ARN-Seq mediante la secuenciación de última generación hará que estas barreras ya no sean válidas. El transcriptoma completo de cualquier organismo podría secuenciarse potencialmente en una sola ejecución (para genomas bacterianos muy pequeños) y no solo estaría disponible la identificación de cada transcripción, sino que también es posible realizar perfiles de expresión, ya que se pueden lograr lecturas cuantitativas.

La inmunoprecipitación de cromatina (ChIP) es un método para determinar los sitios de unión de los factores de transcripción y las interacciones entre el ADN y las proteínas. En el pasado, se ha combinado con la tecnología de matrices (ChIP-chip) con cierto éxito. La secuenciación de última generación también se puede aplicar en esta área. La inmunoprecipitación de metilación (MeDIP) también se puede realizar en matrices.

La capacidad de aprender más sobre la metilación y los sitios de unión de TF a escala del genoma es un recurso valioso y podría enseñarnos mucho sobre las enfermedades y la biología molecular en general.

Véase también

Referencias

  1. ^ Valouev A, Ichikawa J, Tonthat T, et al. (julio de 2008). "Un mapa de posición de nucleosomas de alta resolución de C. elegans revela la falta de un posicionamiento universal dictado por la secuencia". Genome Research . 18 (7): 1051–63. doi :10.1101/gr.076463.108. PMC  2493394 . PMID  18477713.
  2. ^ Cloonan N, Forrest AR, Kolle G, et al. (julio de 2008). "Perfil del transcriptoma de células madre mediante secuenciación de ARNm a gran escala". Nature Methods . 5 (7): 613–9. doi :10.1038/nmeth.1223. PMID  18516046. S2CID  19790151.
  3. ^ Tang F, Barbacioru C, Wang Y, et al. (mayo de 2009). "Análisis del transcriptoma completo de una sola célula mediante secuenciación de ARNm". Nature Methods . 6 (5): 377–82. doi :10.1038/nmeth.1315. PMID  19349980. S2CID  16570747.
  4. ^ McKernan KJ, Peckham HE, Costa GL, et al. (septiembre de 2009). "Variación estructural y de secuencia en un genoma humano descubierta mediante secuenciación de ligación masivamente paralela de lectura corta utilizando codificación de dos bases". Genome Research . 19 (9): 1527–41. doi :10.1101/gr.091868.109. PMC 2752135 . PMID  19546169. 
  5. ^ Yu-Feng Huang; Sheng-Chung Chen; Yih-Shien Chiang y Tzu-Han Chen (2012). "La secuencia palindrómica impide el mecanismo de secuenciación por ligación". BMC Systems Biology . 6 (Supl 2): ​​S10. doi : 10.1186/1752-0509-6-S2-S10 . PMC 3521181 . PMID  23281822. 

Lectura adicional