Secuenciación paralela masiva

La secuenciación masiva paralela o secuenciación masivamente paralela es cualquiera de los diversos enfoques de alto rendimiento para la secuenciación de ADN que utilizan el concepto de procesamiento masivo paralelo; también se denomina secuenciación de próxima generación ( NGS ) o secuenciación de segunda generación . Algunas de estas tecnologías surgieron entre 1993 y 1998 ^[1]^[2]^[3]^[4]^[5] y han estado disponibles comercialmente desde 2005. Estas tecnologías utilizan plataformas miniaturizadas y paralelizadas para la secuenciación de 1 millón a 43 mil millones de lecturas cortas (50 a 400 bases cada una) por ejecución del instrumento.

Muchas plataformas de NGS difieren en configuraciones de ingeniería y química de secuenciación. Comparten el paradigma técnico de secuenciación masiva paralela a través de plantillas de ADN amplificadas clonalmente y separadas espacialmente o moléculas de ADN individuales en una celda de flujo . Este diseño es muy diferente del de la secuenciación de Sanger , también conocida como secuenciación capilar o secuenciación de primera generación, que se basa en la separación electroforética de los productos de terminación de cadena producidos en reacciones de secuenciación individuales. ^[6] Esta metodología permite completar la secuenciación a mayor escala. ^[7]

Plataformas NGS

La secuenciación de ADN con plataformas NGS disponibles comercialmente se lleva a cabo generalmente con los siguientes pasos. Primero, las bibliotecas de secuenciación de ADN se generan mediante amplificación clonal por PCR in vitro . Segundo, el ADN se secuencia por síntesis , de modo que la secuencia de ADN se determina mediante la adición de nucleótidos a la cadena complementaria en lugar de a través de la química de terminación de la cadena. Tercero, las plantillas de ADN amplificadas y segregadas espacialmente se secuencian simultáneamente de manera masivamente paralela sin el requisito de un paso de separación física. Estos pasos se siguen en la mayoría de las plataformas NGS, pero cada una utiliza una estrategia diferente. ^[8]

La paralelización de las reacciones de secuenciación mediante NGS genera cientos de megabases a gigabases de lecturas de secuencias de nucleótidos en una sola ejecución del instrumento. Esto ha permitido un aumento drástico de los datos de secuencias disponibles y ha cambiado fundamentalmente los enfoques de secuenciación del genoma en las ciencias biomédicas. ^[9] Las tecnologías e instrumentos de NGS de reciente aparición han contribuido además a una reducción significativa del coste de la secuenciación, que se acerca a los 1000 dólares por secuenciación del genoma . ^[10]^[11]

A partir de 2014, las plataformas de secuenciación masiva paralela están disponibles comercialmente y sus características se resumen en la tabla. Como el ritmo de las tecnologías de secuenciación de nueva generación avanza rápidamente, las especificaciones técnicas y los precios están en constante cambio.

Se indican los tiempos de ejecución y la salida en gigabases (Gb) por ejecución para la secuenciación de extremo único. Los tiempos de ejecución y las salidas se duplican aproximadamente cuando se realiza la secuenciación de extremos emparejados. ‡Longitudes de lectura promedio para las plataformas Roche 454 y Helicos Biosciences. ^[23]

Métodos de preparación de plantillas para NGS

Se utilizan dos métodos para preparar plantillas para reacciones de NGS: plantillas amplificadas que se originan a partir de moléculas de ADN individuales y plantillas de moléculas de ADN individuales. Para los sistemas de imágenes que no pueden detectar eventos de fluorescencia individuales, se requiere la amplificación de plantillas de ADN. Los tres métodos de amplificación más comunes son la PCR en emulsión (emPCR), el círculo rodante y la amplificación en fase sólida. La distribución final de las plantillas puede ser aleatoria espacialmente o en una cuadrícula.

PCR en emulsión

En los métodos de PCR en emulsión , primero se genera una biblioteca de ADN mediante la fragmentación aleatoria del ADN genómico. Los fragmentos de ADN monocatenario (plantillas) se adhieren a la superficie de las perlas con adaptadores o conectores, y una perla se adhiere a un único fragmento de ADN de la biblioteca de ADN. La superficie de las perlas contiene sondas de oligonucleótidos con secuencias que son complementarias a los adaptadores que unen los fragmentos de ADN. A continuación, las perlas se compartimentan en gotitas de emulsión de agua y aceite. En la emulsión acuosa de agua y aceite, cada una de las gotitas que captura una perla es un microrreactor de PCR que produce copias amplificadas de la única plantilla de ADN. ^[24]^[25]^[26]

Nanobolas circulares rodantes en forma de rejilla

La amplificación de una población de moléculas de ADN individuales mediante amplificación por círculo rodante en solución es seguida por la captura en una cuadrícula de puntos de tamaño más pequeño que los ADN que se van a inmovilizar. ^[27]^[28]^[29]^[30]

Generación de colonias de ADN (amplificación de puente)

Los cebadores directos e inversos se unen covalentemente a alta densidad al portaobjetos en una celda de flujo. La relación de los cebadores con la plantilla en el soporte define la densidad de superficie de los grupos amplificados. La celda de flujo se expone a reactivos para la extensión basada en polimerasa , y el cebado se produce cuando el extremo libre/distal de un fragmento ligado "se une" a un oligo complementario en la superficie. La desnaturalización y extensión repetidas dan como resultado la amplificación localizada de fragmentos de ADN en millones de ubicaciones separadas a lo largo de la superficie de la celda de flujo. La amplificación en fase sólida produce entre 100 y 200 millones de grupos de plantillas separados espacialmente, lo que proporciona extremos libres a los que luego se hibrida un cebador de secuenciación universal para iniciar la reacción de secuenciación. ^[24]^[25] Esta tecnología fue presentada como patente en 1997 en el Instituto de Investigación Biomédica de Ginebra (GBRI) de Glaxo-Welcome, por Pascal Mayer , Eric Kawashima y Laurent Farinelli, ^[4]^[5] y fue presentada públicamente por primera vez en 1998. ^[31] En 1994 Chris Adams y Steve Kron presentaron una patente sobre un método de amplificación de superficie similar, pero no clonal, llamado “amplificación de puente” ^[3] adaptado para la amplificación clonal en 1997 por Church y Mitra. ^[27]^[28]

Plantillas de una sola molécula

Los protocolos que requieren amplificación de ADN suelen ser complicados de implementar y pueden introducir errores de secuenciación. La preparación de plantillas de una sola molécula es más sencilla y no requiere PCR, que puede introducir errores en las plantillas amplificadas. Las secuencias diana ricas en AT y GC suelen mostrar sesgo de amplificación, lo que da como resultado su subrepresentación en las alineaciones y ensamblajes del genoma. Las plantillas de una sola molécula suelen inmovilizarse en soportes sólidos utilizando uno de al menos tres enfoques diferentes. En el primer enfoque, las moléculas de cebador individuales distribuidas espacialmente se unen covalentemente al soporte sólido. La plantilla, que se prepara fragmentando aleatoriamente el material de partida en tamaños pequeños (por ejemplo, ~200–250 pb) y añadiendo adaptadores comunes a los extremos del fragmento, se hibrida luego con el cebador inmovilizado. En el segundo enfoque, las plantillas de una sola molécula distribuidas espacialmente se unen covalentemente al soporte sólido mediante el cebado y la extensión de plantillas de una sola molécula de cadena sencilla a partir de cebadores inmovilizados. Luego, se hibrida un cebador común con la plantilla. En cualquiera de los dos enfoques, la ADN polimerasa puede unirse a la configuración de plantilla preparada inmovilizada para iniciar la reacción de NGS. Ambos enfoques son utilizados por Helicos BioSciences. En un tercer enfoque, moléculas de polimerasa individuales distribuidas espacialmente se unen al soporte sólido, al que se une una molécula de plantilla preparada. Este enfoque es utilizado por Pacific Biosciences. Con esta técnica se pueden utilizar moléculas de ADN más grandes (hasta decenas de miles de pares de bases) y, a diferencia de los dos primeros enfoques, el tercer enfoque se puede utilizar con métodos en tiempo real, lo que da como resultado longitudes de lectura potencialmente más largas.

Enfoques de secuenciación

Secuenciación por síntesis

El objetivo de la secuenciación secuencial por síntesis (SBS) es determinar la secuenciación de una muestra de ADN detectando la incorporación de un nucleótido por una ADN polimerasa . Se utiliza una polimerasa diseñada para sintetizar una copia de una sola cadena de ADN y se monitorea la incorporación de cada nucleótido. El principio de secuenciación por síntesis se describió por primera vez en 1993 ^{^[1]} con mejoras publicadas algunos años después. ^[32] Las partes clave son muy similares para todas las realizaciones de SBS e incluyen (1) amplificación de ADN para mejorar la señal posterior y unir el ADN que se va a secuenciar a un soporte sólido, (2) generación de ADN monocatenario en el soporte sólido, (3) incorporación de nucleótidos utilizando una polimerasa diseñada y (4) detección de la incorporación de nucleótido. Luego se repiten los pasos 3 y 4 y se ensambla la secuencia a partir de las señales obtenidas en el paso 4. Este principio de secuenciación por síntesis se ha utilizado para casi todos los instrumentos de secuenciación paralela masiva, incluidos 454 , PacBio , IonTorrent , Illumina y MGI .

Pirosecuenciación

El principio de la pirosecuenciación se describió por primera vez en 1993 ^{^[1]} mediante la combinación de un soporte sólido con una ADN polimerasa diseñada que carecía de actividad exonucleasa 3' a 5' (corrección de pruebas) y detección de luminiscencia en tiempo real utilizando la luciferasa de luciérnaga . Se introdujeron todos los conceptos clave de la secuenciación por síntesis, incluidos (1) la amplificación del ADN para mejorar la señal posterior y unir el ADN que se va a secuenciar (plantilla) a un soporte sólido, (2) la generación de ADN monocatenario en el soporte sólido (3) la incorporación de nucleótidos utilizando una polimerasa diseñada y (4) la detección del nucleótido incorporado mediante detección de luz en tiempo real. En un artículo posterior, ^[2] se desarrolló aún más el concepto y en 1998 se publicó un artículo ^{[32] en el que los autores demostraron que los nucleótidos no incorporados se podían eliminar con una cuarta enzima (}apirasa ), lo que permitía realizar la secuenciación por síntesis sin necesidad de lavar los nucleótidos no incorporados.

Secuenciación mediante química de terminación reversible

Este enfoque utiliza dNTP reversibles unidos a terminadores en un método cíclico que comprende la incorporación de nucleótidos, la obtención de imágenes de fluorescencia y la escisión. Se obtienen imágenes de un terminador marcado con fluorescencia a medida que se añade cada dNTP y luego se escinde para permitir la incorporación de la siguiente base. Estos nucleótidos se bloquean químicamente de modo que cada incorporación sea un evento único. Un paso de obtención de imágenes sigue a cada paso de incorporación de bases, luego el grupo bloqueado se elimina químicamente para preparar cada hebra para la siguiente incorporación por la ADN polimerasa. Esta serie de pasos continúa durante un número específico de ciclos, según lo determinado por los ajustes del instrumento definidos por el usuario. Los grupos de bloqueo 3' se concibieron originalmente como inversión enzimática ^[33] o química ^[14]^[15] El método químico ha sido la base de las máquinas Solexa e Illumina. La secuenciación mediante química de terminadores reversibles puede ser un ciclo de cuatro colores como el utilizado por Illumina/Solexa, o un ciclo de un color como el utilizado por Helicos BioSciences. Helicos BioSciences utilizó “terminadores virtuales”, que son terminadores desbloqueados con un segundo análogo de nucleósido que actúa como inhibidor. Estos terminadores tienen las modificaciones adecuadas para terminar o inhibir grupos de manera que la síntesis de ADN se termina después de la adición de una sola base. ^[25]^[34]^[35]

Secuenciación por ligación mediada por enzimas ligasas

En este enfoque, la reacción de extensión de secuencia no la llevan a cabo las polimerasas, sino la ADN ligasa y sondas codificadas por una base o por dos bases. En su forma más simple, una sonda marcada con fluorescencia se hibrida con su secuencia complementaria adyacente a la plantilla cebada. Luego se agrega la ADN ligasa para unir la sonda marcada con colorante al cebador. Las sondas no ligadas se eliminan por lavado, seguido de una imagen de fluorescencia para determinar la identidad de la sonda ligada. El ciclo se puede repetir ya sea utilizando sondas escindibles para eliminar el colorante fluorescente y regenerar un grupo 5'-PO4 para ciclos de ligadura posteriores (ligadura encadenada ^[16]^[36] ) o eliminando e hibridando un nuevo cebador con la plantilla (ligadura no encadenada ^[18]^[19] ).

Nucleótidos fluorescentes fosfoligados o secuenciación en tiempo real

Pacific Biosciences es actualmente líder en este método. El método de secuenciación en tiempo real implica la obtención de imágenes de la incorporación continua de nucleótidos marcados con colorante durante la síntesis de ADN: las moléculas individuales de ADN polimerasa se adhieren a la superficie inferior de detectores de guía de onda de modo cero individuales (detectores Zmw) que pueden obtener información de la secuencia mientras los nucleótidos fosfoenlazados se incorporan a la cadena de cebadores en crecimiento. Pacific Biosciences utiliza una ADN polimerasa única que incorpora mejor los nucleótidos fosfoenlazados y permite la resecuenciación de plantillas circulares cerradas. Si bien la precisión de lectura única es del 87 %, se ha demostrado una precisión de consenso del 99,999 % con longitudes de lectura de múltiples kilobases. ^[37]^[38] En 2015, Pacific Biosciences lanzó un nuevo instrumento de secuenciación llamado Sequel System, que aumenta la capacidad aproximadamente 6,5 veces. ^[39]^[40]

Véase también

Referencias

^ abc Nyren, P.; Pettersson, B.; Uhlen, M. (enero de 1993). "Minisecuenciación de ADN en fase sólida mediante un ensayo enzimático luminométrico de detección de pirofosfato inorgánico". Analytical Biochemistry . 208 (1): 171–175. doi :10.1006/abio.1993.1024.
^ ab Ronaghi M, Karamohamed S, Pettersson B, Uhlén M, Nyrén P (noviembre de 1996). "Secuenciación de ADN en tiempo real mediante la detección de la liberación de pirofosfato". Analytical Biochemistry . 242 (1): 84–89. doi :10.1006/abio.1996.0432. PMID 8923969.
^ ab US 5641658, Adams CP, Kron SJ, "Método para realizar la amplificación de ácido nucleico con dos cebadores unidos a un único soporte sólido", publicado el 24 de junio de 1997, asignado a Mosaic Technologies Inc. y Whitehead Institute for Biomedical Research
^ ab EP 0972081, Farinelli L, Kawashima E, Mayer P ), "Método de amplificación de ácidos nucleicos", publicado el 13 de junio de 2007, asignado a Solexa Ltd.
^ ab EP 0975802, Kawashima E, Farinellit L, Mayer P, "Método de secuenciación de ácidos nucleicos", publicado el 23 de junio de 2004
^ Voelkerding KV, Dames SA, Durtschi JD (abril de 2009). "Secuenciación de próxima generación: de la investigación básica al diagnóstico". Química clínica . 55 (4): 641–658. doi : 10.1373/clinchem.2008.112789 . PMID 19246620.
^ Ballard D, Winkler-Galicki J, Wesoły J (julio de 2020). "Secuenciación paralela masiva en la ciencia forense: ventajas, problemas, tecnicismos y perspectivas". Revista Internacional de Medicina Legal . 134 (4): 1291–1303. doi :10.1007/s00414-020-02294-0. PMC 7295846 . PMID 32451905.
^ Anderson MW, Schrijver I (mayo de 2010). "Secuenciación de ADN de próxima generación y el futuro de la medicina genómica". Genes . 1 (1): 38–69. doi : 10.3390/genes1010038 . PMC 3960862 . PMID 24710010.
^ Tucker T, Marra M, Friedman JM (agosto de 2009). "Secuenciación masivamente paralela: el próximo gran avance en la medicina genética". American Journal of Human Genetics . 85 (2): 142–154. doi :10.1016/j.ajhg.2009.06.022. PMC 2725244 . PMID 19679224.
^ von Bubnoff A (marzo de 2008). "Secuenciación de próxima generación: la carrera ha comenzado". Cell . 132 (5): 721–723. doi : 10.1016/j.cell.2008.02.028 . PMID 18329356. S2CID 8413828.
^ "Comunicado de 2008: NHGRI busca tecnologías de secuenciación de ADN aptas para uso médico y de laboratorio de rutina". Genome.gov . Consultado el 5 de agosto de 2012 .
^ "Especificaciones para HiSeq 2500". Archivado desde el original el 6 de diciembre de 2014. Consultado el 6 de noviembre de 2014 .
^ "HiSeq v4 ya está aquí... y cumple su cometido | Edinburgh Genomics". Archivado desde el original el 2014-11-06 . Consultado el 2014-11-06 .
^ ab Patente estadounidense 7790869, Ju J, Li Z, Edwards JR, Itagaki Y, "Método paralelo masivo para decodificar ADN y ARN", publicada el 7 de septiembre de 2010, asignada a The Trustees of Columbia University en la ciudad de Nueva York
^ ab Bentley DR, Balasubramanian S, Swerdlow HP, Smith GP, Milton J, Brown CG, et al. (noviembre de 2008). "Secuenciación precisa del genoma humano completo mediante química de terminación reversible". Nature . 456 (7218): 53–59. Bibcode :2008Natur.456...53B. doi :10.1038/nature07517. PMC 2581791 . PMID 18987734.
^ ab McKernan KJ, Peckham HE, Costa GL, McLaughlin SF, Fu Y, Tsung EF, et al. (septiembre de 2009). "Variación estructural y de secuencia en un genoma humano descubierta mediante secuenciación de ligación masivamente paralela de lectura corta utilizando codificación de dos bases". Genome Research . 19 (9): 1527–1541. doi :10.1101/gr.091868.109. PMC 2752135 . PMID 19546169.
^ "Ion Torrent". Archivado desde el original el 30 de diciembre de 2013. Consultado el 1 de enero de 2014 .
^ ab Drmanac R, Sparks AB, Callow MJ, Halpern AL, Burns NL, Kermani BG, et al. (enero de 2010). "Secuenciación del genoma humano utilizando lecturas de bases no encadenadas en nanoarreglos de ADN autoensamblables". Science . 327 (5961): 78–81. Bibcode :2010Sci...327...78D. doi : 10.1126/science.1181498 . PMID 19892942. S2CID 17309571.
^ ab Shendure J, Porreca GJ, Reppas NB, Lin X, McCutcheon JP, Rosenbaum AM, et al. (septiembre de 2005). "Secuenciación de polonía multiplex precisa de un genoma bacteriano evolucionado". Science . 309 (5741): 1728–1732. Bibcode :2005Sci...309.1728S. doi : 10.1126/science.1117389 . PMID 16081699. S2CID 11405973.
^ Peters BA, Kermani BG, Sparks AB, Alferov O, Hong P, Alexeev A, et al. (julio de 2012). "Secuenciación precisa del genoma completo y haplotipificación de 10 a 20 células humanas". Nature . 487 (7406): 190–195. Bibcode :2012Natur.487..190P. doi :10.1038/nature11236. PMC 3397394 . PMID 22785314.
^ Inc, Pacific Biosciences of California (3 de octubre de 2013). "Pacific Biosciences presenta una nueva química con longitudes de lectura más largas para detectar nuevas características en la secuencia de ADN y avanzar en los estudios genómicos de organismos grandes". Sala de prensa de GlobeNewswire . {{cite web}}: |last=tiene nombre genérico ( ayuda )
^ Nederbragt L (5 de julio de 2013). "Ensamblaje de genomas bacterianos de novo: ¿un problema resuelto?".
^ Voelkerding KV, Dames S, Durtschi JD (septiembre de 2010). "Secuenciación de próxima generación para diagnósticos clínicos: principios y aplicación a la resecuenciación dirigida para la miocardiopatía hipertrófica: un artículo del Simposio sobre patología molecular del Hospital William Beaumont de 2009". The Journal of Molecular Diagnostics . 12 (5): 539–551. doi :10.2353/jmoldx.2010.100043. PMC 2928417 . PMID 20805560.
^ ab Chee-Seng K, Yun LE, Yudi P, Kee-Seng C (abril de 2010). "Tecnologías de secuenciación de próxima generación y sus aplicaciones". Enciclopedia de ciencias de la vida (ELS) . Chichester: John Wiley & Sons, Ltd.
^ abc Metzker ML (enero de 2010). "Tecnologías de secuenciación: la próxima generación". Nature Reviews. Genética . 11 (1): 31–46. doi :10.1038/nrg2626. PMID 19997069. S2CID 205484500.
^ Dressman D, Yan H, Traverso G, Kinzler KW, Vogelstein B (julio de 2003). "Transformación de moléculas de ADN individuales en partículas magnéticas fluorescentes para la detección y enumeración de variaciones genéticas". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (15): 8817–8822. Bibcode :2003PNAS..100.8817D. doi : 10.1073/pnas.1133470100 . PMC 166396 . PMID 12857956.
^ ab Patente estadounidense 6485944, Church GM, Mitra R, "Amplificación de réplicas de matrices de ácidos nucleicos", publicada el 26 de noviembre de 2002, asignada al presidente y miembros del Harvard College
^ ab Mitra RD, Church GM (diciembre de 1999). "Amplificación localizada in situ y replicación por contacto de muchas moléculas de ADN individuales". Nucleic Acids Research . 27 (24): 34e–34. doi :10.1093/nar/27.24.e34. PMC 148757 . PMID 10572186.
^ US 9624538, Church GM, Porreca GJ, Shendure J, Rosenbaum AM, "Secuenciación de ADN en círculo rodante de nanogrid", publicado el 18 de abril de 2017, asignado al presidente y miembros del Harvard College
^ Patente estadounidense 8445194, Drmanac R, Callow MJ, Drmanac S, Hauser BK, Yeung G, "Matrices de moléculas individuales para análisis genético y químico", publicada el 21 de mayo de 2013, asignada a Callida Genomics Inc.
^ Mayer P, Matton G, Adessi C, Turcatti G, Mermod JJ, Kawashima E (7-10 de octubre de 1998). Un método de secuenciación de ADN a gran escala, de alto rendimiento y bajo coste basado en un nuevo proceso de automodelado de ADN bidimensional. Quinta Conferencia Internacional sobre Automatización en Mapeo y Secuenciación de ADN. St. Louis, MO, EE. UU. Presentación ams98 sobre secuenciación masiva en paralelo de colonias de ADN
^ ab Ronaghi, Mostafa; Uhlén, Mathías; Nyrén, Pål (17 de julio de 1998). "Un método de secuenciación basado en pirofosfato en tiempo real". Ciencia . 281 (5375): 363–365. doi : 10.1126/ciencia.281.5375.363. ISSN 0036-8075. PMID 9705713. S2CID 26331871.
^ US 6833246, Balasubramanian S, "Secuenciación de polinucleótidos", publicada el 21 de diciembre de 2004, asignada a Solexa Ltd.
^ "Tecnología de ensayos". Illumina. Archivado desde el original el 26 de agosto de 2012. Consultado el 5 de agosto de 2012 .
^ "Secuenciación de moléculas individuales verdaderas (tSMS™): Helicos BioSciences". Helicosbio.com. Archivado desde el original el 2012-03-11 . Consultado el 2012-08-05 .
^ "Fundamentos de la codificación de 2 bases y el espacio de color". Appliedbiosystems.cnpg.com . Consultado el 5 de agosto de 2012 .
^ Chin CS, Alexander DH, Marks P, Klammer AA, Drake J, Heiner C, et al. (junio de 2013). "Ensamblajes de genomas microbianos terminados y no híbridos a partir de datos de secuenciación SMRT de lectura larga". Nature Methods . 10 (6): 563–569. doi :10.1038/nmeth.2474. PMID 23644548. S2CID 205421576.
^ Monica Heger (5 de marzo de 2013). "Los usuarios de PacBio informan de avances en lecturas largas para el ensamblaje del genoma de plantas y regiones complicadas del genoma humano".
^ "PacBio lanza un sistema de secuenciación de moléculas individuales de mayor rendimiento y menor costo". Octubre de 2015.
^ "PacBio anuncia un sistema de secuenciación Sequel - Bio-IT World" www.bio-itworld.com . Archivado desde el original el 2 de octubre de 2015.