La secuenciación masiva paralela o secuenciación masivamente paralela es cualquiera de los diversos enfoques de alto rendimiento para la secuenciación de ADN que utilizan el concepto de procesamiento masivo paralelo; también se denomina secuenciación de próxima generación ( NGS ) o secuenciación de segunda generación . Algunas de estas tecnologías surgieron entre 1993 y 1998 [1] [2] [3] [4] [5] y han estado disponibles comercialmente desde 2005. Estas tecnologías utilizan plataformas miniaturizadas y paralelizadas para la secuenciación de 1 millón a 43 mil millones de lecturas cortas (50 a 400 bases cada una) por ejecución del instrumento.
Muchas plataformas de NGS difieren en configuraciones de ingeniería y química de secuenciación. Comparten el paradigma técnico de secuenciación masiva paralela a través de plantillas de ADN amplificadas clonalmente y separadas espacialmente o moléculas de ADN individuales en una celda de flujo . Este diseño es muy diferente del de la secuenciación de Sanger , también conocida como secuenciación capilar o secuenciación de primera generación, que se basa en la separación electroforética de los productos de terminación de cadena producidos en reacciones de secuenciación individuales. [6] Esta metodología permite completar la secuenciación a mayor escala. [7]
La secuenciación de ADN con plataformas NGS disponibles comercialmente se lleva a cabo generalmente con los siguientes pasos. Primero, las bibliotecas de secuenciación de ADN se generan mediante amplificación clonal por PCR in vitro . Segundo, el ADN se secuencia por síntesis , de modo que la secuencia de ADN se determina mediante la adición de nucleótidos a la cadena complementaria en lugar de a través de la química de terminación de la cadena. Tercero, las plantillas de ADN amplificadas y segregadas espacialmente se secuencian simultáneamente de manera masivamente paralela sin el requisito de un paso de separación física. Estos pasos se siguen en la mayoría de las plataformas NGS, pero cada una utiliza una estrategia diferente. [8]
La paralelización de las reacciones de secuenciación mediante NGS genera cientos de megabases a gigabases de lecturas de secuencias de nucleótidos en una sola ejecución del instrumento. Esto ha permitido un aumento drástico de los datos de secuencias disponibles y ha cambiado fundamentalmente los enfoques de secuenciación del genoma en las ciencias biomédicas. [9] Las tecnologías e instrumentos de NGS de reciente aparición han contribuido además a una reducción significativa del coste de la secuenciación, que se acerca a los 1000 dólares por secuenciación del genoma . [10] [11]
A partir de 2014, las plataformas de secuenciación masiva paralela están disponibles comercialmente y sus características se resumen en la tabla. Como el ritmo de las tecnologías de secuenciación de nueva generación avanza rápidamente, las especificaciones técnicas y los precios están en constante cambio.
Se indican los tiempos de ejecución y la salida en gigabases (Gb) por ejecución para la secuenciación de extremo único. Los tiempos de ejecución y las salidas se duplican aproximadamente cuando se realiza la secuenciación de extremos emparejados. ‡Longitudes de lectura promedio para las plataformas Roche 454 y Helicos Biosciences. [23]
Se utilizan dos métodos para preparar plantillas para reacciones de NGS: plantillas amplificadas que se originan a partir de moléculas de ADN individuales y plantillas de moléculas de ADN individuales. Para los sistemas de imágenes que no pueden detectar eventos de fluorescencia individuales, se requiere la amplificación de plantillas de ADN. Los tres métodos de amplificación más comunes son la PCR en emulsión (emPCR), el círculo rodante y la amplificación en fase sólida. La distribución final de las plantillas puede ser aleatoria espacialmente o en una cuadrícula.
En los métodos de PCR en emulsión , primero se genera una biblioteca de ADN mediante la fragmentación aleatoria del ADN genómico. Los fragmentos de ADN monocatenario (plantillas) se adhieren a la superficie de las perlas con adaptadores o conectores, y una perla se adhiere a un único fragmento de ADN de la biblioteca de ADN. La superficie de las perlas contiene sondas de oligonucleótidos con secuencias que son complementarias a los adaptadores que unen los fragmentos de ADN. A continuación, las perlas se compartimentan en gotitas de emulsión de agua y aceite. En la emulsión acuosa de agua y aceite, cada una de las gotitas que captura una perla es un microrreactor de PCR que produce copias amplificadas de la única plantilla de ADN. [24] [25] [26]
La amplificación de una población de moléculas de ADN individuales mediante amplificación por círculo rodante en solución es seguida por la captura en una cuadrícula de puntos de tamaño más pequeño que los ADN que se van a inmovilizar. [27] [28] [29] [30] Las tecnologías de secuenciación de segunda generación como DNBSEQ de MGI Tech o AVITI de Element Biosciences utilizan este enfoque para la preparación de la muestra en la celda de flujo que luego se captura ciclo por ciclo.
Los cebadores directos e inversos se unen covalentemente a alta densidad al portaobjetos en una celda de flujo. La relación de los cebadores con la plantilla en el soporte define la densidad de superficie de los grupos amplificados. La celda de flujo se expone a reactivos para la extensión basada en polimerasa , y el cebado se produce cuando el extremo libre/distal de un fragmento ligado "se une" a un oligo complementario en la superficie. La desnaturalización y extensión repetidas dan como resultado la amplificación localizada de fragmentos de ADN en millones de ubicaciones separadas a lo largo de la superficie de la celda de flujo. La amplificación en fase sólida produce entre 100 y 200 millones de grupos de plantillas separados espacialmente, lo que proporciona extremos libres a los que luego se hibrida un cebador de secuenciación universal para iniciar la reacción de secuenciación. [24] [25] Esta tecnología fue presentada como patente en 1997 en el Instituto de Investigación Biomédica de Ginebra (GBRI) de Glaxo-Welcome, por Pascal Mayer , Eric Kawashima y Laurent Farinelli, [4] [5] y fue presentada públicamente por primera vez en 1998. [31] En 1994 Chris Adams y Steve Kron presentaron una patente sobre un método de amplificación de superficie similar, pero no clonal, llamado “amplificación de puente” [3] adaptado para la amplificación clonal en 1997 por Church y Mitra. [27] [28]
Los protocolos que requieren amplificación de ADN suelen ser complicados de implementar y pueden introducir errores de secuenciación. La preparación de plantillas de una sola molécula es más sencilla y no requiere PCR, que puede introducir errores en las plantillas amplificadas. Las secuencias diana ricas en AT y GC suelen mostrar sesgo de amplificación, lo que da como resultado su subrepresentación en las alineaciones y ensamblajes del genoma. Las plantillas de una sola molécula suelen inmovilizarse en soportes sólidos utilizando uno de al menos tres enfoques diferentes. En el primer enfoque, las moléculas de cebador individuales distribuidas espacialmente se unen covalentemente al soporte sólido. La plantilla, que se prepara fragmentando aleatoriamente el material de partida en tamaños pequeños (por ejemplo, ~200–250 pb) y añadiendo adaptadores comunes a los extremos del fragmento, se hibrida luego con el cebador inmovilizado. En el segundo enfoque, las plantillas de una sola molécula distribuidas espacialmente se unen covalentemente al soporte sólido mediante el cebado y la extensión de plantillas de una sola molécula de cadena sencilla a partir de cebadores inmovilizados. Luego, se hibrida un cebador común con la plantilla. En cualquiera de los dos enfoques, la ADN polimerasa puede unirse a la configuración de plantilla preparada inmovilizada para iniciar la reacción de NGS. Ambos enfoques son utilizados por Helicos BioSciences. En un tercer enfoque, moléculas de polimerasa individuales distribuidas espacialmente se unen al soporte sólido, al que se une una molécula de plantilla preparada. Este enfoque es utilizado por Pacific Biosciences. Con esta técnica se pueden utilizar moléculas de ADN más grandes (hasta decenas de miles de pares de bases) y, a diferencia de los dos primeros enfoques, el tercer enfoque se puede utilizar con métodos en tiempo real, lo que da como resultado longitudes de lectura potencialmente más largas.
El objetivo de la secuenciación secuencial por síntesis (SBS) es determinar la secuenciación de una muestra de ADN detectando la incorporación de un nucleótido por una ADN polimerasa . Se utiliza una polimerasa diseñada para sintetizar una copia de una sola cadena de ADN y se monitorea la incorporación de cada nucleótido. El principio de secuenciación por síntesis se describió por primera vez en 1993 [1] con mejoras publicadas algunos años después. [32] Las partes clave son muy similares para todas las realizaciones de SBS e incluyen (1) amplificación de ADN para mejorar la señal posterior y unir el ADN que se va a secuenciar a un soporte sólido, (2) generación de ADN monocatenario en el soporte sólido, (3) incorporación de nucleótidos utilizando una polimerasa diseñada y (4) detección de la incorporación de nucleótido. Luego se repiten los pasos 3 y 4 y se ensambla la secuencia a partir de las señales obtenidas en el paso 4. Este principio de secuenciación por síntesis se ha utilizado para casi todos los instrumentos de secuenciación paralela masiva, incluidos 454 , PacBio , IonTorrent , Illumina y MGI .
El principio de la pirosecuenciación se describió por primera vez en 1993 [1] mediante la combinación de un soporte sólido con una ADN polimerasa diseñada que carecía de actividad exonucleasa 3' a 5' (corrección de pruebas) y detección de luminiscencia en tiempo real utilizando la luciferasa de luciérnaga . Se introdujeron todos los conceptos clave de la secuenciación por síntesis, incluidos (1) la amplificación del ADN para mejorar la señal posterior y unir el ADN que se va a secuenciar (plantilla) a un soporte sólido, (2) la generación de ADN monocatenario en el soporte sólido (3) la incorporación de nucleótidos utilizando una polimerasa diseñada y (4) la detección del nucleótido incorporado mediante detección de luz en tiempo real. En un artículo posterior, [2] se desarrolló aún más el concepto y en 1998 se publicó un artículo [32] en el que los autores demostraron que los nucleótidos no incorporados se podían eliminar con una cuarta enzima ( apirasa ), lo que permitía realizar la secuenciación por síntesis sin necesidad de lavar los nucleótidos no incorporados.
Este enfoque utiliza dNTP reversibles unidos a terminadores en un método cíclico que comprende la incorporación de nucleótidos, la obtención de imágenes de fluorescencia y la escisión. Se obtienen imágenes de un terminador marcado con fluorescencia a medida que se añade cada dNTP y luego se escinde para permitir la incorporación de la siguiente base. Estos nucleótidos se bloquean químicamente de modo que cada incorporación sea un evento único. Un paso de obtención de imágenes sigue a cada paso de incorporación de bases, luego el grupo bloqueado se elimina químicamente para preparar cada hebra para la siguiente incorporación por la ADN polimerasa. Esta serie de pasos continúa durante un número específico de ciclos, según lo determinado por los ajustes del instrumento definidos por el usuario. Los grupos de bloqueo 3' se concibieron originalmente como inversión enzimática [33] o química [14] [15] El método químico ha sido la base de las máquinas Solexa e Illumina. La secuenciación mediante química de terminadores reversibles puede ser un ciclo de cuatro colores como el utilizado por Illumina/Solexa, o un ciclo de un color como el utilizado por Helicos BioSciences. Helicos BioSciences utilizó “terminadores virtuales”, que son terminadores desbloqueados con un segundo análogo de nucleósido que actúa como inhibidor. Estos terminadores tienen las modificaciones adecuadas para terminar o inhibir grupos de manera que la síntesis de ADN se termina después de la adición de una sola base. [25] [34] [35]
En este enfoque, la reacción de extensión de secuencia no la llevan a cabo las polimerasas, sino la ADN ligasa y sondas codificadas por una base o por dos bases. En su forma más simple, una sonda marcada con fluorescencia se hibrida con su secuencia complementaria adyacente a la plantilla cebada. Luego se agrega la ADN ligasa para unir la sonda marcada con colorante al cebador. Las sondas no ligadas se eliminan por lavado, seguido de una imagen de fluorescencia para determinar la identidad de la sonda ligada. El ciclo se puede repetir ya sea utilizando sondas escindibles para eliminar el colorante fluorescente y regenerar un grupo 5'-PO4 para ciclos de ligadura posteriores (ligadura encadenada [16] [36] ) o eliminando e hibridando un nuevo cebador con la plantilla (ligadura no encadenada [18] [19] ).
Pacific Biosciences es actualmente líder en este método. El método de secuenciación en tiempo real implica la obtención de imágenes de la incorporación continua de nucleótidos marcados con colorante durante la síntesis de ADN: las moléculas individuales de ADN polimerasa se adhieren a la superficie inferior de detectores de guía de onda de modo cero individuales (detectores Zmw) que pueden obtener información de la secuencia mientras se incorporan nucleótidos fosfoenlazados a la cadena de cebadores en crecimiento. Pacific Biosciences utiliza una ADN polimerasa única que incorpora mejor los nucleótidos fosfoenlazados y permite la resecuenciación de plantillas circulares cerradas. Si bien la precisión de lectura única es del 87 %, se ha demostrado una precisión de consenso del 99,999 % con longitudes de lectura de múltiples kilobases. [37] [38] En 2015, Pacific Biosciences lanzó un nuevo instrumento de secuenciación llamado Sequel System, que aumenta la capacidad aproximadamente 6,5 veces. [39] [40]
{{cite web}}
: |last=
tiene nombre genérico ( ayuda )Presentación ams98 sobre secuenciación masiva en paralelo de colonias de ADN