Un secuenciador de ADN es un instrumento científico que se utiliza para automatizar el proceso de secuenciación del ADN . Dada una muestra de ADN , se utiliza un secuenciador de ADN para determinar el orden de las cuatro bases: G ( guanina ), C ( citosina ), A ( adenina ) y T ( timina ). Esto luego se informa como una cadena de texto , llamada lectura. Algunos secuenciadores de ADN también pueden considerarse instrumentos ópticos , ya que analizan señales de luz que se originan a partir de fluorocromos unidos a nucleótidos .
El primer secuenciador de ADN automatizado, inventado por Lloyd M. Smith , fue presentado por Applied Biosystems en 1987. [1] Utilizaba el método de secuenciación de Sanger , una tecnología que formó la base de la "primera generación" de secuenciadores de ADN [2] [3] y permitió la finalización del proyecto del genoma humano en 2001. [4] Esta primera generación de secuenciadores de ADN son esencialmente sistemas de electroforesis automatizados que detectan la migración de fragmentos de ADN marcados. Por lo tanto, estos secuenciadores también se pueden utilizar en la genotipificación de marcadores genéticos donde solo se necesita determinar la longitud de un fragmento de ADN (por ejemplo, microsatélites , AFLP ).
El Proyecto Genoma Humano impulsó el desarrollo de plataformas más económicas, de alto rendimiento y más precisas, conocidas como secuenciadores de nueva generación (NGS, por sus siglas en inglés), para secuenciar el genoma humano . Entre ellas se encuentran las plataformas de secuenciación de ADN 454, SOLiD e Illumina . Las máquinas de secuenciación de nueva generación han aumentado sustancialmente la velocidad de secuenciación de ADN, en comparación con los métodos Sanger anteriores. Las muestras de ADN se pueden preparar automáticamente en tan solo 90 minutos [5] , mientras que un genoma humano se puede secuenciar con una cobertura 15 veces mayor en cuestión de días [6] .
Los secuenciadores de ADN de tercera generación más recientes, como PacBio SMRT y Oxford Nanopore, ofrecen la posibilidad de secuenciar moléculas largas, en comparación con tecnologías de lectura corta como Illumina SBS o DNBSEQ de MGI Tech.
Debido a las limitaciones de la tecnología de secuenciadores de ADN, las lecturas de muchas de estas tecnologías son cortas, en comparación con la longitud de un genoma , por lo tanto, las lecturas deben ensamblarse en contigs más largos . [7] Los datos también pueden contener errores, causados por limitaciones en la técnica de secuenciación de ADN o por errores durante la amplificación por PCR . Los fabricantes de secuenciadores de ADN utilizan varios métodos diferentes para detectar qué bases de ADN están presentes. Los protocolos específicos aplicados en diferentes plataformas de secuenciación tienen un impacto en los datos finales que se generan. Por lo tanto, comparar la calidad y el costo de los datos entre diferentes tecnologías puede ser una tarea abrumadora. Cada fabricante proporciona sus propias formas de informar los errores y las puntuaciones de secuenciación. Sin embargo, los errores y las puntuaciones entre diferentes plataformas no siempre se pueden comparar directamente. Dado que estos sistemas se basan en diferentes enfoques de secuenciación de ADN, la elección del mejor secuenciador de ADN y el mejor método dependerá normalmente de los objetivos del experimento y del presupuesto disponible. [2]
Los primeros métodos de secuenciación de ADN fueron desarrollados por Gilbert (1973) [8] y Sanger (1975). [9] Gilbert introdujo un método de secuenciación basado en la modificación química del ADN seguida de la escisión en bases específicas, mientras que la técnica de Sanger se basa en la terminación de la cadena de didesoxinucleótidos . El método de Sanger se hizo popular debido a su mayor eficiencia y baja radiactividad. El primer secuenciador de ADN automatizado fue el AB370A, introducido en 1986 por Applied Biosystems . El AB370A podía secuenciar 96 muestras simultáneamente, 500 kilobases por día y alcanzar longitudes de lectura de hasta 600 bases. Este fue el comienzo de la "primera generación" de secuenciadores de ADN, [2] [3] que implementaron la secuenciación de Sanger, didesoxinucleótidos fluorescentes y gel de poliacrilamida intercalado entre placas de vidrio - geles en losa. El siguiente gran avance fue el lanzamiento en 1995 del AB310, que utilizaba un polímero lineal en un capilar en lugar del gel en placa para la separación de las cadenas de ADN por electroforesis. Estas técnicas formaron la base para la finalización del proyecto del genoma humano en 2001. [4] El proyecto del genoma humano estimuló el desarrollo de plataformas más baratas, de alto rendimiento y más precisas conocidas como secuenciadores de próxima generación (NGS). En 2005, 454 Life Sciences lanzó el secuenciador 454, seguido por Solexa Genome Analyzer y SOLiD (Supported Oligo Ligation Detection) de Agencourt en 2006. Applied Biosystems adquirió Agencourt en 2006 y, en 2007, Roche compró 454 Life Sciences, mientras que Illumina compró Solexa. Ion Torrent entró en el mercado en 2010 y fue adquirido por Life Technologies (ahora Thermo Fisher Scientific ). Y BGI comenzó a fabricar secuenciadores en China después de adquirir Complete Genomics bajo su división MGI . Estos siguen siendo los sistemas de NGS más comunes debido a su costo competitivo, precisión y rendimiento.
Más recientemente, se introdujo una tercera generación de secuenciadores de ADN. Los métodos de secuenciación aplicados por estos secuenciadores no requieren amplificación de ADN (reacción en cadena de la polimerasa, PCR), lo que acelera la preparación de la muestra antes de la secuenciación y reduce los errores. Además, los datos de secuenciación se recopilan a partir de las reacciones provocadas por la adición de nucleótidos en la cadena complementaria en tiempo real. Dos empresas introdujeron diferentes enfoques en sus secuenciadores de tercera generación. Los secuenciadores de Pacific Biosciences utilizan un método llamado Single-molecules real-time (SMRT), donde los datos de secuenciación se producen mediante luz (capturada por una cámara) emitida cuando se agrega un nucleótido a la cadena complementaria mediante enzimas que contienen colorantes fluorescentes. Oxford Nanopore Technologies es otra empresa que desarrolla secuenciadores de tercera generación que utilizan sistemas electrónicos basados en tecnologías de detección de nanoporos.
Los secuenciadores de ADN han sido desarrollados, fabricados y vendidos por las siguientes empresas, entre otras.
El secuenciador de ADN 454 fue el primer secuenciador de próxima generación que tuvo éxito comercial. [10] Fue desarrollado por 454 Life Sciences y adquirido por Roche en 2007. 454 utiliza la detección de pirofosfato liberado por la reacción de la ADN polimerasa al agregar un nucleótido a la cepa plantilla.
Roche fabrica actualmente dos sistemas basados en su tecnología de pirosecuenciación: el GS FLX+ y el sistema GS Junior. [11] El sistema GS FLX+ promete longitudes de lectura de aproximadamente 1000 pares de bases, mientras que el sistema GS Junior promete lecturas de 400 pares de bases. [12] [13] Un predecesor de GS FLX+, el sistema 454 GS FLX Titanium fue lanzado en 2008, logrando una salida de 0,7 G de datos por ejecución, con una precisión del 99,9% después del filtro de calidad y una longitud de lectura de hasta 700 pb. En 2009, Roche lanzó el GS Junior, una versión de sobremesa del secuenciador 454 con una longitud de lectura de hasta 400 pb, y una preparación de bibliotecas y procesamiento de datos simplificados.
Una de las ventajas de los sistemas 454 es su velocidad de funcionamiento. La mano de obra se puede reducir con la automatización de la preparación de la biblioteca y la semiautomatización de la PCR en emulsión. Una desventaja del sistema 454 es que es propenso a errores al estimar el número de bases en una cadena larga de nucleótidos idénticos. Esto se conoce como error de homopolímero y ocurre cuando hay 6 o más bases idénticas en una fila. [14] Otra desventaja es que el precio de los reactivos es relativamente más caro en comparación con otros secuenciadores de próxima generación.
En 2013, Roche anunció que dejaría de desarrollar la tecnología 454 y que eliminaría gradualmente las máquinas 454 por completo en 2016 cuando su tecnología dejara de ser competitiva. [15] [16]
Roche produce una serie de herramientas de software optimizadas para el análisis de datos de secuenciación 454. [17] Por ejemplo,
Illumina produce una serie de máquinas de secuenciación de última generación que utilizan tecnología adquirida de Manteia Predictive Medicine y desarrollada por Solexa. [19] Illumina fabrica una serie de máquinas de secuenciación de última generación que utilizan esta tecnología, incluidas HiSeq, Genome Analyzer IIx, MiSeq y HiScanSQ, que también pueden procesar microarrays . [20]
La tecnología que dio origen a estos secuenciadores de ADN fue lanzada por primera vez por Solexa en 2006 como Genome Analyzer. [10] Illumina compró Solexa en 2007. El Genome Analyzer utiliza un método de secuenciación por síntesis. El primer modelo produjo 1 G por ejecución. Durante el año 2009, la producción se incrementó de 20 G por ejecución en agosto a 50 G por ejecución en diciembre. En 2010, Illumina lanzó el HiSeq 2000 con una producción de 200 y luego 600 G por ejecución que tomaría 8 días. En su lanzamiento, el HiSeq 2000 proporcionó una de las plataformas de secuenciación más económicas a $ 0,02 por millón de bases según el costo del Instituto de Genómica de Beijing .
En 2011, Illumina lanzó un secuenciador de sobremesa llamado MiSeq. En el momento de su lanzamiento, el MiSeq podía generar 1,5 G por ejecución con lecturas de 150 pb en pares terminales. Una ejecución de secuenciación se puede realizar en 10 horas cuando se utiliza una preparación automatizada de muestras de ADN. [10]
Illumina HiSeq utiliza dos herramientas de software para calcular la cantidad y la posición de los grupos de ADN para evaluar la calidad de la secuenciación: el sistema de control HiSeq y el analizador en tiempo real. Estos métodos ayudan a evaluar si los grupos cercanos interfieren entre sí. [10]
Life Technologies (ahora Thermo Fisher Scientific ) produce secuenciadores de ADN bajo las marcas Applied Biosystems e Ion Torrent . Applied Biosystems fabrica la plataforma de secuenciación de próxima generación SOLiD [21] y secuenciadores de ADN basados en Sanger como el 3500 Genetic Analyzer [22] . Bajo la marca Ion Torrent, Applied Biosystems produce cuatro secuenciadores de próxima generación: el sistema Ion PGM, el sistema Ion Proton, los sistemas Ion S5 e Ion S5xl [23] . También se cree que la empresa está desarrollando su nuevo secuenciador de ADN capilar llamado SeqStudio que se lanzará a principios de 2018 [24] .
SOLiD Systems fue adquirido por Applied Biosystems en 2006. SOLiD aplica secuenciación por ligadura y codificación de base dual . El primer sistema SOLiD se lanzó en 2007, generando longitudes de lectura de 35 pb y datos de 3 G por ejecución. Después de cinco actualizaciones, el sistema de secuenciación 5500xl se lanzó en 2010, aumentando considerablemente la longitud de lectura a 85 pb, mejorando la precisión hasta el 99,99% y produciendo 30 G por ejecución de 7 días. [10]
La longitud de lectura limitada del SOLiD sigue siendo una deficiencia importante [25] y ha limitado hasta cierto punto su uso a experimentos donde la longitud de lectura es menos vital, como la resecuenciación y el análisis del transcriptoma y, más recientemente, los experimentos de ChIP-Seq y metilación. [10] El tiempo de preparación de muestras de ADN para los sistemas SOLiD se ha vuelto mucho más rápido con la automatización de las preparaciones de bibliotecas de secuenciación, como el sistema Tecan. [10]
Los datos del espacio de color producidos por la plataforma SOLiD se pueden decodificar en bases de ADN para su posterior análisis, sin embargo, el software que considera la información del espacio de color original puede brindar resultados más precisos. Life Technologies ha lanzado BioScope, [26] un paquete de análisis de datos para resecuenciación, ChiP-Seq y análisis del transcriptoma. Utiliza el algoritmo MaxMapper para mapear las lecturas del espacio de color.
Beckman Coulter (ahora Danaher ) ha fabricado anteriormente secuenciadores de ADN basados en terminación de cadena y electroforesis capilar bajo el nombre de modelo CEQ, incluido el CEQ 8000. [27] La compañía ahora produce el Sistema de Análisis Genético GeXP, que utiliza secuenciación de terminador de tinte . [28] Este método utiliza un termociclador de la misma manera que la PCR para desnaturalizar, recocer y extender fragmentos de ADN, amplificando los fragmentos secuenciados. [29] [30]
Pacific Biosciences produce los sistemas de secuenciación PacBio RS y Sequel utilizando un método de secuenciación en tiempo real de una sola molécula , o SMRT, por sus siglas en inglés. [31] Este sistema puede producir longitudes de lectura de varios miles de pares de bases. Los errores de lectura sin procesar más altos se corrigen utilizando consenso circular (donde se lee la misma cadena una y otra vez) o utilizando estrategias de ensamblaje optimizadas . [32] Los científicos han informado una precisión del 99,9999 % con estas estrategias. [33] El sistema Sequel se lanzó en 2015 con una mayor capacidad y un precio más bajo. [34] [35]
El secuenciador MinION de Oxford Nanopore Technologies se basa en la evolución de la tecnología de secuenciación de nanoporos para análisis de ácidos nucleicos. [37] El dispositivo tiene cuatro pulgadas de largo y se alimenta de un puerto USB . MinION decodifica el ADN directamente a medida que la molécula se extrae a una velocidad de 450 bases/segundo a través de un nanoporo suspendido en una membrana. [38] Los cambios en la corriente eléctrica indican qué base está presente. Inicialmente, el dispositivo tenía una precisión del 60 al 85 por ciento, en comparación con el 99,9 por ciento de las máquinas convencionales. [39] Incluso los resultados inexactos pueden resultar útiles porque produce longitudes de lectura largas. [40] A principios de 2021, investigadores de la Universidad de Columbia Británica han utilizado etiquetas moleculares especiales y han podido reducir la tasa de error del cinco al 15 por ciento del dispositivo a menos del 0,005 por ciento incluso al secuenciar muchos tramos largos de ADN a la vez. [41] Hay dos iteraciones más del producto basadas en MinION; El primero es el GridION, un secuenciador un poco más grande que procesa hasta cinco celdas de flujo MinION a la vez, y el segundo es el PromethION, que utiliza hasta 100.000 poros en paralelo, más adecuado para la secuenciación de gran volumen. [42]
MGI produce secuenciadores de alto rendimiento para investigación científica y aplicaciones clínicas, como DNBSEQ-G50, DNBSEQ-G400 y DNBSEQ-T7, bajo una tecnología DNBSEQ patentada. [43] Se basa en la secuenciación de nanobolas de ADN y tecnologías de síntesis de anclaje de sonda combinatoria, en las que las nanobolas de ADN (DNB) se cargan en un chip de matriz estampada a través del sistema fluídico y, posteriormente, se agrega un cebador de secuenciación a la región adaptadora de las DNB para la hibridación . DNBSEQ-T7 puede generar lecturas cortas a una escala muy grande: hasta 60 genomas humanos por día. [44] DNBSEQ-T7 se utilizó para generar lecturas de extremos emparejados de 150 pb, secuenciando 30X, para secuenciar el genoma del SARS-CoV-2 o COVID-19 para identificar la predisposición de variantes genéticas en la enfermedad grave por COVID-19. [45] Utilizando una técnica novedosa, los investigadores del Banco Nacional de Genes de China secuenciaron bibliotecas libres de PCR en matrices DNBSEQ libres de PCR de MGI para obtener por primera vez una verdadera secuenciación del genoma completo libre de PCR . [46] MGISEQ-2000 se utilizó en la secuenciación de ARN de una sola célula para estudiar la patogénesis subyacente y la recuperación en pacientes con COVID-19, como se publicó en Nature Medicine . [47]
Las ofertas actuales en tecnología de secuenciación de ADN muestran un actor dominante: Illumina (diciembre de 2019), seguido de PacBio , MGI y Oxford Nanopore .