La secuenciación con tintes Illumina es una técnica utilizada para determinar la serie de pares de bases en el ADN , también conocida como secuenciación de ADN . El concepto de química terminada reversible fue inventado por Bruno Canard y Simon Sarfati en el Instituto Pasteur de París. [1] [2] Fue desarrollado por Shankar Balasubramanian y David Klenerman de la Universidad de Cambridge, [3] quienes posteriormente fundaron Solexa, una empresa posteriormente adquirida por Illumina . Este método de secuenciación se basa en terminadores de colorantes reversibles que permiten la identificación de nucleótidos individuales a medida que se lavan sobre las cadenas de ADN. También se puede utilizar para secuenciación de regiones y genoma completo, análisis de transcriptoma , metagenómica , descubrimiento de ARN pequeño , perfiles de metilación y análisis de interacción proteína - ácido nucleico de todo el genoma. [4] [5]
Esto funciona en tres pasos básicos: amplificar, secuenciar y analizar. El proceso comienza con ADN purificado. El ADN se fragmenta y se añaden adaptadores que contienen segmentos que actúan como puntos de referencia durante la amplificación, secuenciación y análisis. El ADN modificado se carga en una celda de flujo donde se llevará a cabo la amplificación y la secuenciación. La celda de flujo contiene nanopozos que espacian los fragmentos y ayudan con el hacinamiento. [6] Cada nanopozo contiene oligonucleótidos que proporcionan un punto de anclaje para que se unan los adaptadores. Una vez que los fragmentos se han adherido, comienza una fase llamada generación de clústeres. Este paso genera alrededor de mil copias de cada fragmento de ADN y se realiza mediante amplificación en puente por PCR . A continuación, se lavan sobre el chip cebadores y nucleótidos modificados. Estos nucleótidos tienen un bloqueador fluorescente reversible, por lo que la ADN polimerasa sólo puede agregar un nucleótido a la vez al fragmento de ADN. [6] Después de cada ronda de síntesis, una cámara toma una fotografía del chip. Una computadora determina qué base se agregó mediante la longitud de onda de la etiqueta fluorescente y la registra para cada punto del chip. Después de cada ronda, las moléculas no incorporadas se eliminan por lavado. Luego se utiliza un paso de desbloqueo químico para eliminar el grupo de bloqueo del terminal fluorescente 3'. El proceso continúa hasta que se secuencia la molécula de ADN completa. [5] Con esta tecnología, miles de lugares en todo el genoma se secuencian a la vez mediante una secuenciación paralela masiva .
Una vez purificado el ADN, es necesario generar una biblioteca de ADN, una biblioteca genómica. Hay dos formas de crear una biblioteca genómica: sonicación y tagmentación. Con la etiquetación, las transposasas cortan aleatoriamente el ADN en fragmentos de entre 50 y 500 pb y agregan adaptadores simultáneamente. [6] También se puede generar una biblioteca genética mediante el uso de sonicación para fragmentar el ADN genómico. La sonicación fragmenta el ADN en tamaños similares mediante ondas sonoras ultrasónicas. Los adaptadores derecho e izquierdo deberán estar unidos mediante ADN polimerasa T7 y ADN ligasa T4 después de la sonicación. Las hebras a las que no se les han ligado los adaptadores se eliminan con lavado. [7]
Los adaptadores contienen tres segmentos diferentes: la secuencia complementaria al soporte sólido (oligonucleótidos en la celda de flujo), la secuencia del código de barras (índices) y el sitio de unión para el cebador de secuenciación. [6] Los índices suelen tener seis pares de bases de largo y se utilizan durante el análisis de secuencia de ADN para identificar muestras. Los índices permiten ejecutar juntas hasta 96 muestras diferentes, esto también se conoce como multiplexación. Durante el análisis, la computadora agrupará todas las lecturas con el mismo índice. [8] [9] Illumina utiliza un enfoque de "secuencia por síntesis". [9] Este proceso tiene lugar dentro de una celda de flujo de vidrio recubierta de acrilamida. [10] La celda de flujo tiene oligonucleótidos (secuencias cortas de nucleótidos) que recubren la parte inferior de la celda y sirven como soporte sólido para mantener las cadenas de ADN en su lugar durante la secuenciación. A medida que el ADN fragmentado se lava sobre la celda de flujo, el adaptador apropiado se adhiere al soporte sólido complementario.
Una vez conectado, puede comenzar la generación del clúster. El objetivo es crear cientos de hebras idénticas de ADN. Algunos serán la línea de avance; el resto, al revés. Por eso se utilizan adaptadores derecho e izquierdo. Los grupos se generan mediante amplificación de puente. La ADN polimerasa se mueve a lo largo de una cadena de ADN, creando su cadena complementaria. La hebra original se elimina con lavado, dejando solo la hebra inversa. En la parte superior del hilo inverso hay una secuencia adaptadora. La cadena de ADN se dobla y se une al oligo que es complementario a la secuencia adaptadora superior. Las polimerasas se unen a la hebra inversa y se forma su hebra complementaria (que es idéntica a la original). El ADN ahora bicatenario se desnaturaliza para que cada hebra pueda unirse por separado a una secuencia de oligonucleótidos anclada a la celda de flujo. Uno será el hilo inverso; el otro, el delantero. Este proceso se llama amplificación de puente y ocurre con miles de grupos en toda la celda de flujo a la vez. [11]
Una y otra vez, las hebras de ADN se doblarán y se unirán al soporte sólido. La ADN polimerasa sintetizará una nueva cadena para crear un segmento de doble cadena, que se desnaturalizará para que todas las cadenas de ADN en un área provengan de una sola fuente (amplificación clonal). La amplificación clonal es importante para fines de control de calidad. Si se descubre que una cadena tiene una secuencia extraña, entonces los científicos pueden verificar la cadena inversa para asegurarse de que tenga el complemento de la misma rareza. Los hilos delanteros y traseros actúan como controles para proteger contra artefactos. Debido a que la secuenciación de Illumina utiliza ADN polimerasa, se han observado errores de sustitución de bases, [12] especialmente en el extremo 3'. [13] Las lecturas finales emparejadas combinadas con la generación de clústeres pueden confirmar que se produjo un error. Las hebras inversa y directa deben ser complementarias entre sí, todas las lecturas inversas deben coincidir entre sí y todas las lecturas directas deben coincidir entre sí. Si una lectura no es lo suficientemente similar a sus contrapartes (de las cuales debería ser un clon), es posible que se haya producido un error. En los análisis de algunos laboratorios se ha utilizado un umbral mínimo del 97% de similitud. [13]
Al final de la amplificación clonal, todas las cadenas inversas se eliminan por lavado de la celda de flujo, dejando solo las cadenas delanteras. Un cebador se une al sitio de unión del cebador adaptador de las cadenas delanteras y una polimerasa agrega un dNTP marcado con fluorescencia a la cadena de ADN. Solo se puede agregar una base por ronda debido a que el fluoróforo actúa como grupo bloqueador; sin embargo, el grupo bloqueador es reversible. [6] Usando la química de los cuatro colores, cada una de las cuatro bases tiene una emisión única, y después de cada ronda, la máquina registra qué base se agregó. Una vez que se registra el color, se lava el fluoróforo y se lava otro dNTP sobre la celda de flujo y se repite el proceso.
A partir del lanzamiento de NextSeq y posteriormente de MiniSeq, Illumina introdujo una nueva química de secuenciación de dos colores. Los nucleótidos se distinguen por uno de dos colores (rojo o verde), ningún color ("negro") o la combinación de ambos colores (apareciendo el naranja como una mezcla entre rojo y verde).
Una vez que se ha leído la cadena de ADN, la cadena que se acaba de agregar se elimina por lavado. Luego, el cebador de índice 1 se adhiere, polimeriza la secuencia de índice 1 y se elimina por lavado. La cadena vuelve a formar un puente y el extremo 3' de la cadena de ADN se une a un oligo en la celda de flujo. El cebador de índice 2 se adhiere, polimeriza la secuencia y se elimina por lavado.
Una polimerasa secuencia la hebra complementaria encima de la hebra arqueada. Se separan y se bloquea el extremo 3' de cada hebra. La cadena delantera se elimina por lavado y el proceso de secuenciación por síntesis se repite para la cadena inversa.
La secuenciación se produce para millones de grupos a la vez, y cada grupo tiene ~1000 copias idénticas de un inserto de ADN. [12] Los datos de secuencia se analizan encontrando fragmentos con áreas superpuestas, llamados contigs , y alineándolos. Si se conoce una secuencia de referencia, los cóntigos se comparan con ella para la identificación de variantes.
Este proceso gradual permite a los científicos ver la secuencia completa aunque nunca se haya ejecutado una secuencia no fragmentada; sin embargo, debido a que las longitudes de lectura de Illumina no son muy largas [13] (la secuenciación HiSeq puede producir longitudes de lectura de alrededor de 90 pb [8] ), puede resultar complicado resolver áreas cortas de repetición en tándem. [8] [12] Además, si la secuencia es de novo y no existe una referencia, las áreas repetidas pueden causar muchas dificultades en el ensamblaje de la secuencia. [12] Las dificultades adicionales incluyen sustituciones de bases (especialmente en el extremo 3' de las lecturas [13] ) por polimerasas inexactas, secuencias quiméricas y sesgo de PCR, todo lo cual puede contribuir a generar una secuencia incorrecta. [13]
Esta técnica ofrece varias ventajas sobre los métodos de secuenciación tradicionales, como la secuenciación de Sanger . La secuenciación de Sanger requiere dos reacciones, una para el cebador directo y otra para el cebador inverso. A diferencia de Illumina, la secuenciación de Sanger utiliza didesoxinucleósidos trifosfatos (ddNTP) marcados con fluorescencia para determinar la secuencia del fragmento de ADN. A los ddNTP les falta el grupo 3' OH y terminan la síntesis de ADN de forma permanente. [6] En cada tubo de reacción, se añaden dNTP y ddNTP, junto con ADN polimerasa y cebadores. La proporción de ddNTP y dNTP es importante, ya que el ADN molde debe sintetizarse por completo, y una sobreabundancia de ddNTP creará múltiples fragmentos del mismo tamaño y posición del molde de ADN. Cuando la ADN polimerasa agrega un ddNTP, el fragmento termina y se sintetiza un nuevo fragmento. Cada fragmento sintetizado es un nucleótido más largo que el anterior. Una vez que la plantilla de ADN se ha sintetizado completamente, los fragmentos se separan mediante electroforesis capilar. En la parte inferior del tubo capilar, un láser excita los ddNTP marcados con fluorescencia y una cámara captura el color emitido.
Debido a la naturaleza automatizada de la secuenciación de tintes de Illumina, es posible secuenciar varias hebras a la vez y obtener datos de secuenciación reales rápidamente. Con la secuenciación de Sanger, solo se puede secuenciar una hebra a la vez y es relativamente lenta. Illumina solo utiliza ADN polimerasa a diferencia de las múltiples y costosas enzimas requeridas por otras técnicas de secuenciación (es decir, pirosecuenciación ). [14]
{{cite book}}
: Mantenimiento CS1: falta el editor de la ubicación ( enlace )