La secuenciación por inserción de transposones ( Tn-seq ) combina la mutagénesis por inserción de transposones con la secuenciación masiva en paralelo (MPS) de los sitios de inserción de transposones para identificar genes que contribuyen a una función de interés en las bacterias . El método se estableció originalmente mediante trabajo simultáneo en cuatro laboratorios bajo las siglas HITS, [1] INSeq, [2] TraDIS, [3] y Tn-Seq. [4] Posteriormente se han desarrollado numerosas variaciones y se han aplicado a diversos sistemas biológicos. En conjunto, los métodos a menudo se denominan Tn-Seq, ya que todos implican el monitoreo de la aptitud de los mutantes de inserción de transposones a través de enfoques de secuenciación de ADN. [5]
Los transposones son segmentos de ADN discretos y altamente regulados que pueden reubicarse dentro del genoma. Son universales y se encuentran en Eubacteria , Archaea y Eukarya , incluidos los humanos. Los transposones tienen una gran influencia en la expresión genética y se pueden utilizar para determinar la función genética. De hecho, cuando un transposón se inserta en un gen, la función del gen se verá alterada. [6] Debido a esa propiedad, los transposones se han manipulado para su uso en mutagénesis insercional. [7] El desarrollo de la secuenciación del genoma microbiano fue un avance importante para el uso de la mutagénesis por transposones. [8] [9] La función afectada por la inserción de un transposón podría vincularse al gen alterado mediante la secuenciación del genoma para localizar el sitio de inserción del transposón. La secuenciación masiva paralela permite la secuenciación simultánea de los sitios de inserción del transposón en grandes mezclas de diferentes mutantes. Por lo tanto, el análisis de todo el genoma es factible si los transposones se colocan en todo el genoma en una colección de mutantes. [5]
La secuenciación de transposones requiere la creación de una biblioteca de inserción de transposones, que contendrá un grupo de mutantes que colectivamente tienen inserciones de transposones en todos los genes no esenciales. La biblioteca se cultiva bajo una condición experimental de interés. Los mutantes con transposones insertados en genes necesarios para el crecimiento bajo la condición de prueba disminuirán en frecuencia en la población. Para identificar mutantes que se están perdiendo, las secuencias genómicas adyacentes a los extremos de los transposones se amplifican por PCR y se secuencian por MPS para determinar la ubicación y abundancia de cada mutación de inserción. La importancia de cada gen para el crecimiento bajo la condición de prueba se determina comparando la abundancia de cada mutante antes y después del crecimiento bajo la condición que se está examinando. La secuenciación de Tn es útil tanto para el estudio de la aptitud de un solo gen como para las interacciones entre genes [10].
La mutagénesis con marcadores de firma (STM) es una técnica más antigua que también implica la agrupación de mutantes de inserción de transposones para determinar la importancia de los genes alterados en condiciones de crecimiento selectivo. [11] Las versiones de alto rendimiento de STM utilizan microarreglos genómicos, que son menos precisos y tienen un rango dinámico menor que la secuenciación masiva paralela. [5] Con la invención de la secuenciación de próxima generación, los datos genómicos se volvieron cada vez más disponibles. Sin embargo, a pesar del aumento de los datos genómicos, nuestro conocimiento de la función de los genes sigue siendo el factor limitante en nuestra comprensión del papel que desempeñan los genes. [12] [13] Por lo tanto, era necesaria una estrategia de alto rendimiento para estudiar las relaciones genotipo-fenotipo como Tn-seq.
La secuenciación de transposones comienza transduciendo [ aclaración necesaria ] poblaciones bacterianas con elementos transponibles [ aclaración necesaria ] utilizando bacteriófagos . Tn-seq [ aclaración necesaria ] utiliza el transposón Himar I Mariner, un transposón [ aclaración necesaria ] común y estable . Después de la transducción, el ADN se escinde [ aclaración necesaria ] y la secuencia insertada se amplifica mediante PCR . Los sitios de reconocimiento [ aclaración necesaria ] para MmeI, una endonucleasa de restricción tipo IIS [ aclaración necesaria ] , se pueden introducir mediante un cambio de un solo nucleótido en las repeticiones terminales [ aclaración necesaria ] de Mariner [ aclaración necesaria ] . [14] Se [ aclaración necesaria ] encuentra 4 pares de bases antes del final de la repetición terminal.
MmeI realiza un corte escalonado de 2 pares de bases [ aclaración necesaria ] 20 bases aguas abajo [ aclaración necesaria ] del sitio de reconocimiento [ aclaración necesaria ] . [15]
Cuando MmeI digiere ADN de una biblioteca [ aclaración necesaria ] de mutantes de inserción de transposones [ aclaración necesaria ] , se produce ADN fragmentado que incluye el transposón izquierdo y derecho y 16 pares de bases de ADN genómico circundante. El fragmento de 16 pares de bases es suficiente para determinar la ubicación de la inserción del transposón en el genoma bacteriano. La ligadura [ aclaración necesaria ] del adaptador [ aclaración necesaria ] se facilita por el saliente de 2 bases [ aclaración necesaria ] . Se utilizan un cebador [ aclaración necesaria ] específico para el adaptador y un cebador específico para el transposón para amplificar la secuencia mediante PCR. Luego, el producto de 120 pares de bases [ aclaración necesaria ] se aísla utilizando gel de agarosa [ aclaración necesaria ] o purificación PAGE [ aclaración necesaria ] . Luego, se utiliza la secuenciación masiva paralela para determinar las secuencias de los 16 pares de bases flanqueantes [ aclaración necesaria ] . [10]
La función del gen se infiere después de observar los efectos de la inserción en la función del gen bajo ciertas condiciones [ aclaración necesaria ] .
A diferencia de la secuenciación de inserción de alto rendimiento por secuenciación profunda (HITS) y la secuenciación del sitio de inserción dirigido por transposón (TraDIS) [ aclaración necesaria ] , Tn-seq es específico del transposón Himar I Mariner y no se puede aplicar a otros transposones o elementos de inserción. [10] Sin embargo, el protocolo para Tn-seq [ aclaración necesaria ] requiere menos tiempo [ cita necesaria ] . HITS y TraDIS [ aclaración necesaria ] utilizan una técnica de corte de ADN [ aclaración necesaria ] que produce una variedad de tamaños de productos de PCR que podrían hacer que las plantillas de ADN más cortas se amplifiquen preferentemente sobre las plantillas más largas. Tn-seq produce un producto que es uniforme en tamaño, lo que reduce la posibilidad de sesgo de PCR. [10]
La secuenciación en paralelo masiva se puede utilizar para identificar tanto la aptitud de genes individuales como para mapear las interacciones de genes en microorganismos. Los métodos existentes para este tipo de estudios dependen de microarreglos genómicos preexistentes o de arreglos de genes knockout, mientras que la secuenciación en paralelo masiva se utiliza para esta técnica, lo que la hace fácilmente reproducible, sensible y robusta. [10] [ aclaración necesaria ]
La secuenciación de Tn ha demostrado ser una técnica útil para identificar nuevas funciones genéticas. [ aclaración necesaria ] La naturaleza altamente sensible de la secuenciación de Tn [ cita requerida ] se puede utilizar para determinar relaciones fenotipo-genotipo que pueden haberse considerado insignificantes con métodos menos sensibles. La secuenciación de Tn identificó genes y vías esenciales que son importantes para la utilización del colesterol en Mycobacterium tuberculosis . [ 16 ]
La secuenciación de nucleótidos (TN) se ha utilizado para estudiar la organización de un genoma de orden superior mediante interacciones genéticas. [ cita requerida ] Los genes funcionan como una red altamente vinculada [ cita requerida ] . Por lo tanto, para estudiar el impacto de un gen en el fenotipo , también se deben considerar las interacciones genéticas [ cita requerida ] . Estas redes genéticas se pueden estudiar mediante la detección de letalidad sintética e interacciones genéticas donde un mutante doble muestra un valor de aptitud inesperado en comparación con cada mutante individual [ aclaración necesaria ] [ cita requerida ] . La secuenciación de nucleótidos (TN) se utilizó para determinar las interacciones genéticas entre cinco genes de consulta y el resto del genoma en Streptococcus pneumoniae, que revelaron interacciones genéticas tanto agravantes como aliviantes. [ 4 ] [ aclaración necesaria ] [ 10 ]
La secuenciación de Tn utilizada en combinación con la secuenciación de ARN se puede utilizar para examinar el papel de las regiones de ADN no codificantes . [17]