La secuenciación de inserción de transposones ( Tn-seq ) combina la mutagénesis de inserción de transposones con la secuenciación masiva paralela (MPS) de los sitios de inserción de transposones para identificar genes que contribuyen a una función de interés en las bacterias . El método se estableció originalmente mediante trabajo simultáneo en cuatro laboratorios bajo las siglas HITS, [1] INSeq, [2] TraDIS, [3] y Tn-Seq. [4] Posteriormente se han desarrollado y aplicado numerosas variaciones a diversos sistemas biológicos. En conjunto, los métodos a menudo se denominan Tn-Seq, ya que todos implican monitorear la aptitud de los mutantes de inserción de transposones mediante enfoques de secuenciación de ADN. [5]
Los transposones son segmentos de ADN discretos y altamente regulados que pueden reubicarse dentro del genoma. Son universales y se encuentran en Eubacteria , Archaea y Eukarya , incluidos los humanos. Los transposones tienen una gran influencia en la expresión genética y pueden usarse para determinar la función genética. De hecho, cuando un transposón se inserta en un gen, la función del gen se verá alterada. [6] Debido a esa propiedad, los transposones han sido manipulados para su uso en mutagénesis por inserción. [7] El desarrollo de la secuenciación del genoma microbiano fue un avance importante para el uso de la mutagénesis de transposones. [8] [9] La función afectada por la inserción de un transposón podría vincularse al gen alterado mediante la secuenciación del genoma para localizar el sitio de inserción del transposón. La secuenciación masiva en paralelo permite la secuenciación simultánea de sitios de inserción de transposones en grandes mezclas de diferentes mutantes. Por lo tanto, el análisis de todo el genoma es factible si los transposones se colocan en todo el genoma en una colección de mutantes. [5]
La secuenciación de transposones requiere la creación de una biblioteca de inserciones de transposones, que contendrá un grupo de mutantes que colectivamente tienen inserciones de transposones en todos los genes no esenciales. La biblioteca se cultiva bajo una condición experimental de interés. Los mutantes con transposones insertados en genes necesarios para el crecimiento en las condiciones de prueba disminuirán en frecuencia en la población. Para identificar los mutantes que se están perdiendo, las secuencias genómicas adyacentes a los extremos del transposón se amplifican mediante PCR y se secuencian mediante MPS para determinar la ubicación y abundancia de cada mutación de inserción. La importancia de cada gen para el crecimiento en las condiciones de prueba se determina comparando la abundancia de cada mutante antes y después del crecimiento en las condiciones que se examinan. Tn-seq es útil tanto para el estudio de la aptitud de un solo gen como para las interacciones genéticas [10]
La mutagénesis marcada con firma (STM) es una técnica más antigua que también implica la combinación de mutantes de inserción de transposones para determinar la importancia de los genes alterados en condiciones de crecimiento selectivas. [11] Las versiones de alto rendimiento de STM utilizan microarrays genómicos, que son menos precisos y tienen un rango dinámico más bajo que la secuenciación masiva en paralelo. [5] Con la invención de la secuenciación de próxima generación, los datos genómicos estuvieron cada vez más disponibles. Sin embargo, a pesar del aumento de datos genómicos, nuestro conocimiento de la función de los genes sigue siendo el factor limitante en nuestra comprensión del papel que desempeñan los genes. [12] [13] Por lo tanto, era necesaria un enfoque de alto rendimiento para estudiar las relaciones genotipo-fenotipo como Tn-seq.
La secuenciación de transposones comienza transduciendo [ se necesita aclaración ] poblaciones bacterianas con elementos transponibles [ se necesita aclaración ] utilizando bacteriófagos . Tn-seq [ se necesita aclaración ] utiliza el transposón Himar I Mariner, un transposón común y estable [ se necesita aclaración ] . Después de la transducción, el ADN se escinde [ se necesita aclaración ] y la secuencia insertada se amplifica mediante PCR . Los sitios de reconocimiento [ se necesita aclaración ] para MmeI, una endonucleasa de restricción de tipo IIS [ se necesita aclaración ] , pueden introducirse mediante un único cambio de nucleótido en las repeticiones terminales [ se necesita aclaración ] de Mariner [ se necesita aclaración ] . [14] [ Se necesita aclaración ] se encuentra 4 pares de bases antes del final de la repetición terminal.
MmeI realiza un corte escalonado de 2 pares de bases [ se necesita aclaración ] 20 bases aguas abajo [ se necesita aclaración ] del sitio de reconocimiento [ se necesita aclaración ] . [15]
Cuando MmeI digiere ADN de una biblioteca [ se necesita aclaración ] de mutantes de inserción de transposones [ se necesita aclaración ] , se produce ADN fragmentado que incluye el transposón izquierdo y derecho y 16 pares de bases de ADN genómico circundante. El fragmento de 16 pares de bases es suficiente para determinar la ubicación de la inserción del transposón en el genoma bacteriano. La ligadura [ se necesita aclaración ] del adaptador [ se necesita aclaración ] se ve facilitada por el saliente de 2 bases [ se necesita aclaración ] . Se utilizan un cebador [ se necesita aclaración ] específico para el adaptador y un cebador específico para el transposón para amplificar la secuencia mediante PCR. Luego , el producto de 120 pares de bases [ se necesita clarificación ] se aísla usando purificación en gel de agarosa [ se necesita clarificación ] o PAGE [ se necesita clarificación ] . Luego se utiliza una secuenciación masiva paralela para determinar las secuencias de los 16 pares de bases flanqueantes [ aclaración necesaria ] . [10]
La función genética se infiere después de observar los efectos de la inserción sobre la función genética bajo ciertas condiciones [ aclaración necesaria ] .
A diferencia de la pista de inserción de alto rendimiento mediante secuenciación profunda (HITS) y la secuenciación del sitio de inserción dirigida por transposones (TraDIS) [ aclaración necesaria ] , Tn-seq es específico del transposón Himar I Mariner y no se puede aplicar a otros transposones o elementos de inserción. [10] Sin embargo, el protocolo para Tn-seq [ aclaración necesaria ] requiere menos tiempo [ cita necesaria ] . HITS y TraDIS [ se necesita aclaración ] utilizan una técnica de corte de ADN [ se necesita aclaración ] que produce una variedad de tamaños de productos de PCR que podrían causar que las plantillas de ADN más cortas se amplifiquen preferentemente en lugar de las plantillas más largas. Tn-seq produce un producto de tamaño uniforme, lo que reduce la posibilidad de sesgo de PCR. [10]
Tn-seq se puede utilizar para identificar tanto la aptitud de genes individuales como para mapear interacciones genéticas en microorganismos. Los métodos existentes para este tipo de estudios dependen de micromatrices genómicas preexistentes o matrices de desactivación de genes, mientras que Tn-seq no depende. La utilización de secuenciación masiva paralela por parte de Tn-seq hace que esta técnica sea fácilmente reproducible, sensible y robusta. [10] [ se necesita aclaración ]
Tn-seq ha demostrado ser una técnica útil para identificar nuevas funciones genéticas. [ aclaración necesaria ] La naturaleza altamente sensible de Tn-seq [ cita necesaria ] se puede utilizar para determinar las relaciones fenotipo-genotipo que pueden haberse considerado insignificantes mediante métodos menos sensibles. Tn-seq identificó genes y vías esenciales que son importantes para la utilización del colesterol en Mycobacterium tuberculosis . [dieciséis]
Tn-seq se ha utilizado para estudiar la organización del genoma de orden superior mediante interacciones genéticas. [ cita necesaria ] Los genes funcionan como una red altamente vinculada [ cita necesaria ] . Por lo tanto, para estudiar el impacto de un gen en el fenotipo , también se deben considerar las interacciones genéticas [ cita necesaria ] . Estas redes de genes se pueden estudiar mediante la detección de letalidad sintética e interacciones genéticas donde un mutante doble muestra un valor de aptitud inesperado en comparación con cada mutante individual [ aclaración necesaria ] [ cita requerida ] . Se utilizó Tn-seq para determinar las interacciones genéticas entre cinco genes de consulta y el resto del genoma en Streptococcus pneumoniae, lo que reveló interacciones genéticas tanto agravantes como aliviadoras. [4] [ se necesita aclaración ] [10]
Tn-seq utilizado en combinación con RNA-seq se puede utilizar para examinar el papel de las regiones de ADN no codificantes . [17]