Secuenciación de escopeta

Hay dos métodos principales para este proceso de fragmentación y secuenciación.Primer walking (o "chromosome walking") progresa a través de toda la hebra pieza por pieza, mientras que la secuenciación rápida es un proceso más rápido, pero más complejo que utiliza fragmentos aleatorios.Se obtienen múltiples lecturas superpuestas para el ADN diana realizando varias rondas de esta fragmentación y secuenciación.Por ejemplo, para completar el Proyecto Genoma Humano, la mayor parte del genoma humano se secuenció a una cobertura 12X o mayor; es decir, cada base de la secuencia final estuvo presente en promedio en 12 lecturas diferentes.Aun así, los métodos actuales no han logrado aislar o ensamblar una secuencia confiable para aproximadamente el 1% del genoma humano (eucromático), hasta 2004.Primero, las lecturas superpuestas se recopilan en secuencias compuestas más largas conocidas como contigs.Los contigs se pueden unir en andamios siguiendo las conexiones entre pares de aparejos.A medida que los programas de ensamblaje de secuencias se vuelven más sofisticados y la potencia informática se vuelve más barata, puede ser posible superar esta limitación.Este parámetro también permite estimar otras cantidades, como el porcentaje del genoma cubierto por lecturas (a veces también llamado cobertura).El genoma amplificado primero se corta en trozos más grandes (50-200 kb) y se clona en un huésped bacteriano utilizando BAC o cromosomas artificiales derivados de P1 (PAC).Debido a que se han cortado al azar múltiples copias del genoma, los fragmentos contenidos en estos clones tienen diferentes extremos, y con suficiente cobertura encontrar un andamio de contigs BAC que cubra todo el genoma es teóricamente posible.Este andamio se llama camino de mosaico (tiling path).Existen varios métodos para deducir este orden y seleccionar los BAC que componen una ruta de mosaico.De esta forma, se identifican todos los clones que contienen una secuencia particular en el genoma.Ahora que la tecnología está disponible y se ha demostrado la fiabilidad de los datos,[13]​ la velocidad y la rentabilidad de la secuenciación rápida del genoma completo lo han convertido en el método principal para la secuenciación del genoma.[16]​ Esto da como resultado una alta cobertura, pero el proceso de ensamblaje es mucho más intensivo en computación.Estas tecnologías son muy superiores a la secuenciación de Sanger debido al gran volumen de datos y al tiempo relativamente corto que lleva secuenciar un genoma completo.[18]​ La sensibilidad de la secuenciación metagenómica la convierte en una opción atractiva para uso clínico.
En la secuenciación de escopeta del genoma completo (arriba), todo el genoma se corta al azar en pequeños fragmentos (del tamaño adecuado para la secuenciación) y luego se vuelve a ensamblar. En la secuenciación jerárquica de escopeta (abajo), el genoma se divide primero en segmentos más grandes. Después de deducir el orden de estos segmentos, se cortan en fragmentos de tamaño apropiado para la secuenciación.
Un contig BAC que cubre toda el área genómica de interés constituye el camino del mosaico.