En el campo de la secuenciación genética , la genotipificación por secuenciación , también llamada GBS , es un método para descubrir polimorfismos de un solo nucleótido (SNP) con el fin de realizar estudios de genotipificación , como los estudios de asociación de todo el genoma ( GWAS ). [1] GBS utiliza enzimas de restricción para reducir la complejidad del genoma y genotipar múltiples muestras de ADN. [2] Después de la digestión, se realiza una PCR para aumentar el conjunto de fragmentos y luego se secuencian las bibliotecas de GBS utilizando tecnologías de secuenciación de próxima generación, lo que generalmente da como resultado lecturas de un solo extremo de aproximadamente 100 pb. [3] Es relativamente económico y se ha utilizado en el mejoramiento de plantas . [2] Aunque GBS presenta un enfoque similar al método de secuenciación de ADN asociada al sitio de restricción (RAD-seq), difieren en algunos aspectos sustanciales. [4] [5] [6]
GBS es un procedimiento robusto, simple y asequible para el descubrimiento y mapeo de SNP. En general, este enfoque reduce la complejidad del genoma con enzimas de restricción (RE) en especies de alta diversidad y genomas grandes para una secuenciación eficiente de alto rendimiento y altamente multiplexada. Al usar RE apropiadas, se pueden evitar las regiones repetitivas de los genomas y se pueden apuntar a las regiones de menor copia, lo que reduce los problemas de alineamientos en especies genéticamente muy diversas. El método fue descrito por primera vez por Elshire et al. (2011). [1] En resumen, los ADN de alto peso molecular se extraen y digieren utilizando un RE específico previamente definido cortando con frecuencia [7] en la fracción repetitiva principal del genoma. ApeKI es el RE más utilizado. Luego, los adaptadores de código de barras se ligan a los extremos pegajosos y se realiza la amplificación por PCR . Se utiliza tecnología de secuenciación de próxima generación que da como resultado lecturas de un solo extremo de aproximadamente 100 pb. Los datos de secuencia sin procesar se filtran y se alinean con un genoma de referencia utilizando generalmente la herramienta de alineación Burrows-Wheeler (BWA) o Bowtie 2 . El siguiente paso es identificar los SNP a partir de las etiquetas alineadas y puntuar todos los SNP descubiertos en función de diversas coberturas, profundidades y estadísticas genotípicas. Una vez que se ha realizado una producción de SNP a gran escala y para toda la especie, es posible invocar rápidamente los SNP conocidos en muestras recién secuenciadas. [8]
Cuando se desarrolló inicialmente, el enfoque GBS se probó y validó en líneas endogámicas recombinantes (RIL) de una población de mapeo de maíz de alta resolución (IBM) y líneas de cebada doblemente haploides (DH) de la población de mapeo de Oregon Wolfe Barley (OWB). Se agruparon y procesaron simultáneamente hasta 96 muestras de ADN digerido con RE (ApeKI) durante la construcción de la biblioteca GBS, que se verificó en un Genome Analyzer II (Illumina, Inc.). En general, se mapearon 25.185 etiquetas bialélicas en el maíz, mientras que se mapearon 24.186 etiquetas de secuencia en la cebada. La validación del marcador GBS de la cebada utilizando una sola línea DH (OWB003) mostró un 99% de concordancia entre los marcadores de referencia y las lecturas GBS mapeadas. Aunque la cebada carece de una secuencia genómica completa, GBS no requiere un genoma de referencia para el mapeo de etiquetas de secuencia, la referencia se desarrolla durante el proceso de genotipado de muestreo. Las etiquetas también pueden ser tratadas como marcadores dominantes para el análisis genético alternativo en ausencia de un genoma de referencia. Además del skimming de GBS multiplex, la imputación de SNP faltantes tiene el potencial de reducir aún más los costos de GBS. GBS es un procedimiento versátil y rentable que permitirá extraer genomas de cualquier especie sin conocimiento previo de su estructura genómica. [1]