Esta unidad de medida supone una mejor estimación del aspecto real del genoma, incluyendo los huecos redundantes y siendo un mapa más extenso que el típico ensamblado.[7] Si existen huecos entre cóntigos, estos pueden ser completados creando scaffolds (en inglés, andamios), mediante una amplificación de los cóntigos por PCR y posterior secuenciación o mediante clonación de cromosomas artificiales bacterianos (BAC).[8][7] Sin embargo, esto no siempre es posible, existiendo múltiples scaffolds en un genoma de referencia.Se invitó a los primeros diez hombres y mujeres voluntarios a una reunión con los consejeros genéticos del proyecto para la posterior extracción de sangre.[17][18][19][20][21] En 1999, se logró secuenciar y ensamblar la secuencia del cromosoma 22[22] y en 2001, se publicaron los resultados iniciales del primer ensamblado de referencia para el genoma humano.[28][29] Esta solo contiene 349 huecos en todo el genoma, lo que supuso un avance importante respecto al primer ensamblaje de referencia, el cual tenía aproximadamente 150 000 huecos.Sin embargo, el individuo RP11 sigue suponiendo el 70% del genoma de referencia.[1] Según el sitio web oficial del GRC, el lanzamiento de la siguiente versión del genoma de referencia humano (versión GRCh39) se encuentra actualmente "pospuesto indefinidamente".[36][37][38] En 2022, el Consorcio T2T publicó el primer ensamblaje del genoma humano secuenciado al completo (versión T2T-CHM13), sin huecos en el ensamblado de las secuencias e incluyendo el cromosoma Y completo en su versión 2.0.[49][50][36] Estas células se caracterizan por tener dos copias del mismo genoma parental materno, lo cual provoca que sea esencialmente haploide, con un cariotipo de 46 cromosomas autosómicos y dos cromosomas X.[36] Esto elimina la variación alélica y mejora la precisión de la secuenciación.[41]El hecho de que la línea celular CHM13hTERT no contenga un cromosoma Y supuso que este no estaba incluido en las primeras versiones de genoma publicados por el consorcio T2T.[35][51]Para solucionar esto, los investigadores optaron por secuenciar el cromosoma Y de otra línea celular, la HG002 (también denominada NA24385), con los mismos métodos y sumar todos los resultados en un único ensamblaje de referencia del genoma humano.[53] Algunos ejemplos son los genes FRG1, relacionado con la distrofia muscular facioescapulohumeral[54]y BOLBA2B, con el autismo;[55]o el locus HLA (también llamado MHC), el cual está relacionado con un amplio espectro de enfermedades, desde inmunitarias[56] hasta neuropsiquiátricas.El cromosoma X femenino se encuentra en distintos estados de hipometilación o hipermetilación.Dicha información es relevante ya que se puede estudiar enfermedades relacionadas con la desregularización de los satélites.[68][69][70][71] El Proyecto del Pangenoma Humano, el cual entró en su fase inicial en 2019 con la creación del Consorcio de Referencia del Pangenoma Humano, busca crear el mayor mapa de la variabilidad genética humana, tomando como punto de partida los resultados ya obtenidos en proyectos anteriores.: pez cebra (Danio rerio), pollo (Gallus gallus), Escherichia coli etc.) como otros organismos de interés para la comunidad científica, por ejemplo, especies en peligro de extinción (ej.
Diagrama de la disposición de las lecturas, que forman cóntigos, y estos a su vez pueden ensamblarse en
scaffolds
en el proceso completo de secuenciación y ensamblado de un genoma de referencia. En esta imagen, se indica secuenciado el hueco entre los cóntigos 1 y 2, conformando un
scaffold
, mientras que el otro hueco no se ha secuenciado y separa los
scaffolds
1 y 2.
Evolución en el tiempo del coste aproximado de la secuenciación de un genoma humano (Periodo 2001 - 2021)
Ideograma de los cromosomas del genoma de referencia humano (versión GRCh38/hg38). Los patrones característicos de bandas se muestran de color negro, gris y blanco, mientras que los huecos y regiones parcialmente ensambladas se encuentran en color azul y rosa, respectivamente. Referencia: Genome Data Viewer de la base de datos NCBI
[
26
]
Ideograma de picos de marcas de
histonas
identificadas en T2T-CHM13. Se muestra solo una selección de loci relevantes en enfermedades, en los cromosomas 5, 6, 15, 16, 17 y 19. Modificado de Gershman et al, 2022
[
53
]
Realizado mediante Biorender.