GigaDB

Los grupos de datos, que incluyen datos genómicos, transcriptómicos e imágenes, son curados por biocuradores GigaDB, empleados por el Instituto de Genómica de Pekín (BGI) y el China National GeneBank.

[cita requerida] En sus inicios, GigaDB se diseñó como el archivo de respaldo para los datos de investigación a gran escala enviados a la revista de datos GigaScience, cuyo objetivo es garantizar la reproducibilidad y reutilización de la investigación biológica y biomédica.

Su alcance se ha ampliado para incluir objetos de investigación computacional, como datos sintéticos, software y flujos de trabajo.

[2] Los conjuntos de datos alojados se definen como un grupo de archivos y metadatos que respaldan un artículo o estudio específico.

A cada conjunto de datos publicado se le asigna un identificador de objeto digital, se indexan y se pueden detectar por medio del NCBI Datamed y el Clarivate Analytics DataCitation Index.