stringtranslate.com

Paquete de análisis breve de oligonucleótidos

SOAP (Short Oligonucleotide Analysis Package) es un conjunto de herramientas de software bioinformático del departamento de Bioinformática de BGI que permite el ensamblaje, la alineación y el análisis de datos de secuenciación de ADN de próxima generación . Es especialmente adecuado para datos de secuenciación de lectura corta .

Todos los programas del paquete SOAP pueden utilizarse gratuitamente y se distribuyen bajo la licencia de software de código abierto GPL .

Funcionalidad

El conjunto de herramientas SOAP se puede utilizar para realizar las siguientes tareas de ensamblaje del genoma:

Alineación de secuencias

SOAPaligner (SOAP2) está diseñado específicamente para la alineación rápida de lecturas cortas y funciona favorablemente con respecto a herramientas de alineación similares como Bowtie y MAQ. [1]

Ensamblaje del genoma

SOAPdenovo es un ensamblador de novo de lectura corta que utiliza la construcción de grafos de De Bruijn . Está optimizado para lecturas cortas como las generadas por Illumina y es capaz de ensamblar genomas grandes como el genoma humano. [2] SOAPdenovo se utilizó para ensamblar el genoma del panda gigante . [3] Esto se actualizó a SOAPdenovo2, que fue optimizado para genomas grandes e incluyó el módulo GapCloser ampliamente utilizado. [4]

Ensamblaje del transcriptoma

SOAPdenovo-Trans es un ensamblador de transcriptoma de novo diseñado específicamente para RNA-Seq que fue creado para el proyecto 1000 Plant Genomes . [5]

Descubrimiento de Indel

SOAPindel es una herramienta para encontrar inserciones y eliminaciones a partir de datos de secuenciación de extremos emparejados de próxima generación, proporcionando una lista de inserciones y eliminaciones candidatas con puntajes de calidad. [6]

Descubrimiento de SNP

SOAPsnp es un generador de secuencias de consenso. Esta herramienta utiliza el resultado de SOAPaligner para generar una secuencia de consenso que permite invocar SNP en un individuo recién secuenciado.

Descubrimiento de la variación estructural

SOAPsv es una herramienta para encontrar variaciones estructurales utilizando el ensamblaje del genoma completo. [7]

Control de calidad y preprocesamiento

SOAPnuke es una herramienta para el control de calidad integrado y el preprocesamiento de conjuntos de datos de experimentos genómicos, de ARN pequeño , de expresión genética digital y metagenómicos . [8]

Historia

SOAP versión 1

La primera versión de SOAP consistía únicamente en la herramienta de alineación de secuencias SOAPaligner . [9]

SOAP versión 2

SOAP v2 [1] amplió y mejoró SOAP v1 al mejorar significativamente el rendimiento de la herramienta SOAPaligner . El tiempo de alineación se redujo en un factor de 20 a 30, mientras que el uso de memoria se redujo en un factor de 3. Se agregó compatibilidad con formatos de archivos comprimidos.

La suite SOAP se amplió luego para incluir las nuevas herramientas: SOAPdenovo 1 y 2, SOAPindel, SOAPsnp y SOAPsv.

SOAP versión 3

SOAP v3 amplió la herramienta de alineación al ser la primera herramienta de alineación de lectura corta en utilizar procesadores GPU. [10] Como resultado de estas mejoras, SOAPalign superó significativamente a los alineadores de la competencia Bowtie y BWA en términos de velocidad.

Véase también

Enlaces externos

Referencias

  1. ^ ab Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). "SOAP2: una herramienta ultrarrápida mejorada para la alineación de lecturas cortas". Bioinformática . 25 (15): 1966–1967. doi :10.1093/bioinformatics/btp336. ISSN  1367-4803. PMID  19497933.
  2. ^ Li, R.; Zhu, H.; Ruan, J.; Qian, W.; Fang, X.; Shi, Z.; Li, Y.; Li, S.; Shan, G.; Kristiansen, K.; Li, S.; Yang, H.; Wang, J.; Wang, J. (2009). "Ensamblaje de novo de genomas humanos con secuenciación de lectura corta masivamente paralela". Genome Research . 20 (2): 265–272. doi :10.1101/gr.097261.109. ISSN  1088-9051. PMC 2813482 . PMID  20019144. 
  3. ^ Li, Ruiqiang; Fan, Wei; Tian, ​​Geng; Zhu, Hongmei; Él, Lin; Cai, Jing; Huang, Quanfei; Cai, Qingle; Li, Bo; Bai, Yinqi; Zhang, Zhihe; Zhang, Yaping; Wang, Wen; Li, junio; Wei, Fuwen; Li, Heng; Jian, Min; Li, Jianwen; Zhang, Zhaolei; Nielsen, Rasmus; Li, Dawei; Gu, Wanjun; Yang, Zhentao; Xuan, Zhaoling; Ryder, Oliver A.; Leung, Federico Chi-Ching; Zhou, Yan; Cao, Jianjun; Sol, Xiao; et al. (2009). "La secuencia y ensamblaje de novo del genoma del panda gigante". Naturaleza . 463 (7279): 311–317. Código Bib :2010Natur.463..311L. doi : 10.1038/naturaleza08696. Revista de  Biología Molecular y Genética  . 
  4. ^ Luo, Ruibang; Liu, Binghang; Xie, Yinlong; Li, Zhenyu; Huang, Weihua; Yuan, Jianying; Él, Guangzhu; Chen, Yanxiang; Pan, Qi; Liu, Yunjie; Tang, Jingbo (1 de diciembre de 2012). "SOAPdenovo2: un ensamblador de novo de lectura corta y memoria eficiente mejorado empíricamente". GigaCiencia . 1 (1): 18. doi : 10.1186/2047-217X-1-18 . PMC 3626529 . PMID  23587118. 
  5. ^ Xie, Yinlong; Wu, Gengxiong; Tang, Jingbo; Luo, Ruibang; Patterson, Jordania; Liu, Shanlin; Huang, Weihua; Él, Guangzhu; Gu, Shengchang; Li, Shengkang; Zhou, Xin (15 de junio de 2014). "SOAPdenovo-Trans: ensamblaje de transcriptoma de novo con lecturas cortas de RNA-Seq". Bioinformática . 30 (12): 1660–1666. arXiv : 1305.6760 . doi : 10.1093/bioinformática/btu077 . ISSN  1367-4803. PMID  24532719.
  6. ^ Li, Shengting; Li, Ruiqiang; Li, Heng; Lu, Jianliang; Li, Yingrui; Bolund, Lars; Schierup, Mikkel H.; Wang, Jun (1 de enero de 2013). "SOAPindel: Identificación eficiente de indels a partir de lecturas pareadas cortas". Genome Research . 23 (1): 195–200. doi : 10.1101/gr.132480.111 . ISSN  1088-9051. PMC 3530679 . PMID  22972939. 
  7. ^ Li, Yingrui; Zheng, Hancheng; Luo, Ruibang; Wu, Honglong; Zhu, Hongmei; Li, Ruiqiang; Cao, Hongzhi; Wu, boxeo; Huang, Shujia; Shao, Haojing; Ma, Hanzhou (agosto de 2011). "Variación estructural en dos genomas humanos mapeados con resolución de un solo nucleótido mediante ensamblaje de novo del genoma completo". Biotecnología de la Naturaleza . 29 (8): 723–730. doi : 10.1038/nbt.1904 . ISSN  1546-1696. PMID  21785424.
  8. ^ Chen, Yuxin; Chen, Yongsheng; Shi, Chunmei; Huang, Zhibo; Zhang, Yong; Li, Shengkang; Li, Yan; Sí, Jia; Yu, Chang; Li, Zhuo; Zhang, Xiuqing (1 de enero de 2018). "SOAPnuke: un software compatible con aceleración MapReduce para control de calidad integrado y preprocesamiento de datos de secuenciación de alto rendimiento". GigaCiencia . 7 (1): 1–6. doi : 10.1093/gigascience/gix120. PMC 5788068 . PMID  29220494. 
  9. ^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). "SOAP: programa de alineamiento de oligonucleótidos cortos". Bioinformática . 24 (5): 713–714. doi : 10.1093/bioinformatics/btn025 . ISSN  1367-4803. PMID  18227114.
  10. ^ Liu, C.-M.; Wong, T.; Wu, E.; Luo, R.; Yiu, S.-M.; Li, Y.; Wang, B.; Yu, C.; Chu, X.; Zhao, K.; Li, R.; Lam, T.-W. (2012). "SOAP3: herramienta de alineación paralela basada en GPU ultrarrápida para lecturas cortas". Bioinformática . 28 (6): 878–879. doi : 10.1093/bioinformatics/bts061 . ISSN  1367-4803. PMID  22285832.