Lista de software de alineación de secuencias

Esta lista de software de alineación de secuencias es una compilación de herramientas de software y portales web que se utilizan en la alineación de secuencias por pares y la alineación de secuencias múltiples . Consulte el software de alineación estructural para la alineación estructural de proteínas.

Búsqueda en base de datos únicamente

* Tipo de secuencia: proteína o nucleótido

Alineación por pares

* Tipo de secuencia: proteína o nucleótido ** Tipo de alineación: local o global

Alineación de secuencias múltiples

* Tipo de secuencia: proteína o nucleótido. ** Tipo de alineamiento: local o global.

Análisis genómico

* Tipo de secuencia: proteína o nucleótido

Búsqueda de motivos

* Tipo de secuencia: proteína o nucleótido

Evaluación comparativa

Visores y editores de alineación

Consulte la lista de software de visualización de alineación .

Alineación de secuencias de lectura corta

Véase también

Lista de software de bioinformática de código abierto

Referencias

^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (octubre de 1990). "Herramienta básica de búsqueda de alineamiento local". Revista de biología molecular . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID 2231712. S2CID 14441902.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Repositorio de código HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
^ Angermüller, C.; Biegert, A.; Söding, J. (diciembre de 2012). "Modelado discriminativo de probabilidades de sustitución de aminoácidos específicas del contexto". Bioinformática . 28 (24): 3240–7. doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID 23080114.
^ Buchfink, Xie y Huson (2015). "Alineamiento rápido y sensible de proteínas usando DIAMOND". Nature Methods . 12 (1): 59–60. doi :10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.
^ B Buchfink, K Reuter y HG Drost (2021). "Alineamientos de proteínas sensibles a escala de árbol de la vida utilizando DIAMOND". Nature Methods . 18 (4): 366–368. doi : 10.1038/s41592-021-01101-x . PMC 8026399 . PMID 33828273.
^ Durbin, Richard; Eddy, Sean R.; Krogh, Anders ; Mitchison, Graeme, eds. (1998). Análisis de secuencias biológicas: modelos probabilísticos de proteínas y ácidos nucleicos . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3.^{[ página necesaria ]}
^ Söding J (abril de 2005). "Detección de homología de proteínas mediante comparación HMM-HMM". Bioinformática . 21 (7): 951–60. doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID 15531603.
^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (25 de diciembre de 2011). "HHblits: búsqueda iterativa ultrarrápida de secuencias de proteínas mediante alineamiento HMM-HMM". Nature Methods . 9 (2): 173–175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN 1548-7105. PMID 22198341. S2CID 205420247.
^ Hauswedell H, Singer J, Reinert K (1 de septiembre de 2014). "Lambda: el alineador local para datos biológicos masivos". Bioinformática . 30 (17): 349–355. doi :10.1093/bioinformatics/btu439. PMC 4147892 . PMID 25161219.
^ Steinegger, Martin; Soeding, Johannes (16 de octubre de 2017). "MMseqs2 permite la búsqueda sensible de secuencias de proteínas para el análisis de conjuntos de datos masivos". Nature Biotechnology . 35 (11): 1026–1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID 29035372. S2CID 402352.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (30 de junio de 2016). "OSWALD: OpenCL Smith–Waterman en el FPGA de Altera para bases de datos de proteínas de gran tamaño". Revista internacional de aplicaciones informáticas de alto rendimiento . 32 (3): 337–350. doi :10.1177/1094342016654215. hdl : 11336/48798 . ISSN 1094-3420. S2CID 212680914.
^ Altschul SF, Madden TL, Schäffer AA, et al. (septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda en bases de datos de proteínas". Nucleic Acids Research . 25 (17): 3389–402. doi :10.1093/nar/25.17.3389. PMC 146917 . PMID 9254694.
^ Li W, McWilliam H, Goujon M, et al. (junio de 2012). "PSI-Search: búsqueda iterativa de SSEARCH con perfil reducido por HOE". Bioinformática . 28 (12): 1650–1651. doi :10.1093/bioinformatics/bts240. PMC 3371869 . PMID 22539666.
^ Oehmen, C.; Nieplocha, J. (agosto de 2006). "ScalaBLAST: una implementación escalable de BLAST para análisis bioinformáticos intensivos en datos de alto rendimiento". IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740–749. doi :10.1109/TPDS.2006.112. S2CID 11122366.
^ Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: sistema de software de modelado y alineación de secuencias. Informe técnico UCSC-CRL-99-11 (Informe). Universidad de California, Santa Cruz, CA.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "An energy-aware performance analysis of SWIMM: Smith–Waterman implementation on Intel's Multicore and Manycore architectures". Concurrency and Computation: Practice and Experience. 27 (18): 5517–5537. doi:10.1002/cpe.3598. hdl:11336/53930. ISSN 1532-0634. S2CID 42945406.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "SWIMM 2.0: enhanced Smith-Waterman on Intel's Multicore and Manycore architectures based on AVX-512 vector extensions". International Journal of Parallel Programming. 47 (2): 296–317. doi:10.1007/s10766-018-0585-7. ISSN 1573-7640. S2CID 49670113.
^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Human-mouse alignments with BLASTZ". Genome Research. 13 (1): 103–107. doi:10.1101/gr.809403. PMC 430961. PMID 12529312.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Harris R S (2007). Improved pairwise alignment of genomic DNA (Thesis).
^ Sandes, Edans F. de O.; de Melo, Alba Cristina M.A. (May 2013). "Retrieving Smith-Waterman Alignments with Optimizations for Megabase Biological Sequences Using GPU". IEEE Transactions on Parallel and Distributed Systems. 24 (5): 1009–1021. doi:10.1109/TPDS.2012.194.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (May 2014). CUDAlign 3.0: Parallel Biological Sequence Comparison in Large GPU Clusters. Cluster, Cloud and Grid Computing (CCGrid), 2014 14th IEEE/ACM International Symposium on. p. 160. doi:10.1109/CCGrid.2014.18.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, A.C.M.A.; Martorell, X.; Ayguade, E. (August 2014). Fine-grain Parallel Megabase Sequence Comparison with Multiple Heterogeneous GPUs. Proceedings of the 19th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. pp. 383–384. doi:10.1145/2555243.2555280.
^ Chivian, D; Baker, D (2006). "Homology modeling using parametric alignment ensemble generation with consensus and energy-based model selection". Nucleic Acids Research. 34 (17): e112. doi:10.1093/nar/gkl480. PMC 1635247. PMID 16971460.
^ Girdea, M; Noe, L; Kucherov, G (January 2010). "Back-translation for discovering distant protein homologies in the presence of frameshift mutations". Algorithms for Molecular Biology. 5 (6): 6. doi:10.1186/1748-7188-5-6. PMC 2821327. PMID 20047662.
^ Ma, B.; Tromp, J.; Li, M. (2002). "PatternHunter: faster and more sensitive homology search". Bioinformatics. 18 (3): 440–445. doi:10.1093/bioinformatics/18.3.440. PMID 11934743.
^ Li, M.; Ma, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: highly sensitive and fast homology search". Journal of Bioinformatics and Computational Biology. 2 (3): 417–439. CiteSeerX 10.1.1.1.2393. doi:10.1142/S0219720004000661. PMID 15359419.
^ Gusfield, Dan (1997). Algorithms on strings, trees and sequences. Cambridge university press. ISBN 978-0-521-58519-4.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: Smith-Waterman implementation on FPGA with OpenCL for long DNA sequences". BMC Systems Biology. 12 (Suppl 5): 96. doi:10.1186/s12918-018-0614-6. PMC 6245597. PMID 30458766.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel. Accelerating Smith-Waterman Alignment of Long DNA Sequences with OpenCL on FPGA. 5th International Work-Conference on Bioinformatics and Biomedical Engineering. pp. 500–511. doi:10.1007/978-3-319-56154-7_45.
^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Efficient q-Gram Filters for Finding All epsilon-Matches over a Given Length". Journal of Computational Biology. 13 (2): 296–308. CiteSeerX 10.1.1.465.2084. doi:10.1089/cmb.2006.13.296. PMID 16597241.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Noe L, Kucherov G; Kucherov (2005). "YASS: mejorando la sensibilidad de la búsqueda de similitudes en el ADN". Nucleic Acids Research . 33 (suppl_2): W540–W543. doi :10.1093/nar/gki478. PMC 1160238 . PMID 15980530.
^ Pratas, Diogo; Silva, Jorge (2020). "Secuencias mínimas persistentes del SARS-CoV-2". Bioinformática . 36 (21): 5129–5132. doi : 10.1093/bioinformatics/btaa686 . PMC 7559010 . PMID 32730589.
^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). "Arioc: alineación de lectura de alto rendimiento con exploración acelerada por GPU del espacio de búsqueda de semillas y extensiones". PeerJ . 3 : e808. doi : 10.7717/peerj.808 . PMC 4358639 . PMID 25780763.
^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: una herramienta de alineación para la resecuenciación genómica a gran escala". PLOS ONE . 4 (11): e7767. Bibcode :2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639 . PMID 19907642.
^ Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). "BigBWA: acercando el alineador Burrows–Wheeler a las tecnologías Big Data". Bioinformática . 31 (24): 4003–5. doi : 10.1093/bioinformatics/btv506 . PMID 26323715.
^ Kent, WJ (2002). "BLAT---La herramienta de alineación similar a BLAST". Genome Research . 12 (4): 656–664. doi :10.1101/gr.229202. ISSN 1088-9051. PMC 187518 . PMID 11932250.
^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). "Alineamiento ultrarrápido y con memoria eficiente de secuencias cortas de ADN con el genoma humano". Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN 1465-6906. PMC 2690996 . PMID 19261174.
^ Li, H.; Durbin, R. (2009). "Alineación rápida y precisa de lecturas cortas con la transformada de Burrows–Wheeler". Bioinformática . 25 (14): 1754–1760. doi :10.1093/bioinformatics/btp324. ISSN 1367-4803. PMC 2705234 . PMID 19451168.
^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Mapeo probabilístico adaptable de lecturas cortas utilizando matrices de puntuación específicas de posición". BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN 1471-2105. PMC 4021105 . PMID 24717095.
^ Liu, Y.; Schmidt, B.; Maskell, DL (2012). "CUSHAW: un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler". Bioinformática . 28 (14): 1830–1837. doi : 10.1093/bioinformatics/bts276 . ISSN 1367-4803. PMID 22576173.
^ Liu, Y.; Schmidt, B. (2012). "Alineamiento de lecturas largas basado en semillas de coincidencia exacta máxima". Bioinformática . 28 (18): i318–i324. doi :10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841 . PMID 22962447.
^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: herramienta de búsqueda de secuencias cortas de alineamiento global". Bioinformática . 26 (20): 2534–2540. doi :10.1093/bioinformatics/btq485. PMC 2951093 . PMID 20739310.
^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "El mapeador GEM: alineamiento rápido, preciso y versátil por filtración". Nature Methods . 9 (12): 1185–1188. doi :10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.
^ Clement, NL; Snell, Q.; Clement, MJ; Hollenhorst, PC; Purwar, J.; Graves, BJ; Cairns, BR; Johnson, WE (2009). "El algoritmo GNUMAP: mapeo probabilístico imparcial de oligonucleótidos de secuenciación de próxima generación". Bioinformática . 26 (1): 38–45. doi :10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904 . PMID 19861355.
^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: High-Performance, Parallelized Sequence Alignment for Next-Generation Sequencing Data Analysis". PLOS ONE. 9 (6): 1754–1760. Bibcode:2014PLoSO...999033S. doi:10.1371/journal.pone.0099033. PMC 4053384. PMID 24918764.
^ Kielbasa, S.M.; Wan, R.; Sato, K.; Horton, P.; Frith, M.C. (2011). "Adaptive seeds tame genomic sequence comparison". Genome Research. 21 (3): 487–493. doi:10.1101/gr.113985.110. PMC 3044862. PMID 21209072.
^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). "Mpscan: Fast Localisation of Multiple Reads in Genomes". Algorithms in Bioinformatics. Lecture Notes in Computer Science. Vol. 5724. pp. 246–260. Bibcode:2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928. doi:10.1007/978-3-642-04241-6_21. ISBN 978-3-642-04240-9. S2CID 17187140.
^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: fast and accurate read mapping in highly polymorphic genomes". Bioinformatics. 29 (21): 2790–2791. doi:10.1093/bioinformatics/btt468. PMID 23975764.
^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: efficient mapping of short sequencing reads with periodic full sensitive spaced seeds". Bioinformatics. 25 (19): 2514–2521. doi:10.1093/bioinformatics/btp486. PMC 2752623. PMID 19675096.
^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Fast Mapping of Short Sequences with Mismatches, Insertions and Deletions Using Index Structures". PLOS Computational Biology. 5 (9): e1000502. Bibcode:2009PLSCB...5E0502H. doi:10.1371/journal.pcbi.1000502. ISSN 1553-7358. PMC 2730575. PMID 19750212.
^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Accurate Mapping of Short Color-space Reads". PLOS Computational Biology. 5 (5): e1000386. Bibcode:2009PLSCB...5E0386R. doi:10.1371/journal.pcbi.1000386. PMC 2678294. PMID 19461883.
^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: Sensitive yet Practical Short Read Mapping". Bioinformatics. 27 (7): 1011–1012. doi:10.1093/bioinformatics/btr046. PMID 21278192.
^ Malhis, Nawar; Butterfield, Yaron S. N.; Ester, Martin; Jones, Steven J. M. (2009). "Slider – Maximum use of probability information for alignment of short sequence reads and SNP detection". Bioinformatics. 25 (1): 6–13. doi:10.1093/bioinformatics/btn565. PMC 2638935. PMID 18974170.
^ Malhis, Nawar; Jones, Steven J. M. (2010). "High Quality SNP Calling Using Illumina Data at Shallow Coverage". Bioinformatics. 26 (8): 1029–1035. doi:10.1093/bioinformatics/btq092. PMID 20190250.
^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). "SOAP: short oligonucleotide alignment program". Bioinformatics. 24 (5): 713–714. doi:10.1093/bioinformatics/btn025. ISSN 1367-4803. PMID 18227114.
^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatics. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
^ Abuín, José M.; Pichel, Juan C.; Pena, Tomás F.; Amigo, Jorge (2016-05-16). "SparkBWA: Speeding Up the Alignment of High-Throughput DNA Sequencing Data". PLOS ONE. 11 (5): e0155461. Bibcode:2016PLoSO..1155461A. doi:10.1371/journal.pone.0155461. ISSN 1932-6203. PMC 4868289. PMID 27182962.
^ Lunter, G.; Goodson, M. (2010). "Stampy: Un algoritmo estadístico para el mapeo sensible y rápido de lecturas de secuencias de Illumina". Genome Research . 21 (6): 936–939. doi :10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326 . PMID 20980556.
^ Noe, L.; Girdea, M.; Kucherov, G. (2010). "Diseño de semillas espaciadas eficientes para el mapeo de lecturas SOLiD". Avances en bioinformática . 2010 : 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID 20936175 .
^ Lin, H.; Zhang, Z.; Zhang, MQ; Ma, B.; Li, M. (2008). "¡ZOOM! Millones de oligos mapeados". Bioinformática . 24 (21): 2431–2437. doi :10.1093/bioinformatics/btn416. PMC 2732274 . PMID 18684737.