Lista de software de alineación de secuencias

Esta lista de software de alineación de secuencias es una compilación de herramientas de software y portales web que se utilizan en la alineación de secuencias por pares y la alineación de secuencias múltiples . Consulte el software de alineación estructural para la alineación estructural de proteínas.

Búsqueda en base de datos únicamente

* Tipo de secuencia: proteína o nucleótido

Alineación por pares

* Tipo de secuencia: proteína o nucleótido ** Tipo de alineación: local o global

Alineación de secuencias múltiples

* Tipo de secuencia: proteína o nucleótido. ** Tipo de alineamiento: local o global.

Análisis genómico

* Tipo de secuencia: proteína o nucleótido

Búsqueda de motivos

* Tipo de secuencia: proteína o nucleótido

Evaluación comparativa

Visores y editores de alineación

Consulte la lista de software de visualización de alineación .

Alineación de secuencias de lectura corta

Véase también

Lista de software de bioinformática de código abierto

Referencias

^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (octubre de 1990). "Herramienta básica de búsqueda de alineamiento local". Revista de biología molecular . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID 2231712. S2CID 14441902.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Repositorio de código HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
^ Angermüller, C.; Biegert, A.; Söding, J. (diciembre de 2012). "Modelado discriminativo de probabilidades de sustitución de aminoácidos específicas del contexto". Bioinformática . 28 (24): 3240–7. doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID 23080114.
^ Buchfink, Xie y Huson (2015). "Alineamiento de proteínas rápido y sensible usando DIAMOND". Nature Methods . 12 (1): 59–60. doi :10.1038/nmeth.3176. PMID 25402007. S2CID 5346781.
^ B Buchfink, K Reuter y HG Drost (2021). "Alineamientos de proteínas sensibles a escala de árbol de la vida utilizando DIAMOND". Nature Methods . 18 (4): 366–368. doi : 10.1038/s41592-021-01101-x . PMC 8026399 . PMID 33828273.
^ Durbin, Richard; Eddy, Sean R.; Krogh, Anders ; Mitchison, Graeme, eds. (1998). Análisis de secuencias biológicas: modelos probabilísticos de proteínas y ácidos nucleicos . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3.^{[ página necesaria ]}
^ Söding J (abril de 2005). "Detección de homología de proteínas mediante comparación HMM-HMM". Bioinformática . 21 (7): 951–60. doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID 15531603.
^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (25 de diciembre de 2011). "HHblits: búsqueda iterativa ultrarrápida de secuencias de proteínas mediante alineamiento HMM-HMM". Nature Methods . 9 (2): 173–175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN 1548-7105. PMID 22198341. S2CID 205420247.
^ Hauswedell H, Singer J, Reinert K (1 de septiembre de 2014). "Lambda: el alineador local para datos biológicos masivos". Bioinformática . 30 (17): 349–355. doi :10.1093/bioinformatics/btu439. PMC 4147892 . PMID 25161219.
^ Steinegger, Martin; Soeding, Johannes (16 de octubre de 2017). "MMseqs2 permite la búsqueda sensible de secuencias de proteínas para el análisis de conjuntos de datos masivos". Nature Biotechnology . 35 (11): 1026–1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID 29035372. S2CID 402352.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (30 de junio de 2016). "OSWALD: OpenCL Smith–Waterman en el FPGA de Altera para bases de datos de proteínas de gran tamaño". Revista internacional de aplicaciones informáticas de alto rendimiento . 32 (3): 337–350. doi :10.1177/1094342016654215. hdl : 11336/48798 . ISSN 1094-3420. S2CID 212680914.
^ Altschul SF, Madden TL, Schäffer AA, et al. (septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda en bases de datos de proteínas". Nucleic Acids Research . 25 (17): 3389–402. doi :10.1093/nar/25.17.3389. PMC 146917 . PMID 9254694.
^ Li W, McWilliam H, Goujon M, et al. (junio de 2012). "PSI-Search: búsqueda iterativa de SSEARCH con perfil reducido por HOE". Bioinformática . 28 (12): 1650–1651. doi :10.1093/bioinformatics/bts240. PMC 3371869 . PMID 22539666.
^ Oehmen, C.; Nieplocha, J. (agosto de 2006). "ScalaBLAST: una implementación escalable de BLAST para análisis bioinformáticos intensivos en datos de alto rendimiento". IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740–749. doi :10.1109/TPDS.2006.112. S2CID 11122366.
^ Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: sistema de software de modelado y alineación de secuencias. Informe técnico UCSC-CRL-99-11 (Informe). Universidad de California, Santa Cruz, CA.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (2015-12-25). "An energy-aware performance analysis of SWIMM: Smith–Waterman implementation on Intel's Multicore and Manycore architectures". Concurrencia y computación: práctica y experiencia . 27 (18): 5517–5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN 1532-0634. S2CID 42945406.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25-12-2015). "SWIMM 2.0: Smith-Waterman mejorado en las arquitecturas Multicore y Manycore de Intel basadas en extensiones vectoriales AVX-512". Revista Internacional de Programación Paralela . 47 (2): 296–317. doi :10.1007/s10766-018-0585-7. ISSN 1573-7640. S2CID 49670113.
^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Alineaciones humano-ratón con BLASTZ". Genome Research . 13 (1): 103–107. doi :10.1101/gr.809403. PMC 430961 . PMID 12529312. {{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Harris RS (2007). Alineamiento mejorado por pares de ADN genómico (Tesis).
^ Sandes, Edans F. de O.; de Melo, Alba Cristina MA (mayo de 2013). "Recuperación de alineaciones de Smith-Waterman con optimizaciones para secuencias biológicas de megabases utilizando GPU". IEEE Transactions on Parallel and Distributed Systems . 24 (5): 1009–1021. doi :10.1109/TPDS.2012.194.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (mayo de 2014). CUDAlign 3.0: Comparación paralela de secuencias biológicas en grandes clústeres de GPU . Computación en clúster, nube y cuadrícula (CCGrid), 14.º Simposio internacional IEEE/ACM de 2014 sobre. pág. 160. doi :10.1109/CCGrid.2014.18.
^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (agosto de 2014). Comparación de secuencias de megabases paralelas de grano fino con múltiples GPU heterogéneas . Actas del 19.º Simposio ACM SIGPLAN sobre principios y práctica de la programación paralela. págs. 383–384. doi :10.1145/2555243.2555280.
^ Chivian, D; Baker, D (2006). "Modelado de homología mediante generación de conjuntos de alineamiento paramétrico con consenso y selección de modelos basada en energía". Investigación de ácidos nucleicos . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247 . PMID 16971460.
^ Girdea, M; Noe, L; Kucherov, G (enero de 2010). "Traducción inversa para descubrir homologías de proteínas distantes en presencia de mutaciones por desplazamiento del marco de lectura". Algorithms for Molecular Biology . 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327 . PMID 20047662.
^ Ma, B.; Tromp, J.; Li, M. (2002). "PatternHunter: búsqueda de homología más rápida y sensible". Bioinformática . 18 (3): 440–445. doi : 10.1093/bioinformatics/18.3.440 . PMID 11934743.
^ Li, M.; Ma, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: búsqueda de homología altamente sensible y rápida". Revista de bioinformática y biología computacional . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID 15359419.
^ Gusfield, Dan (1997). Algoritmos sobre cadenas, árboles y secuencias . Cambridge University Press. ISBN 978-0-521-58519-4.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: implementación de Smith-Waterman en FPGA con OpenCL para secuencias largas de ADN". BMC Systems Biology . 12 (Suppl 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597 . PMID 30458766.
^ Rucci, Enzo; Garcia, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti,Armando; Prieto-Matias, Manuel. Aceleración de la alineación Smith-Waterman de secuencias largas de ADN con OpenCL en FPGA . 5.ª Conferencia Internacional de Trabajo sobre Bioinformática e Ingeniería Biomédica. págs. 500–511. doi :10.1007/978-3-319-56154-7_45.
^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Filtros q-gramas eficientes para encontrar todas las coincidencias de épsilon en una longitud dada". Revista de biología computacional . 13 (2): 296–308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID 16597241. {{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Noe L, Kucherov G; Kucherov (2005). "YASS: mejorando la sensibilidad de la búsqueda de similitudes en el ADN". Nucleic Acids Research . 33 (suppl_2): W540–W543. doi :10.1093/nar/gki478. PMC 1160238 . PMID 15980530.
^ Pratas, Diogo; Silva, Jorge (2020). "Secuencias mínimas persistentes de SARS-CoV-2". Bioinformática . 36 (21): 5129–5132. doi : 10.1093/bioinformática/btaa686 . PMC 7559010 . PMID 32730589.
^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). "Arioc: alineación de lectura de alto rendimiento con exploración acelerada por GPU del espacio de búsqueda de semillas y extensiones". PeerJ . 3 : e808. doi : 10.7717/peerj.808 . PMC 4358639 . PMID 25780763.
^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: una herramienta de alineación para la resecuenciación genómica a gran escala". PLOS ONE . 4 (11): e7767. Bibcode :2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639 . PMID 19907642.
^ Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). "BigBWA: acercando el alineador Burrows–Wheeler a las tecnologías Big Data". Bioinformática . 31 (24): 4003–5. doi : 10.1093/bioinformatics/btv506 . PMID 26323715.
^ Kent, WJ (2002). "BLAT---La herramienta de alineación similar a BLAST". Genome Research . 12 (4): 656–664. doi :10.1101/gr.229202. ISSN 1088-9051. PMC 187518 . PMID 11932250.
^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). "Alineamiento ultrarrápido y con memoria eficiente de secuencias cortas de ADN con el genoma humano". Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN 1465-6906. PMC 2690996 . PMID 19261174.
^ Li, H.; Durbin, R. (2009). "Alineación rápida y precisa de lecturas cortas con la transformada de Burrows–Wheeler". Bioinformática . 25 (14): 1754–1760. doi :10.1093/bioinformatics/btp324. ISSN 1367-4803. PMC 2705234 . PMID 19451168.
^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Mapeo probabilístico adaptable de lecturas cortas utilizando matrices de puntuación específicas de posición". BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN 1471-2105. PMC 4021105 . PMID 24717095.
^ Liu, Y.; Schmidt, B.; Maskell, DL (2012). "CUSHAW: un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler". Bioinformática . 28 (14): 1830–1837. doi : 10.1093/bioinformatics/bts276 . ISSN 1367-4803. PMID 22576173.
^ Liu, Y.; Schmidt, B. (2012). "Alineamiento de lecturas largas basado en semillas de coincidencia exacta máxima". Bioinformática . 28 (18): i318–i324. doi :10.1093/bioinformatics/bts414. ISSN 1367-4803. PMC 3436841 . PMID 22962447.
^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: herramienta de búsqueda de secuencias cortas de alineamiento global". Bioinformática . 26 (20): 2534–2540. doi :10.1093/bioinformatics/btq485. PMC 2951093 . PMID 20739310.
^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "El mapeador GEM: alineamiento rápido, preciso y versátil por filtración". Nature Methods . 9 (12): 1185–1188. doi :10.1038/nmeth.2221. ISSN 1548-7091. PMID 23103880. S2CID 2004416.
^ Clement, NL; Snell, Q.; Clement, MJ; Hollenhorst, PC; Purwar, J.; Graves, BJ; Cairns, BR; Johnson, WE (2009). "El algoritmo GNUMAP: mapeo probabilístico imparcial de oligonucleótidos de secuenciación de próxima generación". Bioinformática . 26 (1): 38–45. doi :10.1093/bioinformatics/btp614. ISSN 1367-4803. PMC 6276904 . PMID 19861355.
^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: Alineación de secuencias paralelizadas de alto rendimiento para el análisis de datos de secuenciación de próxima generación". PLOS ONE . 9 (6): 1754–1760. Bibcode :2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384 . PMID 24918764.
^ Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). "Las semillas adaptativas controlan la comparación de secuencias genómicas". Genome Research . 21 (3): 487–493. doi :10.1101/gr.113985.110. PMC 3044862 . PMID 21209072.
^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). "Mpscan: localización rápida de lecturas múltiples en genomas". Algoritmos en bioinformática . Apuntes de clase en informática. Vol. 5724. págs. 246–260. Código Bibliográfico :2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN . 978-3-642-04240-9. Número de identificación del sujeto 17187140.
^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: mapeo rápido y preciso de lecturas en genomas altamente polimórficos". Bioinformática . 29 (21): 2790–2791. doi : 10.1093/bioinformatics/btt468 . PMID 23975764.
^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: mapeo eficiente de lecturas de secuenciación cortas con semillas espaciadas sensibles y periódicas". Bioinformática . 25 (19): 2514–2521. doi :10.1093/bioinformatics/btp486. PMC 2752623 . PMID 19675096.
^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Mapeo rápido de secuencias cortas con desajustes, inserciones y deleciones utilizando estructuras de índice". PLOS Computational Biology . 5 (9): e1000502. Bibcode :2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN 1553-7358. PMC 2730575 . PMID 19750212.
^ Rumble, Stephen M.; Lacroute, Phil; Dalca, Adrian V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Mapeo preciso de lecturas cortas del espacio de color". PLOS Computational Biology . 5 (5): e1000386. Bibcode :2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294 . PMID 19461883.
^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: Mapeo de lecturas cortas sensible pero práctico". Bioinformática . 27 (7): 1011–1012. doi : 10.1093/bioinformatics/btr046 . PMID 21278192.
^ Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). "Slider – Uso máximo de información de probabilidad para la alineación de lecturas de secuencias cortas y detección de SNP". Bioinformática . 25 (1): 6–13. doi :10.1093/bioinformatics/btn565. PMC 2638935 . PMID 18974170.
^ Malhis, Nawar; Jones, Steven JM (2010). "Denominación de SNP de alta calidad utilizando datos de Illumina con cobertura superficial". Bioinformática . 26 (8): 1029–1035. doi :10.1093/bioinformatics/btq092. PMID 20190250.
^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). "SOAP: programa de alineamiento de oligonucleótidos cortos". Bioinformática . 24 (5): 713–714. doi : 10.1093/bioinformatics/btn025 . ISSN 1367-4803. PMID 18227114.
^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). "SOAP2: una herramienta ultrarrápida mejorada para la alineación de lecturas cortas". Bioinformática . 25 (15): 1966–1967. doi :10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
^ Abuín, José M.; Pichel, Juan C.; Peña, Tomás F.; Amigo, Jorge (16 de mayo de 2016). "SparkBWA: acelerar la alineación de datos de secuenciación de ADN de alto rendimiento". MÁS UNO . 11 (5): e0155461. Código Bib : 2016PLoSO..1155461A. doi : 10.1371/journal.pone.0155461 . ISSN 1932-6203. PMC 4868289 . PMID 27182962.
^ Lunter, G.; Goodson, M. (2010). "Stampy: Un algoritmo estadístico para el mapeo sensible y rápido de lecturas de secuencias de Illumina". Genome Research . 21 (6): 936–939. doi :10.1101/gr.111120.110. ISSN 1088-9051. PMC 3106326 . PMID 20980556.
^ Noe, L.; Girdea, M.; Kucherov, G. (2010). "Diseño de semillas espaciadas eficientes para el mapeo de lecturas SOLiD". Avances en bioinformática . 2010 : 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID 20936175 .
^ Lin, H.; Zhang, Z.; Zhang, MQ; Ma, B.; Li, M. (2008). "¡ZOOM! Millones de oligos mapeados". Bioinformática . 24 (21): 2431–2437. doi :10.1093/bioinformatics/btn416. PMC 2732274 . PMID 18684737.