stringtranslate.com

Lista de software de alineación de secuencias

Esta lista de software de alineación de secuencias es una recopilación de herramientas de software y portales web utilizados en la alineación de secuencias por pares y la alineación de secuencias múltiples . Consulte el software de alineación estructural para conocer la alineación estructural de proteínas.

Sólo búsqueda en base de datos

* Tipo de secuencia: proteína o nucleótido

Alineación por pares

* Tipo de secuencia: proteína o nucleótido ** Tipo de alineación: local o global

Alineación de secuencias múltiples

* Tipo de secuencia: proteína o nucleótido. ** Tipo de alineación: local o global

Análisis genómico

* Tipo de secuencia: proteína o nucleótido


Búsqueda de motivos

* Tipo de secuencia: proteína o nucleótido


Evaluación comparativa

Visores de alineación, editores

Consulte la Lista de software de visualización de alineación .

Alineación de secuencia de lectura corta

Ver también

Referencias

  1. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Molinero; Myers; Lipman (octubre de 1990). "Herramienta básica de búsqueda de alineación local". Revista de biología molecular . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.{{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  2. ^ Repositorio de código HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
  3. ^ Angermüller, C.; Biegert, A.; Söding, J. (diciembre de 2012). "Modelado discriminativo de probabilidades de sustitución de aminoácidos específicas del contexto". Bioinformática . 28 (24): 3240–7. doi : 10.1093/bioinformática/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID  23080114.
  4. ^ Buchfink, Xie y Huson (2015). "Alineación de proteínas rápida y sensible con DIAMOND". Métodos de la naturaleza . 12 (1): 59–60. doi :10.1038/nmeth.3176. PMID  25402007. S2CID  5346781.
  5. ^ B Buchfink, K Reuter y HG Drost (2021). "Alineaciones de proteínas sensibles a escala del árbol de la vida utilizando DIAMOND". Métodos de la naturaleza . 18 (4): 366–368. doi : 10.1038/s41592-021-01101-x . PMC 8026399 . PMID  33828273. 
  6. ^ Durbin, Richard; Eddy, Sean R.; Krogh, Anders ; Mitchison, Graeme, eds. (1998). Análisis de secuencias biológicas: modelos probabilísticos de proteínas y ácidos nucleicos . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3.[ página necesaria ]
  7. ^ Söding J (abril de 2005). "Detección de homología de proteínas mediante comparación HMM-HMM". Bioinformática . 21 (7): 951–60. doi : 10.1093/bioinformática/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID  15531603.
  8. ^ Remmert, Michael; Biegert, Andreas; Hauser, Andrés; Söding, Johannes (25 de diciembre de 2011). "HHblits: búsqueda iterativa de secuencias de proteínas ultrarrápida mediante alineación HMM-HMM". Métodos de la naturaleza . 9 (2): 173-175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN  1548-7105. PMID  22198341. S2CID  205420247.
  9. ^ Hauswedell H, Singer J, Reinert K (1 de septiembre de 2014). "Lambda: el alineador local para datos biológicos masivos". Bioinformática . 30 (17): 349–355. doi : 10.1093/bioinformática/btu439. PMC 4147892 . PMID  25161219. 
  10. ^ Steinegger, Martín; Soeding, Johannes (16 de octubre de 2017). "MMseqs2 permite la búsqueda de secuencias de proteínas sensibles para el análisis de conjuntos de datos masivos". Biotecnología de la Naturaleza . 35 (11): 1026–1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID  29035372. S2CID  402352.
  11. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matías, Manuel (30 de junio de 2016). "OSWALD: OpenCL Smith – Waterman en la FPGA de Altera para grandes bases de datos de proteínas". Revista internacional de aplicaciones informáticas de alto rendimiento . 32 (3): 337–350. doi :10.1177/1094342016654215. ISSN  1094-3420. S2CID  212680914.
  12. ^ Altschul SF, Madden TL, Schäffer AA y col. (Septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda de bases de datos de proteínas". Investigación de ácidos nucleicos . 25 (17): 3389–402. doi : 10.1093/nar/25.17.3389. PMC 146917 . PMID  9254694. 
  13. ^ Li W, McWilliam H, Goujon M y col. (Junio ​​2012). "PSI-Search: búsqueda SSEARCH iterativa de perfil reducido HOE". Bioinformática . 28 (12): 1650-1651. doi : 10.1093/bioinformática/bts240. PMC 3371869 . PMID  22539666. 
  14. ^ Ohmen, C.; Nieplocha, J. (agosto de 2006). "ScalaBLAST: una implementación escalable de BLAST para análisis bioinformático con uso intensivo de datos de alto rendimiento". Transacciones IEEE en sistemas paralelos y distribuidos . 17 (8): 740–749. doi :10.1109/TPDS.2006.112. S2CID  11122366.
  15. ^ Hughey, R.; Karplus, K.; Krogh, A. (2003). SAM: sistema de software de modelado y alineación de secuencias. Informe técnico UCSC-CRL-99-11 (Reporte). Universidad de California, Santa Cruz, CA.
  16. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25-12-2015). "Un análisis de rendimiento consciente de la energía de SWIMM: implementación de Smith-Waterman en las arquitecturas Multicore y Manycore de Intel". Concurrencia y Computación: Práctica y Experiencia . 27 (18): 5517–5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN  1532-0634. S2CID  42945406.
  17. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25-12-2015). "SWIMM 2.0: Smith-Waterman mejorado en las arquitecturas Multicore y Manycore de Intel basadas en extensiones vectoriales AVX-512". Revista Internacional de Programación Paralela . 47 (2): 296–317. doi :10.1007/s10766-018-0585-7. ISSN  1573-7640. S2CID  49670113.
  18. ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; herir; Zhang; Bärtsch; Hardison; Haussler; Molinero (2003). "Alineaciones humano-ratón con BLASTZ". Investigación del genoma . 13 (1): 103–107. doi :10.1101/gr.809403. PMC 430961 . PMID  12529312. {{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  19. ^ Harris RS (2007). Alineamiento por pares mejorado del ADN genómico (Tesis).
  20. ^ Sandes, Edans F. de O.; de Melo, Alba Cristina MA (mayo de 2013). "Recuperación de alineaciones de Smith-Waterman con optimizaciones para secuencias biológicas de megabase utilizando GPU". Transacciones IEEE en sistemas paralelos y distribuidos . 24 (5): 1009-1021. doi :10.1109/TPDS.2012.194.
  21. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (mayo de 2014). CUDAlign 3.0: Comparación de secuencias biológicas paralelas en grandes grupos de GPU . Cluster, Cloud and Grid Computing (CCGrid), 2014 14º Simposio Internacional IEEE/ACM sobre. pag. 160. doi : 10.1109/CCGrid.2014.18.
  22. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (agosto de 2014). Comparación de secuencias de megabase paralelas de grano fino con múltiples GPU heterogéneas . Actas del 19º Simposio ACM SIGPLAN sobre principios y práctica de la programación paralela. págs. 383–384. doi :10.1145/2555243.2555280.
  23. ^ Chivián, D; Panadero, D (2006). "Modelado de homología mediante generación de conjuntos de alineación paramétrica con consenso y selección de modelos basados ​​en energía". Investigación de ácidos nucleicos . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247 . PMID  16971460. 
  24. ^ Girdea, M; Noé, L; Kucherov, G (enero de 2010). "Retraducción para descubrir homologías de proteínas distantes en presencia de mutaciones de cambio de marco". Algoritmos para Biología Molecular . 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327 . PMID  20047662. 
  25. ^ Mamá, B.; Tromp, J.; Li, M. (2002). "PatternHunter: búsqueda de homologías más rápida y sensible". Bioinformática . 18 (3): 440–445. doi : 10.1093/bioinformática/18.3.440 . PMID  11934743.
  26. ^ Li, M.; Mamá, B.; Kisman, D.; Tromp, J. (2004). "Patternhunter II: búsqueda de homología rápida y altamente sensible". Revista de Bioinformática y Biología Computacional . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID  15359419. 
  27. ^ Gusfield, Dan (1997). Algoritmos sobre cadenas, árboles y secuencias . Prensa de la Universidad de Cambridge. ISBN 978-0-521-58519-4.
  28. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matías, Manuel (2018). "SWIFOLD: implementación de Smith-Waterman en FPGA con OpenCL para secuencias de ADN largas". Biología de sistemas BMC . 12 (Suplemento 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597 . PMID  30458766. 
  29. ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matías, Manuel. "Aceleración de la alineación Smith-Waterman de secuencias largas de ADN con OpenCL en FPGA" . V Congreso Internacional de Trabajo en Bioinformática e Ingeniería Biomédica. págs. 500–511. doi :10.1007/978-3-319-56154-7_45.
  30. ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Filtros q-Gram eficientes para encontrar todas las coincidencias épsilon en una longitud determinada". Revista de biología computacional . 13 (2): 296–308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID  16597241. {{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  31. ^ Noé L, Kucherov G; Kucherov (2005). "YASS: mejora de la sensibilidad de la búsqueda de similitudes de ADN". Investigación de ácidos nucleicos . 33 (suplemento_2): W540–W543. doi : 10.1093/nar/gki478. PMC 1160238 . PMID  15980530. 
  32. ^ Pratas, Diogo; Silva, Jorge (2020). "Secuencias mínimas persistentes de SARS-CoV-2". Bioinformática . 36 (21): 5129–5132. doi : 10.1093/bioinformática/btaa686 . PMC 7559010 . PMID  32730589. 
  33. ^ Wilton, Ricardo; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J.; Salzberg, Steven L.; Szalay, Alexander S. (2015). "Arioc: alineación de lectura de alto rendimiento con exploración acelerada por GPU del espacio de búsqueda de semilla y extensión". PeerJ . 3 : e808. doi : 10.7717/peerj.808 . PMC 4358639 . PMID  25780763. 
  34. ^ Homero, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: una herramienta de alineación para la resecuenciación del genoma a gran escala". MÁS UNO . 4 (11): e7767. Código Bib : 2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639 . PMID  19907642. 
  35. ^ Abuín, JM; Pichel, JC; Peña, TF; Amigo, J. (2015). "BigBWA: acercando el alineador Burrows-Wheeler a las tecnologías Big Data". Bioinformática . 31 (24): 4003–5. doi : 10.1093/bioinformática/btv506 . PMID  26323715.
  36. ^ Kent, WJ (2002). "BLAT --- La herramienta de alineación tipo BLAST". Investigación del genoma . 12 (4): 656–664. doi :10.1101/gr.229202. ISSN  1088-9051. PMC 187518 . PMID  11932250. 
  37. ^ Langmead, Ben; Trapnell, Cole; Papá, Mihai; Salzberg, Steven L. (2009). "Alineamiento ultrarrápido y con memoria eficiente de secuencias cortas de ADN con el genoma humano". Biología del genoma . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN  1465-6906. PMC 2690996 . PMID  19261174. 
  38. ^ Li, H.; Durbin, R. (2009). "Alineación de lectura breve rápida y precisa con la transformada de Burrows-Wheeler". Bioinformática . 25 (14): 1754-1760. doi : 10.1093/bioinformática/btp324. ISSN  1367-4803. PMC 2705234 . PMID  19451168. 
  39. ^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Mapeo probabilístico adaptable de lecturas cortas utilizando matrices de puntuación específicas de posición". Bioinformática BMC . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN  1471-2105. PMC 4021105 . PMID  24717095. 
  40. ^ Liu, Y.; Schmidt, B.; Máscara, DL (2012). "CUSHAW: un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler". Bioinformática . 28 (14): 1830–1837. doi : 10.1093/bioinformática/bts276 . ISSN  1367-4803. PMID  22576173.
  41. ^ Liu, Y.; Schmidt, B. (2012). "Alineación de lectura larga basada en semillas de coincidencia exacta máxima". Bioinformática . 28 (18): i318-i324. doi : 10.1093/bioinformática/bts414. ISSN  1367-4803. PMC 3436841 . PMID  22962447. 
  42. ^ Rizk, Guillaume; Lavanier, Dominique (2010). "GASSST: herramienta de búsqueda de secuencia corta de alineación global". Bioinformática . 26 (20): 2534–2540. doi : 10.1093/bioinformática/btq485. PMC 2951093 . PMID  20739310. 
  43. ^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "El mapeador GEM: alineación por filtración rápida, precisa y versátil". Métodos de la naturaleza . 9 (12): 1185-1188. doi :10.1038/nmeth.2221. ISSN  1548-7091. PMID  23103880. S2CID  2004416.
  44. ^ Clemente, NL; Snell, Q.; Clemente, MJ; Hollenhorst, PC; Purwar, J.; Tumbas, BJ; Cairns, BR; Johnson, NOSOTROS (2009). "El algoritmo GNUMAP: mapeo probabilístico imparcial de oligonucleótidos de secuenciación de próxima generación". Bioinformática . 26 (1): 38–45. doi : 10.1093/bioinformática/btp614. ISSN  1367-4803. PMC 6276904 . PMID  19861355. 
  45. ^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: alineación de secuencias paralelas de alto rendimiento para análisis de datos de secuenciación de próxima generación". MÁS UNO . 9 (6): 1754-1760. Código Bib : 2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384 . PMID  24918764. 
  46. ^ Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). "Las semillas adaptativas dominan la comparación de secuencias genómicas". Investigación del genoma . 21 (3): 487–493. doi :10.1101/gr.113985.110. PMC 3044862 . PMID  21209072. 
  47. ^ Rivales, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). "Mpscan: localización rápida de múltiples lecturas en genomas". Algoritmos en Bioinformática . Apuntes de conferencias sobre informática. vol. 5724, págs. 246–260. Código Bib : 2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN  978-3-642-04240-9. S2CID  17187140.
  48. ^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: mapeo de lectura rápida y precisa en genomas altamente polimórficos". Bioinformática . 29 (21): 2790–2791. doi : 10.1093/bioinformática/btt468 . PMID  23975764.
  49. ^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: mapeo eficiente de lecturas de secuencia corta con semillas espaciadas periódicas totalmente sensibles". Bioinformática . 25 (19): 2514–2521. doi : 10.1093/bioinformática/btp486. PMC 2752623 . PMID  19675096. 
  50. ^ Searls, David B.; Hoffman, Steve; Otón, cristiano; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Mapeo rápido de secuencias cortas con discrepancias, inserciones y eliminaciones utilizando estructuras de índice". PLOS Biología Computacional . 5 (9): e1000502. Código Bib : 2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN  1553-7358. PMC 2730575 . PMID  19750212. 
  51. ^ Retumbar, Stephen M.; Lacroute, Phil; Dalca, Adrián V.; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: Mapeo preciso de lecturas cortas de espacio de color". PLOS Biología Computacional . 5 (5): e1000386. Código Bib : 2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294 . PMID  19461883. 
  52. ^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: mapeo de lectura breve sensible pero práctico". Bioinformática . 27 (7): 1011–1012. doi : 10.1093/bioinformática/btr046 . PMID  21278192.
  53. ^ Malhis, Nawar; Butterfield, Yaron SN; Ester, Martín; Jones, Steven JM (2009). "Control deslizante: uso máximo de información de probabilidad para la alineación de lecturas de secuencia corta y detección de SNP". Bioinformática . 25 (1): 6-13. doi : 10.1093/bioinformática/btn565. PMC 2638935 . PMID  18974170. 
  54. ^ Malhis, Nawar; Jones, Steven JM (2010). "Llamadas SNP de alta calidad utilizando datos de Illumina con poca cobertura". Bioinformática . 26 (8): 1029-1035. doi : 10.1093/bioinformática/btq092. PMID  20190250.
  55. ^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). "SOAP: programa corto de alineación de oligonucleótidos". Bioinformática . 24 (5): 713–714. doi : 10.1093/bioinformática/btn025 . ISSN  1367-4803. PMID  18227114.
  56. ^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, SM; Kristiansen, K.; Wang, J. (2009). "SOAP2: una herramienta ultrarrápida mejorada para alineación de lecturas breves". Bioinformática . 25 (15): 1966-1967. doi : 10.1093/bioinformática/btp336. ISSN  1367-4803. PMID  19497933.
  57. ^ Abuín, José M.; Pichel, Juan C.; Peña, Tomás F.; Amigo, Jorge (16 de mayo de 2016). "SparkBWA: acelerar la alineación de datos de secuenciación de ADN de alto rendimiento". MÁS UNO . 11 (5): e0155461. Código Bib : 2016PLoSO..1155461A. doi : 10.1371/journal.pone.0155461 . ISSN  1932-6203. PMC 4868289 . PMID  27182962. 
  58. ^ Lunter, G.; Goodson, M. (2010). "Stampy: un algoritmo estadístico para el mapeo rápido y sensible de lecturas de secuencias de Illumina". Investigación del genoma . 21 (6): 936–939. doi :10.1101/gr.111120.110. ISSN  1088-9051. PMC 3106326 . PMID  20980556. 
  59. ^ Noé, L.; Girdea, M.; Kucherov, G. (2010). "Diseño de semillas espaciadas eficientes para mapeo de lectura SOLiD". Avances en Bioinformática . 2010 : 708501. doi : 10.1155/2010/708501 . PMC 2945724 . PMID  20936175. 
  60. ^ Lin, H.; Zhang, Z.; Zhang, MQ; Mamá, B.; Li, M. (2008). "¡ZOOM! Millones de oligos mapeados". Bioinformática . 24 (21): 2431–2437. doi : 10.1093/bioinformática/btn416. PMC 2732274 . PMID  18684737.