stringtranslate.com

Máscara

MUMmer es un sistema de software bioinformático para alineación de secuencias . Se basa en la estructura de datos del árbol de sufijos . Se ha utilizado para comparar diferentes conjuntos de genomas entre sí, lo que permite a los científicos determinar cómo ha cambiado un genoma. El acrónimo "MUMmer" proviene de "Maximal Unique Matches", o MUM.

Los algoritmos originales del paquete de software MUMMER fueron diseñados por Art Delcher, Simon Kasif y Steven Salzberg. Mummer fue el primer sistema de comparación de genoma completo desarrollado en bioinformática. Originalmente se aplicó a la comparación de dos cepas de bacterias relacionadas.

El software MUMmer es de código abierto . El mantenimiento del sistema lo realizan principalmente Steven Salzberg y Arthur Delcher del Centro de Biología Computacional de la Universidad Johns Hopkins .

MUMmer es un sistema bioinformático muy citado en la literatura científica. Según Google Scholar, a principios de 2013 el artículo original de MUMmer (Delcher et al., 1999) [1] ha sido citado 691 veces; el artículo MUMmer 2 (Delcher et al., 2002) [2] ha sido citado 455 veces; y el artículo de MUMmer 3.0 (Kurtz et al., 2004) [3] ha sido citado 903 veces.

Descripción general

Mummer es un algoritmo rápido utilizado para la alineación rápida de genomas completos. El algoritmo MUMmer es relativamente nuevo y tiene 4 versiones.

Versiones de MUMmers

MUMmer1

MUMmer1 o simplemente MUMmer consta de tres partes, la primera parte consiste en la creación de árboles de sufijos (para obtener MUM), la segunda parte en la subsecuencia creciente más larga o las subsecuencias comunes más largas (para ordenar MUM), y por último cualquier alineación para cerrar espacios.

Las interrupciones entre la alineación de las MUM se conocen como brechas. Otros algoritmos de alineación llenan estos vacíos. Las brechas se clasifican en las siguientes cuatro clases: [4]

Mamá 2

Este algoritmo fue rediseñado para requerir menos memoria y aumentar la velocidad y precisión. También permite una mayor alineación de los genomas.

La mejora fue la cantidad almacenada en los árboles de sufijos empleando el creado por Kurtz.

Mamá 3

Según Stefan Kurtz y sus compañeros de equipo, “la mejora técnica más significativa en MUMmer 3.0 es una reescritura completa del código del árbol de sufijos, basado en la representación compacta del árbol de sufijos de” [5] el árbol descrito en el artículo “Reducción de el requisito de espacio de los árboles de sufijos”. [6]

Mamá 4

Según Guillaume y su equipo, hay algunas mejoras adicionales en la implementación y también innovación con el paralelismo de consultas. "MUMmer4 ahora incluye opciones para guardar y cargar la matriz de sufijos para una referencia determinada". [7] Esto permite que el árbol de sufijos se pueda construir una vez y volver a construirlo después de ejecutarlo desde el árbol de sufijos guardado.

Software: código abierto

MUMmer tiene software de código abierto y se puede acceder a él en línea.

Alineaciones de secuencia relacionadas

Existen otros tipos de alineamientos de secuencias:

Referencias

  1. ^ Delcher, AL; Kasif, S.; Fleischmann, RD; Peterson, J.; Blanco, O.; Salzberg, SL (1999). "Alineación de genomas completos". Investigación de ácidos nucleicos . 27 (11): 2369–2376. doi :10.1093/nar/27.11.2369. PMC  148804 . PMID  10325427.
  2. ^ Delcher, AL; Phillippy, A.; Carlton, J.; Salzberg, SL (2002). "Algoritmos rápidos para la alineación y comparación del genoma a gran escala". Investigación de ácidos nucleicos . 30 (11): 2478–2483. doi :10.1093/nar/30.11.2478. PMC 117189 . PMID  12034836. 
  3. ^ Delcher, A.; Armon, D.; Kasif, S.; Blanco, O.; Salzberg, S. (1999). "Identificación de genes microbianos mejorada con GLIMMER". Investigación de ácidos nucleicos . 27 (23): 4636–4641. doi : 10.1093/nar/27.23.4636. PMC 148753 . PMID  10556321. 
  4. ^ Delcher, A.; Kasif, S.; Fleischmann, R.; Peterson, J.; Blanco, O.; Salzberg, S. (1999). "Alineación de genomas completos". Investigación de ácidos nucleicos . 27 (11): 2369–2376. doi : 10.1093/nar/27.23.4636 . PMC 148804 . PMID  10325427. 
  5. ^ Kurtz, S.; Phillippy, A.; Delcher, A.; Smoot, M.; Shumway, M.; Antonescu, C.; Salzberg, S. (2004). "Software versátil y abierto para comparar genomas de gran tamaño" (PDF) . Biología del genoma . 5 (2): R12. doi : 10.1186/gb-2004-5-2-r12 . PMC 395750 . PMID  14759262. Archivado (PDF) desde el original el 11 de julio de 2019 . Consultado el 6 de mayo de 2021 . 
  6. ^ Kurtz, S. (1999). "Reducir el requisito de espacio de los árboles de sufijos". Software: práctica y experiencia . 29 (13): 1149-1171. doi :10.1002/(SICI)1097-024X(199911)29:13<1149::AID-SPE274>3.0.CO;2-O. Archivado desde el original el 6 de mayo de 2021 . Consultado el 6 de mayo de 2021 .
  7. ^ Marçais, Guillaume.; Pillippy, A.; Delcher, A.; Coston, R.; Salzberg, S.; Zimin, A. (2018). "MUMmer4: un sistema de alineación del genoma rápido y versátil". PLOS Biología Computacional . 14 (1): e1005944. Código Bib : 2018PLSCB..14E5944M. doi : 10.1371/journal.pcbi.1005944 . PMC 5802927 . PMID  29373581. 

enlaces externos