stringtranslate.com

Máscara

MUMmer es un sistema de software bioinformático para la alineación de secuencias . Se basa en la estructura de datos de árbol de sufijos . Se ha utilizado para comparar conjuntos de genomas diferentes entre sí, lo que permite a los científicos determinar cómo ha cambiado un genoma. El acrónimo "MUMmer" proviene de "Maximal Unique Matches" o MUMs.

Los algoritmos originales del paquete de software MUMMER fueron diseñados por Art Delcher, Simon Kasif y Steven Salzberg. Mummer fue el primer sistema de comparación de genoma completo desarrollado en bioinformática. Originalmente se aplicó a la comparación de dos cepas bacterianas relacionadas.

El software MUMmer es de código abierto . El sistema es mantenido principalmente por Steven Salzberg y Arthur Delcher en el Centro de Biología Computacional de la Universidad Johns Hopkins .

MUMmer es un sistema de bioinformática muy citado en la literatura científica. Según Google Scholar, a principios de 2013, el artículo original de MUMmer (Delcher et al., 1999) [1] había sido citado 691 veces; el artículo de MUMmer 2 (Delcher et al., 2002) [2] había sido citado 455 veces; y el artículo de MUMmer 3.0 (Kurtz et al., 2004) [3] había sido citado 903 veces.

Descripción general

Mummer es un algoritmo rápido que se utiliza para la alineación rápida de genomas completos. El algoritmo MUMmer es relativamente nuevo y tiene 4 versiones.

Versiones de MUMmers

Mamá1

MUMmer1 o simplemente MUMmer consta de tres partes, la primera parte consiste en la creación de árboles de sufijos (para obtener MUMs), la segunda parte en la subsecuencia creciente más larga o subsecuencias comunes más largas (para ordenar MUMs), y por último cualquier alineación para cerrar espacios.

Las interrupciones entre la alineación de MUM se conocen como brechas. Otros algoritmos de alineación llenan estas brechas. Las brechas se dividen en las siguientes cuatro clases: [4]

Mamá 2

Este algoritmo fue rediseñado para requerir menos memoria y aumentar la velocidad y la precisión. También permite la alineación de genomas más grandes.

La mejora fue la cantidad almacenada en los árboles de sufijos al emplear el creado por Kurtz.

Mamá 3

Según Stefan Kurtz y sus compañeros de equipo, “la mejora técnica más significativa en MUMmer 3.0 es una reescritura completa del código del árbol de sufijos, basado en la representación compacta del árbol de sufijos” [5], el árbol descrito en el artículo “Reducción del requisito de espacio de los árboles de sufijos”. [6]

Mamá 4

Según Guillaume y su equipo, hay algunas mejoras adicionales en la implementación y también innovación con el paralelismo de consultas. “MUMmer4 ahora incluye opciones para guardar y cargar la matriz de sufijos para una referencia dada”. [7] Esto permite que el árbol de sufijos se pueda construir una vez y construir nuevamente después de ejecutarlo desde el árbol de sufijos guardado.

Software - Código abierto

MUMmer tiene un software de código abierto y se puede acceder a él en línea.

Alineaciones de secuencias relacionadas

Existen otros tipos de alineaciones de secuencias:

Referencias

  1. ^ Delcher, AL; Kasif, S.; Fleischmann, RD; Peterson, J.; White, O.; Salzberg, SL (1999). "Alineación de genomas completos". Nucleic Acids Research . 27 (11): 2369–2376. doi :10.1093/nar/27.11.2369. PMC  148804 . PMID  10325427.
  2. ^ Delcher, AL; Phillippy, A.; Carlton, J.; Salzberg, SL (2002). "Algoritmos rápidos para la alineación y comparación de genomas a gran escala". Nucleic Acids Research . 30 (11): 2478–2483. doi :10.1093/nar/30.11.2478. PMC 117189 . PMID  12034836. 
  3. ^ Delcher, A.; Harmon, D.; Kasif, S.; White, O.; Salzberg, S. (1999). "Identificación mejorada de genes microbianos con GLIMMER". Nucleic Acids Research . 27 (23): 4636–4641. doi :10.1093/nar/27.23.4636. PMC 148753 . PMID  10556321. 
  4. ^ Delcher, A.; Kasif, S.; Fleischmann, R.; Peterson, J.; White, O.; Salzberg, S. (1999). "Alineación de genomas completos". Investigación de ácidos nucleicos . 27 (11): 2369–2376. doi : 10.1093/nar/27.23.4636 . PMC 148804 . PMID  10325427. 
  5. ^ Kurtz, S.; Phillippy, A.; Delcher, A.; Smoot, M.; Shumway, M.; Antonescu, C.; Salzberg, S. (2004). "Software versátil y abierto para comparar genomas grandes" (PDF) . Genome Biology . 5 (2): R12. doi : 10.1186/gb-2004-5-2-r12 . PMC 395750 . PMID  14759262. Archivado (PDF) desde el original el 2019-07-11 . Consultado el 2021-05-06 . 
  6. ^ Kurtz, S. (1999). "Reducción del requisito de espacio de los árboles de sufijos". Software: práctica y experiencia . 29 (13): 1149–1171. doi :10.1002/(SICI)1097-024X(199911)29:13<1149::AID-SPE274>3.0.CO;2-O. Archivado desde el original el 2021-05-06 . Consultado el 2021-05-06 .
  7. ^ Marçais, Guillaume.; Pillippy, A.; Delcher, A.; Coston, R.; Salzberg, S.; Zimin, A. (2018). "MUMmer4: Un sistema de alineamiento genómico rápido y versátil". PLOS Computational Biology . 14 (1): e1005944. Bibcode :2018PLSCB..14E5944M. doi : 10.1371/journal.pcbi.1005944 . PMC 5802927 . PMID  29373581. 

Enlaces externos