Programa de alineamiento de múltiples secuencias de proteínas
En bioinformática y proteómica , ProbCons es un software de código abierto para el alineamiento múltiple de secuencias de aminoácidos basado en la consistencia probabilística . Es uno de los programas de alineamiento múltiple de secuencias de proteínas más eficientes , ya que ha demostrado repetidamente una ventaja estadísticamente significativa en precisión sobre herramientas similares, incluidas Clustal y MAFFT . [1] [2]
Algoritmo
A continuación se describe el esquema básico del algoritmo ProbCons. [3]
Paso 1: Fiabilidad de un borde de alineación
Para cada par de secuencias, calcule la probabilidad de que las letras y estén emparejadas en una alineación generada por el modelo.
(Donde es igual a 1 si y están en la alineación y 0 en caso contrario).
Paso 2: Máxima precisión esperada
La precisión de una alineación con respecto a otra alineación se define como el número de pares alineados comunes dividido por la longitud de la secuencia más corta.
Calcular la precisión esperada de cada secuencia:
Esto produce una alineación de máxima precisión esperada (MEA):
Paso 3: Transformación de consistencia probabilística
Ahora se vuelven a estimar todos los pares de secuencias x,y del conjunto de todas las secuencias utilizando todas las secuencias intermedias z:
Este paso se puede iterar.
Paso 4: Cálculo del árbol guía
Construya un árbol guía mediante agrupamiento jerárquico utilizando la puntuación MEA como puntuación de similitud de secuencia. La similitud de agrupamiento se define utilizando el promedio ponderado sobre la similitud de secuencia por pares.
Paso 5: Calcular MSA
Finalmente, calcule el MSA utilizando la alineación progresiva o la alineación iterativa.
Véase también
Referencias
- ^ Do CB, Mahabhashyam MS, Brudno M, Batzoglou S (2005). "PROBCONS: Alineamiento de secuencias múltiples basado en consistencia probabilística". Genome Research . 15 (2): 330–340. doi :10.1101/gr.2821705. PMC 546535 . PMID 15687296.
- ^ Roshan, Usman (1 de enero de 2014). "Alineamiento de secuencias múltiples mediante Probcons y Probalign". En Russell, David J (ed.). Métodos de alineamiento de secuencias múltiples . Métodos en biología molecular. Vol. 1079. Humana Press. págs. 147–153. doi :10.1007/978-1-62703-646-7_9. ISBN 9781627036450. Número de identificación personal 24170400.
- ^ Conferencia "Bioinformática II" en la Universidad de Friburgo
Enlaces externos