stringtranslate.com

ProbCons

En bioinformática y proteómica , ProbCons es un software de código abierto para el alineamiento múltiple de secuencias de aminoácidos basado en la consistencia probabilística . Es uno de los programas de alineamiento múltiple de secuencias de proteínas más eficientes , ya que ha demostrado repetidamente una ventaja estadísticamente significativa en precisión sobre herramientas similares, incluidas Clustal y MAFFT . [1] [2]

Algoritmo

A continuación se describe el esquema básico del algoritmo ProbCons. [3]

Paso 1: Fiabilidad de un borde de alineación

Para cada par de secuencias, calcule la probabilidad de que las letras y estén emparejadas en una alineación generada por el modelo.

(Donde es igual a 1 si y están en la alineación y 0 en caso contrario).

Paso 2: Máxima precisión esperada

La precisión de una alineación con respecto a otra alineación se define como el número de pares alineados comunes dividido por la longitud de la secuencia más corta.

Calcular la precisión esperada de cada secuencia:

Esto produce una alineación de máxima precisión esperada (MEA):

Paso 3: Transformación de consistencia probabilística

Ahora se vuelven a estimar todos los pares de secuencias x,y del conjunto de todas las secuencias utilizando todas las secuencias intermedias z:

Este paso se puede iterar.

Paso 4: Cálculo del árbol guía

Construya un árbol guía mediante agrupamiento jerárquico utilizando la puntuación MEA como puntuación de similitud de secuencia. La similitud de agrupamiento se define utilizando el promedio ponderado sobre la similitud de secuencia por pares.

Paso 5: Calcular MSA

Finalmente, calcule el MSA utilizando la alineación progresiva o la alineación iterativa.

Véase también

Referencias

  1. ^ Do CB, Mahabhashyam MS, Brudno M, Batzoglou S (2005). "PROBCONS: Alineamiento de secuencias múltiples basado en consistencia probabilística". Genome Research . 15 (2): 330–340. doi :10.1101/gr.2821705. PMC  546535 . PMID  15687296.
  2. ^ Roshan, Usman (1 de enero de 2014). "Alineamiento de secuencias múltiples mediante Probcons y Probalign". En Russell, David J (ed.). Métodos de alineamiento de secuencias múltiples . Métodos en biología molecular. Vol. 1079. Humana Press. págs. 147–153. doi :10.1007/978-1-62703-646-7_9. ISBN 9781627036450. Número de identificación personal  24170400.
  3. ^ Conferencia "Bioinformática II" en la Universidad de Friburgo

Enlaces externos