BLOSUM

BLOSUM se usa para puntuar alineamientos entre secuencias de proteínas evolutivamente divergentes.

Se basa en alineamientos locales, y se introdujo en 1992 por primera vez en un artículo de Henikoff y Henikoff.

Todas las BLOSUM se basan en alineamientos observados, y no son extrapoladas de comparaciones de proteínas cercanamente relacionadas (como es el caso de las matrices PAM, obtenidas al multiplicar por sí misma un determinado número de veces una matriz inicial).

Las BLOSUM seguidas de un número alto están diseñadas para comparar secuencias cercanamente relacionadas, mientras que las BLOSUM con número bajo están diseñadas para comparar secuencias relacionadas de forma distante.

[3] A cada posible identidad o sustitución se le asigna una puntuación basada en las frecuencias observadas en el alineamiento de proteínas relacionadas.

[4] Se da una puntuación positiva a las sustituciones más probables, mientras que corresponde una puntuación negativa para sustituciones menos probables.

[2] BLOSUM ha demostrado actuar mejor en la puntuación de secuencias distantemente relacionadas que las otrora ampliamente usadas matrices Point Accepted Mutation (PAM).

[5] Para calcular una matriz BLOSUM se usa la siguiente ecuación:

son las probabilidades últimas de encontrar los aminoácidos

es un mero factor de escala para asegurar que, tras su aplicación y la de un necesario redondeo al entero más cercano, la matriz contenga valores enteros dispersos y fácilmente tratables.

En resumen: esta sustitución es aceptada (en mayor o menor grado, de acuerdo a sus resultados estadísticos) por la evolución.

Por el contrario, un logaritmo nulo o negativo implica que las sustituciones se dan al mismo (o menor) ritmo que las esperadas aleatoriamente.

Ejemplos son el módulo blosum para Python, o la biblioteca BioJava para Java.