El método Chou-Fasman es una técnica empírica para la predicción de estructuras secundarias en proteínas , desarrollada originalmente en la década de 1970 por Peter Y. Chou y Gerald D. Fasman. [1] [2] [3] El método se basa en análisis de las frecuencias relativas de cada aminoácido en hélices alfa , láminas beta y giros basados en estructuras de proteínas conocidas resueltas con cristalografía de rayos X. A partir de estas frecuencias se derivó un conjunto de parámetros de probabilidad para la aparición de cada aminoácido en cada tipo de estructura secundaria, y estos parámetros se utilizan para predecir la probabilidad de que una secuencia dada de aminoácidos forme una hélice, una cadena beta o una cadena beta. convertir en una proteína. El método tiene como máximo entre un 50% y un 60% de precisión en la identificación de estructuras secundarias correctas, [4] lo cual es significativamente menos preciso que las técnicas modernas basadas en el aprendizaje automático . [5]
Los parámetros originales de Chou-Fasman encontraron algunas fuertes tendencias entre aminoácidos individuales a preferir un tipo de estructura secundaria sobre otros. La alanina , el glutamato , la leucina y la metionina fueron identificados como formadores de hélices, mientras que la prolina y la glicina , debido a las propiedades conformacionales únicas de sus enlaces peptídicos , comúnmente terminan en una hélice. Los parámetros originales de Chou-Fasman [6] se derivaron de una muestra muy pequeña y no representativa de estructuras de proteínas debido al pequeño número de dichas estructuras que se conocían en el momento de su trabajo original. Desde entonces, se ha demostrado que estos parámetros originales no son confiables [7] y se han actualizado a partir de un conjunto de datos actual, junto con modificaciones al algoritmo inicial. [8]
El método Chou-Fasman sólo tiene en cuenta la probabilidad de que cada aminoácido individual aparezca en una hélice, hebra o vuelta. A diferencia del método GOR más complejo , no refleja las probabilidades condicionales de que un aminoácido forme una estructura secundaria particular dado que sus vecinos ya poseen esa estructura. Esta falta de cooperatividad aumenta su eficiencia computacional pero disminuye su precisión, ya que las propensiones de los aminoácidos individuales a menudo no son lo suficientemente fuertes como para generar una predicción definitiva. [5]
El método Chou-Fasman predice hélices y hebras de manera similar, primero buscando linealmente a través de la secuencia una región de "nucleación" de alta probabilidad de hélice o hebra y luego extendiendo la región hasta que una ventana posterior de cuatro residuos tenga una probabilidad menor que 1. Como se describió originalmente, cuatro de seis aminoácidos contiguos fueron suficientes para nuclear la hélice, y tres de cinco contiguos fueron suficientes para una hoja. Los umbrales de probabilidad para las nucleaciones de hélices y hebras son constantes pero no necesariamente iguales; Originalmente se estableció 1,03 como límite de hélice y 1,00 como límite de hebra.
Los giros también se evalúan en ventanas de cuatro residuos, pero se calculan mediante un procedimiento de varios pasos porque muchas regiones de giro contienen aminoácidos que también podrían aparecer en regiones de hélice o lámina. Los giros de cuatro residuos también tienen sus propios aminoácidos característicos; La prolina y la glicina son comunes a su vez. Se predice un giro sólo si la probabilidad de giro es mayor que las probabilidades de hélice o lámina y un valor de probabilidad basado en las posiciones de aminoácidos particulares en el giro excede un umbral predeterminado. La probabilidad de giro p(t) se determina como:
donde j es la posición del aminoácido en la ventana de cuatro residuos. Si p(t) excede un valor de corte arbitrario (originalmente 7,5e–3), la media de p(j) excede 1, y p(t) excede las probabilidades de hélice alfa y hoja beta para esa ventana, entonces un Se predice el turno. Si se cumplen las dos primeras condiciones pero la probabilidad de una hoja beta p(b) excede p(t), entonces se predice una hoja.
{{cite book}}
: |journal=
ignorado ( ayuda )