Método Chou-Fasman

El método Chou-Fasman es una técnica empírica para la predicción de estructuras secundarias en proteínas , desarrollada originalmente en la década de 1970 por Peter Y. Chou y Gerald D. Fasman. ^[1]^[2]^[3] El método se basa en análisis de las frecuencias relativas de cada aminoácido en hélices alfa , láminas beta y giros basados en estructuras de proteínas conocidas resueltas con cristalografía de rayos X. A partir de estas frecuencias se derivó un conjunto de parámetros de probabilidad para la aparición de cada aminoácido en cada tipo de estructura secundaria, y estos parámetros se utilizan para predecir la probabilidad de que una secuencia dada de aminoácidos forme una hélice, una cadena beta o una cadena beta. convertir en una proteína. El método tiene como máximo entre un 50% y un 60% de precisión en la identificación de estructuras secundarias correctas, ^[4] lo cual es significativamente menos preciso que las técnicas modernas basadas en el aprendizaje automático . ^[5]

Propensiones de aminoácidos

Los parámetros originales de Chou-Fasman encontraron algunas fuertes tendencias entre aminoácidos individuales a preferir un tipo de estructura secundaria sobre otros. La alanina , el glutamato , la leucina y la metionina fueron identificados como formadores de hélices, mientras que la prolina y la glicina , debido a las propiedades conformacionales únicas de sus enlaces peptídicos , comúnmente terminan en una hélice. Los parámetros originales de Chou-Fasman ^[6] se derivaron de una muestra muy pequeña y no representativa de estructuras de proteínas debido al pequeño número de dichas estructuras que se conocían en el momento de su trabajo original. Desde entonces, se ha demostrado que estos parámetros originales no son confiables ^[7] y se han actualizado a partir de un conjunto de datos actual, junto con modificaciones al algoritmo inicial. ^[8]

El método Chou-Fasman sólo tiene en cuenta la probabilidad de que cada aminoácido individual aparezca en una hélice, hebra o vuelta. A diferencia del método GOR más complejo , no refleja las probabilidades condicionales de que un aminoácido forme una estructura secundaria particular dado que sus vecinos ya poseen esa estructura. Esta falta de cooperatividad aumenta su eficiencia computacional pero disminuye su precisión, ya que las propensiones de los aminoácidos individuales a menudo no son lo suficientemente fuertes como para generar una predicción definitiva. ^[5]

Algoritmo

El método Chou-Fasman predice hélices y hebras de manera similar, primero buscando linealmente a través de la secuencia una región de "nucleación" de alta probabilidad de hélice o hebra y luego extendiendo la región hasta que una ventana posterior de cuatro residuos tenga una probabilidad menor que 1. Como se describió originalmente, cuatro de seis aminoácidos contiguos fueron suficientes para nuclear la hélice, y tres de cinco contiguos fueron suficientes para una hoja. Los umbrales de probabilidad para las nucleaciones de hélices y hebras son constantes pero no necesariamente iguales; Originalmente se estableció 1,03 como límite de hélice y 1,00 como límite de hebra.

Los giros también se evalúan en ventanas de cuatro residuos, pero se calculan mediante un procedimiento de varios pasos porque muchas regiones de giro contienen aminoácidos que también podrían aparecer en regiones de hélice o lámina. Los giros de cuatro residuos también tienen sus propios aminoácidos característicos; La prolina y la glicina son comunes a su vez. Se predice un giro sólo si la probabilidad de giro es mayor que las probabilidades de hélice o lámina y un valor de probabilidad basado en las posiciones de aminoácidos particulares en el giro excede un umbral predeterminado. La probabilidad de giro p(t) se determina como:

p(t)=p_{t}(j)\times p_{t}(j+1)\times p_{t}(j+2)\times p_{t}(j+3)

donde j es la posición del aminoácido en la ventana de cuatro residuos. Si p(t) excede un valor de corte arbitrario (originalmente 7,5e–3), la media de p(j) excede 1, y p(t) excede las probabilidades de hélice alfa y hoja beta para esa ventana, entonces un Se predice el turno. Si se cumplen las dos primeras condiciones pero la probabilidad de una hoja beta p(b) excede p(t), entonces se predice una hoja.

Ver también

Lista de software de predicción de la estructura de proteínas.

Referencias

^ Chou PY, Fasman GD (1974). "Predicción de la conformación de proteínas". Bioquímica . 13 (2): 222–245. doi :10.1021/bi00699a002. PMID 4358940.
^ Chou PY, Fasman GD (1978). "Predicciones empíricas de la conformación de la proteína". Annu Rev Bioquímica . 47 : 251–276. doi : 10.1146/annurev.bi.47.070178.001343. PMID 354496.
^ Chou PY, Fasman GD (1979). "Predicción de la estructura secundaria de proteínas a partir de su secuencia de aminoácidos". Avances en Enzimología y Áreas Afines de la Biología Molecular . Avances en enzimología y áreas relacionadas de la biología molecular. vol. 47. págs. 45-148. doi :10.1002/9780470122921.ch2. ISBN 9780470122921. PMID 364941. {{cite book}}: |journal=ignorado ( ayuda )
^ Kabsch W, Sander C (1983). "¿Qué tan buenas son las predicciones de la estructura secundaria de las proteínas?". FEBS Lett . 155 (2): 179–82. doi :10.1016/0014-5793(82)80597-8. PMID 6852232. S2CID 41477827.
^ ab Monte DM (2004). Bioinformática: análisis de secuencia y genoma (2ª ed.). Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-712-9.
^ Chou PY, Fasman GD (1974). "Parámetros conformacionales de aminoácidos en regiones helicoidales, de lámina beta y de bobina aleatoria calculados a partir de proteínas". Bioquímica . 13 (2): 211–222. doi :10.1021/bi00699a001. PMID 4358939.
^ Kyngas J, Valjakka J (1998). "Falta de fiabilidad de los parámetros de Chou-Fasman en la predicción de la estructura secundaria de proteínas". Ing. Proteínas . 11 (5): 345–348. doi : 10.1093/proteína/11.5.345. PMID 9681866.
^ Chen H, Gu F, Huang Z (2006). "Método Chou-Fasman mejorado para la predicción de la estructura secundaria de proteínas". Bioinformática BMC . 7 (Suplemento 4): S14. doi : 10.1186/1471-2105-7-S4-S14 . PMC 1780123 . PMID 17217506.

enlaces externos

Gerald D. Fasman en Internet