Estructura secundaria de proteínas

La estructura secundaria de la proteína es la conformación espacial local del esqueleto polipeptídico excluyendo las cadenas laterales. ^[1] Los dos elementos estructurales secundarios más comunes son las hélices alfa y las láminas beta , aunque también se producen giros beta y bucles omega . Los elementos de la estructura secundaria normalmente se forman espontáneamente como intermediarios antes de que la proteína se pliegue en su estructura terciaria tridimensional .

La estructura secundaria se define formalmente por el patrón de enlaces de hidrógeno entre los átomos de hidrógeno amino y oxígeno carboxilo en la cadena principal del péptido . Alternativamente, la estructura secundaria se puede definir basándose en el patrón regular de los ángulos diédricos de la columna vertebral en una región particular del gráfico de Ramachandran, independientemente de si tiene los enlaces de hidrógeno correctos.

El concepto de estructura secundaria fue introducido por primera vez por Kaj Ulrik Linderstrøm-Lang en Stanford en 1952. ^[2]^[3] Otros tipos de biopolímeros , como los ácidos nucleicos, también poseen estructuras secundarias características .

Tipos

Las estructuras secundarias más comunes son las hélices alfa y las láminas beta . Se calcula que otras hélices, como la hélice 3 10 y la hélice π , tienen patrones de enlaces de hidrógeno energéticamente favorables, pero rara vez se observan en proteínas naturales, excepto en los extremos de las hélices α debido al empaquetamiento desfavorable de la columna vertebral en el centro de la hélice. Otras estructuras extendidas, como la hélice de poliprolina y la lámina alfa , son raras en las proteínas en estado nativo , pero a menudo se plantean la hipótesis de que son importantes intermediarios del plegamiento de proteínas . Giros cerrados y bucles sueltos y flexibles unen los elementos de la estructura secundaria más "regulares". La bobina aleatoria no es una verdadera estructura secundaria, sino que es la clase de conformaciones que indican una ausencia de estructura secundaria regular.

Los aminoácidos varían en su capacidad para formar los diversos elementos de la estructura secundaria. La prolina y la glicina a veces se conocen como "rompedores de hélices" porque alteran la regularidad de la conformación del esqueleto helicoidal α; sin embargo, ambos tienen habilidades conformacionales inusuales y comúnmente se encuentran por turnos . Los aminoácidos que prefieren adoptar conformaciones helicoidales en las proteínas incluyen metionina , alanina , leucina , glutamato y lisina ("MALEK" en códigos de aminoácidos de 1 letra); por el contrario, los residuos aromáticos grandes ( triptófano , tirosina y fenilalanina ) y los aminoácidos ramificados en C ^{β (}isoleucina , valina y treonina ) prefieren adoptar conformaciones de cadena β . Sin embargo, estas preferencias no son lo suficientemente fuertes como para producir un método confiable para predecir la estructura secundaria a partir de la secuencia únicamente.

Se cree que las vibraciones colectivas de baja frecuencia son sensibles a la rigidez local dentro de las proteínas, lo que revela que las estructuras beta son genéricamente más rígidas que las proteínas alfa o desordenadas. ^[6]^[7] Las mediciones de dispersión de neutrones han conectado directamente la característica espectral a ~1 THz con los movimientos colectivos de la estructura secundaria de la proteína de barril beta GFP. ^[8]

Los patrones de enlaces de hidrógeno en estructuras secundarias pueden estar significativamente distorsionados, lo que dificulta la determinación automática de la estructura secundaria. Existen varios métodos para definir formalmente la estructura secundaria de la proteína (por ejemplo, DSSP , ^[9] DEFINE, ^[10] STRIDE , ^[11] ScrewFit, ^[12] SST ^[13] ).

Clasificación DSSP

Distribución obtenida del conjunto de datos pdb_select no redundante (marzo de 2006); Estructura secundaria asignada por DSSP; 8 estados conformacionales reducidos a 3 estados: H=HGI, E=EB, C=STC. Son visibles mezclas de distribuciones (gaussianas), resultantes también de la reducción de los estados DSSP.

El Diccionario de estructura secundaria de proteínas, abreviado DSSP, se utiliza habitualmente para describir la estructura secundaria de proteínas con códigos de una sola letra. La estructura secundaria se asigna en base a patrones de enlaces de hidrógeno como los propuestos inicialmente por Pauling et al. en 1951 (antes de que se hubiera determinado experimentalmente alguna estructura proteica ). Hay ocho tipos de estructura secundaria que define DSSP:

G = hélice de 3 vueltas ( 3 ₁₀ hélice ). Longitud mínima 3 residuos.
H = hélice de 4 vueltas ( hélice α ). Longitud mínima 4 residuos.
I = hélice de 5 vueltas ( π hélice ). Longitud mínima 5 residuos.
T = vuelta unida por puente de hidrógeno (3, 4 o 5 vueltas)
E = hebra extendida en conformación de lámina β paralela y/o antiparalela . Longitud mínima 2 residuos.
B = residuo en el puente β aislado (formación de enlaces de hidrógeno de la hoja β de un solo par)
S = curvatura (la única asignación no basada en enlaces de hidrógeno).
C = bobina (residuos que no se encuentran en ninguna de las conformaciones anteriores).

'Bobina' a menudo se codifica como ' ' (espacio), C (bobina) o '–' (guión). Se requiere que las hélices (G, H e I) y las conformaciones de las láminas tengan una longitud razonable. Esto significa que 2 residuos adyacentes en la estructura primaria deben formar el mismo patrón de enlaces de hidrógeno. Si el patrón de enlaces de hidrógeno en hélice o lámina es demasiado corto, se denominan T o B, respectivamente. Existen otras categorías de asignación de estructuras secundarias de proteínas (giros cerrados, bucles Omega , etc.), pero se utilizan con menos frecuencia.

La estructura secundaria se define mediante enlaces de hidrógeno , por lo que la definición exacta de un enlace de hidrógeno es fundamental. La definición estándar de enlace de hidrógeno para estructura secundaria es la de DSSP , que es un modelo puramente electrostático. Asigna cargas de ± q ₁ ≈ 0,42 e al carbono carbonilo y al oxígeno, respectivamente, y cargas de ± q ₂ ≈ 0,20 e a la amida de hidrógeno y nitrógeno, respectivamente. La energía electrostática es

E=q_{1}q_{2}\left({\frac {1}{r_{\mathrm {ON} }}}+{\frac {1}{r_{\mathrm {CH} }} }-{\frac {1}{r_{\mathrm {OH} }}}-{\frac {1}{r_{\mathrm {CN} }}}\right)\cdot 332{\text{ kcal/mol }}.

Según DSSP, existe un enlace de hidrógeno si y sólo si E es menor que −0,5 kcal/mol (−2,1 kJ/mol). Aunque la fórmula DSSP es una aproximación relativamente burda de la energía física del enlace de hidrógeno, generalmente se acepta como una herramienta para definir la estructura secundaria.

Clasificación SST [13]

SST es un método bayesiano para asignar estructura secundaria a datos de coordenadas de proteínas utilizando el criterio de información de Shannon de inferencia de longitud mínima de mensaje ( MML ). SST trata cualquier asignación de estructura secundaria como una hipótesis potencial que intenta explicar ( comprimir ) datos de coordenadas de proteínas dadas. La idea central es que la mejor asignación estructural secundaria es aquella que puede explicar ( comprimir ) las coordenadas de una proteína determinada de la manera más económica, vinculando así la inferencia de la estructura secundaria con la compresión de datos sin pérdidas . SST delimita con precisión cualquier cadena proteica en regiones asociadas con los siguientes tipos de asignación: ^[14]

E = hebra (extendida) de una hoja plisada β
G = Derecha 3 ₁₀ hélice
H = hélice α derecha
I = Derecha π - hélice
g = zurdo 3 ₁₀ hélice
h = hélice α zurda
i = zurdo π - hélice
3 = 3 ₁₀ -como Turno
4 = giro tipo α
5 = π- como Giro
T = Giro no especificado
C = Bobina
- = Residuo no asignado

SST detecta tapas de hélices π y 3 ₁₀ en hélices α estándar y ensambla automáticamente las distintas hebras extendidas en láminas plisadas β consistentes. Proporciona una salida legible de elementos estructurales secundarios disecados y un script correspondiente cargable en PyMol para visualizar los elementos estructurales secundarios asignados individualmente.

Determinación experimental

El contenido aproximado de estructura secundaria de un biopolímero (por ejemplo, "esta proteína es 40% de hélice α y 20% de hoja β ") se puede estimar espectroscópicamente . ^{[15] Para las proteínas, un método común es}el dicroísmo circular ultravioleta lejano (UV lejano, 170–250 nm) . Un mínimo doble pronunciado a 208 y 222 nm indica una estructura de hélice α, mientras que un mínimo único a 204 nm o 217 nm refleja una estructura de bobina aleatoria o de lámina β, respectivamente. Un método menos común es la espectroscopia infrarroja , que detecta diferencias en las oscilaciones de los enlaces de los grupos amida debido a los enlaces de hidrógeno. Finalmente, el contenido de la estructura secundaria se puede estimar con precisión utilizando los cambios químicos de un espectro de RMN inicialmente no asignado . ^[dieciséis]

Predicción

Predecir la estructura terciaria de una proteína a partir únicamente de su secuencia de aminoácidos es un problema muy desafiante (ver predicción de la estructura de la proteína ), pero usar definiciones de estructura secundaria más simples es más manejable.

Los primeros métodos de predicción de estructuras secundarias se limitaban a predecir los tres estados predominantes: hélice, lámina o espiral aleatoria. Estos métodos se basaban en las propensiones a formar hélices o láminas de aminoácidos individuales, a veces junto con reglas para estimar la energía libre de formación de elementos de estructura secundaria. Las primeras técnicas ampliamente utilizadas para predecir la estructura secundaria de proteínas a partir de la secuencia de aminoácidos fueron el método Chou-Fasman ^[17]^[18]^[19] y el método GOR . ^[20] Aunque dichos métodos afirmaban lograr una precisión de ~60 % en la predicción de cuál de los tres estados (hélice/hoja/bobina) adopta un residuo, las evaluaciones informáticas ciegas demostraron posteriormente que la precisión real era mucho menor. ^[21]

Se logró un aumento significativo en la precisión (hasta casi ~80%) mediante la explotación del alineamiento de secuencias múltiples ; conocer la distribución completa de los aminoácidos que se producen en una posición (y en sus proximidades, normalmente ~7 residuos en cada lado) a lo largo de la evolución proporciona una imagen mucho mejor de las tendencias estructurales cerca de esa posición. ^[22]^[23] A modo de ilustración, una proteína determinada podría tener una glicina en una posición determinada, lo que por sí solo podría sugerir una espiral aleatoria allí. Sin embargo, el alineamiento de secuencias múltiples podría revelar que los aminoácidos que favorecen la hélice se encuentran en esa posición (y en posiciones cercanas) en el 95% de las proteínas homólogas que abarcan casi mil millones de años de evolución. Además, al examinar la hidrofobicidad promedio en esa posición y en las cercanas, la misma alineación también podría sugerir un patrón de accesibilidad al solvente residual consistente con una hélice α. En conjunto, estos factores sugerirían que la glicina de la proteína original adopta una estructura de hélice α, en lugar de una espiral aleatoria. Se utilizan varios tipos de métodos para combinar todos los datos disponibles para formar una predicción de 3 estados, incluidas redes neuronales , modelos ocultos de Markov y máquinas de vectores de soporte . Los métodos de predicción modernos también proporcionan una puntuación de confianza para sus predicciones en cada posición.

Los métodos de predicción de la estructura secundaria se evaluaron mediante experimentos de Evaluación Crítica de Predicción de la Estructura de las Proteínas (CASP) y se compararon continuamente, por ejemplo, mediante EVA (punto de referencia) . Con base en estas pruebas, los métodos más precisos fueron Psipred , SAM, ^[24] PORTER, ^[25] PROF, ^[26] y SABLE. ^[27] El principal área de mejora parece ser la predicción de las cadenas β; es probable que los residuos predichos con seguridad como cadena β lo sean, pero los métodos tienden a pasar por alto algunos segmentos de cadena β (falsos negativos). Es probable que exista un límite superior de ~90 % de precisión de predicción en general, debido a las idiosincrasias del método estándar ( DSSP ) para asignar clases de estructura secundaria (hélice/hebra/bobina) a las estructuras PDB, con las que se comparan las predicciones. ^[28]

La predicción precisa de la estructura secundaria es un elemento clave en la predicción de la estructura terciaria , en todos los casos excepto en los más simples ( modelado de homología ). Por ejemplo, un patrón predicho con seguridad de seis elementos de estructura secundaria βαββαβ es la firma de un pliegue de ferredoxina . ^[29]

Aplicaciones

Se pueden utilizar estructuras secundarias tanto de proteínas como de ácidos nucleicos para ayudar en el alineamiento de múltiples secuencias . Estas alineaciones pueden hacerse más precisas mediante la inclusión de información de estructura secundaria además de información de secuencia simple. A veces, esto es menos útil en el ARN porque el emparejamiento de bases está mucho más conservado que la secuencia. Las relaciones distantes entre proteínas cuyas estructuras primarias no son alineables a veces pueden encontrarse mediante estructuras secundarias. ^[22]

Se ha demostrado que las hélices α son más estables, resistentes a las mutaciones y diseñables que las hebras β en las proteínas naturales, ^[30] por lo que es probable que diseñar proteínas totalmente α funcionales sea más fácil que diseñar proteínas con hélices y hebras; esto ha sido confirmado recientemente experimentalmente. ^[31]

Ver también

Referencias

^ Sun PD, Foster CE, Boyington JC (mayo de 2004). "Descripción general de los pliegues estructurales y funcionales de las proteínas". Protocolos actuales en ciencia de proteínas . 17 (1): Unidad 17.1. doi :10.1002/0471140864.ps1701s35. PMC 7162418 . PMID 18429251.
^ Linderstrøm-Lang KU (1952). Lane Medical Lectures: proteínas y enzimas . Prensa de la Universidad de Stanford. pag. 115. ASIN B0007J31SC.
^ Schellman JA, Schellman CG (1997). "Kaj Ulrik Linderstrøm-Lang (1896-1959)". Ciencia de las proteínas . 6 (5): 1092–100. doi :10.1002/pro.5560060516. PMC 2143695 . PMID 9144781. Ya había introducido los conceptos de estructura primaria, secundaria y terciaria de las proteínas en la tercera conferencia Lane (Linderstram-Lang, 1952).
^ Bottomley S (2004). "Tutorial interactivo sobre la estructura de las proteínas". Archivado desde el original el 1 de marzo de 2011 . Consultado el 9 de enero de 2011 .
^ Schulz GE, Schirmer RH (1979). Principios de estructura de proteínas. Nueva York: Springer-Verlag. ISBN 0-387-90386-0. OCLC 4498269.
^ Perticaroli S, Nickels JD, Ehlers G, O'Neill H, Zhang Q, Sokolov AP (octubre de 2013). "Estructura secundaria y rigidez en proteínas modelo". Materia Blanda . 9 (40): 9548–56. Código Bib : 2013SMat....9.9548P. doi :10.1039/C3SM50807B. PMID 26029761.
^ Perticaroli S, Nickels JD, Ehlers G, Sokolov AP (junio de 2014). "Rigidez, estructura secundaria y universalidad del pico del bosón en las proteínas". Revista Biofísica . 106 (12): 2667–74. Código Bib : 2014BpJ...106.2667P. doi :10.1016/j.bpj.2014.05.009. PMC 4070067 . PMID 24940784.
^ Nickels JD, Perticaroli S, O'Neill H, Zhang Q, Ehlers G, Sokolov AP (2013). "Dispersión coherente de neutrones y dinámica colectiva en la proteína GFP". Biofísica. J. 105 (9): 2182–87. Código Bib : 2013BpJ...105.2182N. doi :10.1016/j.bpj.2013.09.029. PMC 3824694 . PMID 24209864.
^ Kabsch W, Sander C (diciembre de 1983). "Diccionario de estructura secundaria de proteínas: reconocimiento de patrones de características geométricas y de enlaces de hidrógeno". Biopolímeros . 22 (12): 2577–637. doi :10.1002/bip.360221211. PMID 6667333. S2CID 29185760.
^ Richards FM, Kundrot CE (1988). "Identificación de motivos estructurales a partir de datos de coordenadas de proteínas: estructura secundaria y estructura supersecundaria de primer nivel". Proteínas . 3 (2): 71–84. doi : 10.1002/prot.340030202. PMID 3399495. S2CID 29126855.
^ Frishman D, Argos P (diciembre de 1995). "Asignación de estructura secundaria de proteínas basada en el conocimiento" (PDF) . Proteínas . 23 (4): 566–79. CiteSeerX 10.1.1.132.9420 . doi : 10.1002/prot.340230412. PMID 8749853. S2CID 17487756. Archivado desde el original (PDF) el 13 de junio de 2010.
^ Calligari PA, Kneller GR (diciembre de 2012). "ScrewFit: combinación de localización y descripción de la estructura secundaria de proteínas". Acta Crystallographica Sección D. 68 (parte 12): 1690–3. doi :10.1107/s0907444912039029. PMID 23151634.
^ ab Konagurthu AS, Lesk AM, Allison L (junio de 2012). "Inferencia de longitud mínima de mensaje de estructura secundaria a partir de datos de coordenadas de proteínas". Bioinformática . 28 (12): i97-i105. doi : 10.1093/bioinformática/bts223. PMC 3371855 . PMID 22689785.
^ "Servidor web SST" . Consultado el 17 de abril de 2018 .
^ Pelton JT, McLean LR (2000). "Métodos espectroscópicos para el análisis de la estructura secundaria de proteínas". Anal. Bioquímica . 277 (2): 167–76. doi :10.1006/abio.1999.4320. PMID 10625503.
^ Meiler J, panadero D (2003). "Determinación rápida del pliegue de proteínas utilizando datos de RMN no asignados". Proc. Nacional. Acad. Ciencia. EE.UU . 100 (26): 15404–09. Código Bib : 2003PNAS..10015404M. doi : 10.1073/pnas.2434121100 . PMC 307580 . PMID 14668443.
^ Chou PY, Fasman GD (enero de 1974). "Predicción de la conformación de proteínas". Bioquímica . 13 (2): 222–45. doi :10.1021/bi00699a002. PMID 4358940.
^ Chou PY, Fasman GD (1978). "Predicciones empíricas de la conformación de la proteína". Revista Anual de Bioquímica . 47 : 251–76. doi : 10.1146/annurev.bi.47.070178.001343. PMID 354496.
^ Chou PY, Fasman GD (1978). "Predicción de la estructura secundaria de proteínas a partir de su secuencia de aminoácidos". Avances en Enzimología y Áreas Afines de la Biología Molecular . Avances en enzimología y áreas relacionadas de la biología molecular. vol. 47. págs. 45-148. doi :10.1002/9780470122921.ch2. ISBN 9780470122921. PMID 364941.
^ Garnier J, Osguthorpe DJ, Robson B (marzo de 1978). "Análisis de la precisión e implicaciones de métodos simples para predecir la estructura secundaria de proteínas globulares". Revista de biología molecular . 120 (1): 97–120. doi :10.1016/0022-2836(78)90297-8. PMID 642007.
^ Kabsch W, Sander C (mayo de 1983). "¿Qué tan buenas son las predicciones de la estructura secundaria de las proteínas?". Cartas FEBS . 155 (2): 179–82. doi :10.1016/0014-5793(82)80597-8. PMID 6852232. S2CID 41477827.
^ ab Simossis VA, Heringa J (agosto de 2004). "Integración de la predicción de la estructura secundaria de proteínas y el alineamiento de secuencias múltiples". Ciencia actual de proteínas y péptidos . 5 (4): 249–66. doi :10.2174/1389203043379675. PMID 15320732.
^ Pirovano W, Heringa J (2010). "Predicción de la estructura secundaria de proteínas". Técnicas de minería de datos para las ciencias biológicas . Métodos en biología molecular. vol. 609, págs. 327–48. doi :10.1007/978-1-60327-241-4_19. ISBN 978-1-60327-240-7. PMID 20221928.
^ Karplus K (2009). "SAM-T08, predicción de la estructura de proteínas basada en HMM". Ácidos nucleicos Res . 37 (problema del servidor web): W492–97. doi :10.1093/nar/gkp403. PMC 2703928 . PMID 19483096.
^ Pollastri G, McLysaght A (2005). "Porter: un servidor nuevo y preciso para la predicción de la estructura secundaria de proteínas". Bioinformática . 21 (8): 1719–20. doi : 10.1093/bioinformática/bti203 . hdl : 2262/39594 . PMID 15585524.
^ Yachdav G, Kloppmann E, Kajan L, Hecht M, Goldberg T, Hamp T, Hönigschmid P, Schafferhans A, Roos M, Bernhofer M, Richter L, Ashkenazy H, Punta M, Schlessinger A, Bromberg Y, Schneider R, Vriend G, Sander C, Ben-Tal N, Rost B (2014). "PredictProtein: un recurso abierto para la predicción en línea de características estructurales y funcionales de proteínas". Ácidos nucleicos Res . 42 (problema del servidor web): W337–43. doi : 10.1093/nar/gku366. PMC 4086098 . PMID 24799431.
^ Adamczak R, Porollo A, Meller J (2005). "Combinación de predicción de estructura secundaria y accesibilidad a disolventes en proteínas". Proteínas . 59 (3): 467–75. doi :10.1002/prot.20441. PMID 15768403. S2CID 13267624.
^ Kihara D (agosto de 2005). "El efecto de las interacciones de largo alcance en la formación de estructuras secundarias de proteínas". Ciencia de las proteínas . 14 (8): 1955–963. doi : 10.1110/ps.051479505. PMC 2279307 . PMID 15987894.
^ Qi Y, Grishin NV (2005). "Clasificación estructural de proteínas plegadas similares a tiorredoxinas" (PDF) . Proteínas . 58 (2): 376–88. CiteSeerX 10.1.1.644.8150 . doi :10.1002/prot.20329. PMID 15558583. S2CID 823339. Dado que la definición de pliegue debe incluir solo los elementos estructurales secundarios centrales que están presentes en la mayoría de los homólogos, definimos el pliegue similar a tiorredoxina como un sándwich α/β de dos capas con el patrón de estructura secundaria βαβββα. .
^ Abrusán G, Marsh JA (diciembre de 2016). "Las hélices alfa son más resistentes a las mutaciones que las hebras beta". PLOS Biología Computacional . 12 (12): e1005242. Código Bib : 2016PLSCB..12E5242A. doi : 10.1371/journal.pcbi.1005242 . PMC 5147804 . PMID 27935949.
^ Rocklin GJ, Chidyausiku TM, Goreshnik I, Ford A, Houliston S, Lemak A, et al. (julio de 2017). "Análisis global del plegamiento de proteínas mediante diseño, síntesis y pruebas masivamente paralelos". Ciencia . 357 (6347): 168–175. Código Bib : 2017 Ciencia... 357..168R. doi : 10.1126/ciencia.aan0693. PMC 5568797 . PMID 28706065.

Otras lecturas

Branden C, Tooze J (1999). Introducción a la estructura de las proteínas (2ª ed.). Nueva York: Garland Science. ISBN 978-0815323051.
Pauling L , Corey RB (1951). "Configuraciones de cadenas polipeptídicas con orientaciones favorecidas alrededor de enlaces simples: dos nuevas láminas plisadas". Proc. Nacional. Acad. Ciencia. EE.UU . 37 (11): 729–40. Código bibliográfico : 1951PNAS...37..729P. doi : 10.1073/pnas.37.11.729 . PMC 1063460 . PMID 16578412.(El artículo original sobre la conformación de la hoja beta).
Pauling L , Corey RB , Branson HR (1951). "La estructura de las proteínas; dos configuraciones helicoidales de la cadena polipeptídica unidas por enlaces de hidrógeno". Proc. Nacional. Acad. Ciencia. EE.UU . 37 (4): 205–11. Código bibliográfico : 1951PNAS...37..205P. doi : 10.1073/pnas.37.4.205 . PMC 1063337 . PMID 14816373.(Conformaciones de hélice alfa y pi, ya que predijeron que las hélices no serían posibles). ${\ Displaystyle 3_ {10}}$

enlaces externos

NetSurfP: predictor de accesibilidad de superficie y estructura secundaria
PROFE
Ajuste de tornillo
PSSpred Un programa de entrenamiento de redes neuronales múltiples para la predicción de estructuras secundarias de proteínas
Genesilico metaserver Metaserver que permite ejecutar más de 20 predictores de estructuras secundarias diferentes con un solo clic.
Servidor web SST: una asignación estructural secundaria teórica de la información (basada en compresión).