La estructura secundaria de la proteína es la conformación espacial local de la cadena principal del polipéptido excluyendo las cadenas laterales. [1] Los dos elementos estructurales secundarios más comunes son las hélices alfa y las láminas beta , aunque también se encuentran los giros beta y los bucles omega . Los elementos de estructura secundaria generalmente se forman espontáneamente como un intermediario antes de que la proteína se pliegue en su estructura terciaria tridimensional .
La estructura secundaria se define formalmente por el patrón de enlaces de hidrógeno entre los átomos de hidrógeno del amino y de oxígeno del carboxilo en la cadena principal del péptido . La estructura secundaria se puede definir alternativamente en función del patrón regular de ángulos diedros de la cadena principal en una región particular del diagrama de Ramachandran, independientemente de si tiene los enlaces de hidrógeno correctos.
El concepto de estructura secundaria fue introducido por primera vez por Kaj Ulrik Linderstrøm-Lang en Stanford en 1952. [2] [3] Otros tipos de biopolímeros como los ácidos nucleicos también poseen estructuras secundarias características .
Las estructuras secundarias más comunes son las hélices alfa y las láminas beta . Se calcula que otras hélices, como la hélice 3 10 y la hélice π , tienen patrones de enlaces de hidrógeno energéticamente favorables, pero rara vez se observan en proteínas naturales, excepto en los extremos de las hélices α debido al empaquetamiento desfavorable de la cadena principal en el centro de la hélice. Otras estructuras extendidas, como la hélice de poliprolina y la lámina alfa, son raras en las proteínas en estado nativo , pero a menudo se plantean como intermediarios importantes del plegamiento de proteínas . Los giros cerrados y los bucles sueltos y flexibles unen los elementos de la estructura secundaria más "regulares". La espiral aleatoria no es una verdadera estructura secundaria, pero es la clase de conformaciones que indican una ausencia de estructura secundaria regular.
Los aminoácidos varían en su capacidad para formar los diversos elementos de estructura secundaria. La prolina y la glicina a veces se conocen como "rompedores de hélice" porque alteran la regularidad de la conformación de la cadena principal helicoidal α; sin embargo, ambos tienen capacidades conformacionales inusuales y se encuentran comúnmente en turnos . Los aminoácidos que prefieren adoptar conformaciones helicoidales en proteínas incluyen metionina , alanina , leucina , glutamato y lisina ("MALEK" en códigos de aminoácidos de 1 letra); por el contrario, los grandes residuos aromáticos ( triptófano , tirosina y fenilalanina ) y los aminoácidos C β -ramificados ( isoleucina , valina y treonina ) prefieren adoptar conformaciones de cadena β . Sin embargo, estas preferencias no son lo suficientemente fuertes como para producir un método confiable para predecir la estructura secundaria a partir de la secuencia sola.
Se cree que las vibraciones colectivas de baja frecuencia son sensibles a la rigidez local dentro de las proteínas, lo que revela que las estructuras beta son genéricamente más rígidas que las proteínas alfa o desordenadas. [6] [7] Las mediciones de dispersión de neutrones han conectado directamente la característica espectral a ~1 THz con los movimientos colectivos de la estructura secundaria de la proteína de barril beta GFP. [8]
Los patrones de enlaces de hidrógeno en las estructuras secundarias pueden estar significativamente distorsionados, lo que dificulta la determinación automática de la estructura secundaria. Existen varios métodos para definir formalmente la estructura secundaria de las proteínas (por ejemplo, DSSP , [9] DEFINE, [10] STRIDE , [11] ScrewFit, [12] SST [13] ).
El Diccionario de Estructura Secundaria de Proteínas, abreviado DSSP, se utiliza comúnmente para describir la estructura secundaria de las proteínas con códigos de una sola letra. La estructura secundaria se asigna en función de los patrones de enlaces de hidrógeno, como los propuestos inicialmente por Pauling et al. en 1951 (antes de que se hubiera determinado experimentalmente ninguna estructura de proteínas ). Hay ocho tipos de estructura secundaria que define DSSP:
El término "bobina" se suele codificar como " " (espacio), C (bobina) o "–" (guión). Se requiere que las conformaciones de hélices (G, H e I) y de lámina tengan una longitud razonable. Esto significa que 2 residuos adyacentes en la estructura primaria deben formar el mismo patrón de enlaces de hidrógeno. Si el patrón de enlaces de hidrógeno de la hélice o de la lámina es demasiado corto, se designan como T o B, respectivamente. Existen otras categorías de asignación de estructura secundaria de proteínas (giros bruscos, bucles Omega , etc.), pero se utilizan con menos frecuencia.
La estructura secundaria se define por el enlace de hidrógeno , por lo que la definición exacta de un enlace de hidrógeno es fundamental. La definición estándar de enlace de hidrógeno para la estructura secundaria es la de DSSP , que es un modelo puramente electrostático. Asigna cargas de ± q 1 ≈ 0,42 e al carbono carbonílico y al oxígeno, respectivamente, y cargas de ± q 2 ≈ 0,20 e al hidrógeno y al nitrógeno de la amida, respectivamente. La energía electrostática es
Según la DSSP, existe un enlace de hidrógeno si y solo si E es menor que −0,5 kcal/mol (−2,1 kJ/mol). Aunque la fórmula de la DSSP es una aproximación relativamente rudimentaria de la energía física del enlace de hidrógeno, se acepta generalmente como una herramienta para definir la estructura secundaria.
La SST es un método bayesiano para asignar una estructura secundaria a los datos de coordenadas de proteínas utilizando el criterio de información de Shannon de inferencia de longitud mínima de mensaje ( MML ). La SST trata cualquier asignación de estructura secundaria como una hipótesis potencial que intenta explicar ( comprimir ) los datos de coordenadas de proteínas dados. La idea central es que la mejor asignación de estructura secundaria es la que puede explicar ( comprimir ) las coordenadas de una proteína dada de la manera más económica, vinculando así la inferencia de la estructura secundaria a la compresión de datos sin pérdida . La SST delinea con precisión cualquier cadena de proteínas en regiones asociadas con los siguientes tipos de asignación: [14]
SST detecta las tapas helicoidales π y 3 10 en hélices α estándar y ensambla automáticamente las distintas cadenas extendidas en láminas β plegadas uniformes. Proporciona una salida legible de elementos estructurales secundarios diseccionados y un script correspondiente cargable en PyMol para visualizar los elementos estructurales secundarios asignados individualmente.
El contenido aproximado de estructura secundaria de un biopolímero (por ejemplo, "esta proteína es 40% α-hélice y 20% β-lámina ") se puede estimar espectroscópicamente . [15] Para las proteínas, un método común es el dicroísmo circular ultravioleta lejano (UV lejano, 170-250 nm) . Un mínimo doble pronunciado a 208 y 222 nm indica una estructura α-helicoidal, mientras que un mínimo único a 204 nm o 217 nm refleja una estructura de bobina aleatoria o de lámina β, respectivamente. Un método menos común es la espectroscopia infrarroja , que detecta diferencias en las oscilaciones de enlace de los grupos amida debido a la unión de hidrógeno. Finalmente, los contenidos de estructura secundaria se pueden estimar con precisión utilizando los desplazamientos químicos de un espectro de RMN inicialmente no asignado . [16]
Predecir la estructura terciaria de una proteína únicamente a partir de su secuencia de aminoácidos es un problema muy desafiante (ver predicción de la estructura de una proteína ), pero usar definiciones de estructura secundaria más simples es más manejable.
Los primeros métodos de predicción de la estructura secundaria se limitaban a predecir los tres estados predominantes: hélice, lámina o espiral aleatoria. Estos métodos se basaban en las propensiones de formación de hélices o láminas de aminoácidos individuales, a veces acopladas con reglas para estimar la energía libre de los elementos de formación de la estructura secundaria. Las primeras técnicas ampliamente utilizadas para predecir la estructura secundaria de las proteínas a partir de la secuencia de aminoácidos fueron el método de Chou-Fasman [17] [18] [19] y el método GOR [20] . Aunque dichos métodos afirmaban alcanzar una precisión de aproximadamente el 60 % en la predicción de cuál de los tres estados (hélice/lámina/espiral) adopta un residuo, las evaluaciones de computación a ciegas mostraron posteriormente que la precisión real era mucho menor. [21]
Se logró un aumento significativo en la precisión (hasta casi ~80%) al explotar la alineación de secuencias múltiples ; conocer la distribución completa de los aminoácidos que se encuentran en una posición (y en sus proximidades, típicamente ~7 residuos a cada lado) a lo largo de la evolución proporciona una imagen mucho mejor de las tendencias estructurales cerca de esa posición. [22] [23] A modo de ilustración, una proteína dada podría tener una glicina en una posición dada, lo que por sí solo podría sugerir una espiral aleatoria allí. Sin embargo, la alineación de secuencias múltiples podría revelar que los aminoácidos que favorecen la hélice se encuentran en esa posición (y posiciones cercanas) en el 95% de las proteínas homólogas que abarcan casi mil millones de años de evolución. Además, al examinar la hidrofobicidad promedio en esa posición y posiciones cercanas, la misma alineación también podría sugerir un patrón de accesibilidad al solvente de residuos consistente con una hélice α. Tomados en conjunto, estos factores sugerirían que la glicina de la proteína original adopta una estructura de hélice α, en lugar de una espiral aleatoria. Se utilizan varios tipos de métodos para combinar todos los datos disponibles y formar una predicción de tres estados, incluidas las redes neuronales , los modelos ocultos de Markov y las máquinas de vectores de soporte . Los métodos de predicción modernos también proporcionan una puntuación de confianza para sus predicciones en cada posición.
Los métodos de predicción de estructura secundaria se evaluaron mediante experimentos de Evaluación crítica de la predicción de la estructura de proteínas (CASP) y se compararon continuamente, por ejemplo, con EVA (referencia) . Con base en estas pruebas, los métodos más precisos fueron Psipred , SAM, [24] PORTER, [25] PROF, [26] y SABLE. [27] El área principal de mejora parece ser la predicción de cadenas β; es probable que los residuos predichos con confianza como cadenas β lo sean, pero los métodos tienden a pasar por alto algunos segmentos de cadenas β (falsos negativos). Es probable que haya un límite superior de ~90% de precisión de predicción en general, debido a las idiosincrasias del método estándar ( DSSP ) para asignar clases de estructura secundaria (hélice/cadena/bobina) a las estructuras PDB, contra las cuales se comparan las predicciones. [28]
La predicción precisa de la estructura secundaria es un elemento clave en la predicción de la estructura terciaria , en todos los casos excepto en los más simples ( modelado por homología ). Por ejemplo, un patrón predicho con seguridad de seis elementos de estructura secundaria βαββαβ es la firma de un pliegue de ferredoxina . [29]
Tanto las estructuras secundarias de proteínas como las de ácidos nucleicos pueden utilizarse para facilitar el alineamiento de múltiples secuencias . Estos alineamientos pueden hacerse más precisos mediante la inclusión de información de estructura secundaria además de información de secuencia simple. Esto a veces es menos útil en el ARN porque el apareamiento de bases está mucho más conservado que la secuencia. Las relaciones distantes entre proteínas cuyas estructuras primarias no se pueden alinear a veces se pueden encontrar mediante la estructura secundaria. [22]
Se ha demostrado que las hélices α son más estables, resistentes a las mutaciones y más fáciles de diseñar que las cadenas β en las proteínas naturales, [30] por lo que diseñar proteínas α funcionales es probablemente más fácil que diseñar proteínas con hélices y cadenas; esto se ha confirmado experimentalmente recientemente. [31]
Ya había introducido los conceptos de la estructura primaria, secundaria y terciaria de las proteínas en la tercera conferencia Lane (Linderstram-Lang, 1952).
Dado que la definición de pliegue debe incluir solo los elementos estructurales secundarios centrales que están presentes en la mayoría de los homólogos, definimos el pliegue similar a la tiorredoxina como un sándwich α/β de dos capas con el patrón de estructura secundaria βαβββα.