La estructura secundaria de la proteína es la conformación espacial local del esqueleto polipeptídico excluyendo las cadenas laterales. [1] Los dos elementos estructurales secundarios más comunes son las hélices alfa y las láminas beta , aunque también se producen giros beta y bucles omega . Los elementos de la estructura secundaria normalmente se forman espontáneamente como intermediarios antes de que la proteína se pliegue en su estructura terciaria tridimensional .
La estructura secundaria se define formalmente por el patrón de enlaces de hidrógeno entre los átomos de hidrógeno amino y oxígeno carboxilo en la cadena principal del péptido . Alternativamente, la estructura secundaria se puede definir basándose en el patrón regular de los ángulos diédricos de la columna vertebral en una región particular del gráfico de Ramachandran, independientemente de si tiene los enlaces de hidrógeno correctos.
El concepto de estructura secundaria fue introducido por primera vez por Kaj Ulrik Linderstrøm-Lang en Stanford en 1952. [2] [3] Otros tipos de biopolímeros , como los ácidos nucleicos, también poseen estructuras secundarias características .
Las estructuras secundarias más comunes son las hélices alfa y las láminas beta . Se calcula que otras hélices, como la hélice 3 10 y la hélice π , tienen patrones de enlaces de hidrógeno energéticamente favorables, pero rara vez se observan en proteínas naturales, excepto en los extremos de las hélices α debido al empaquetamiento desfavorable de la columna vertebral en el centro de la hélice. Otras estructuras extendidas, como la hélice de poliprolina y la lámina alfa , son raras en las proteínas en estado nativo , pero a menudo se plantean la hipótesis de que son importantes intermediarios del plegamiento de proteínas . Giros cerrados y bucles sueltos y flexibles unen los elementos de la estructura secundaria más "regulares". La bobina aleatoria no es una verdadera estructura secundaria, sino que es la clase de conformaciones que indican una ausencia de estructura secundaria regular.
Los aminoácidos varían en su capacidad para formar los diversos elementos de la estructura secundaria. La prolina y la glicina a veces se conocen como "rompedores de hélices" porque alteran la regularidad de la conformación del esqueleto helicoidal α; sin embargo, ambos tienen habilidades conformacionales inusuales y comúnmente se encuentran por turnos . Los aminoácidos que prefieren adoptar conformaciones helicoidales en las proteínas incluyen metionina , alanina , leucina , glutamato y lisina ("MALEK" en códigos de aminoácidos de 1 letra); por el contrario, los residuos aromáticos grandes ( triptófano , tirosina y fenilalanina ) y los aminoácidos ramificados en C β ( isoleucina , valina y treonina ) prefieren adoptar conformaciones de cadena β . Sin embargo, estas preferencias no son lo suficientemente fuertes como para producir un método confiable para predecir la estructura secundaria a partir de la secuencia únicamente.
Se cree que las vibraciones colectivas de baja frecuencia son sensibles a la rigidez local dentro de las proteínas, lo que revela que las estructuras beta son genéricamente más rígidas que las proteínas alfa o desordenadas. [6] [7] Las mediciones de dispersión de neutrones han conectado directamente la característica espectral a ~1 THz con los movimientos colectivos de la estructura secundaria de la proteína de barril beta GFP. [8]
Los patrones de enlaces de hidrógeno en estructuras secundarias pueden estar significativamente distorsionados, lo que dificulta la determinación automática de la estructura secundaria. Existen varios métodos para definir formalmente la estructura secundaria de la proteína (por ejemplo, DSSP , [9] DEFINE, [10] STRIDE , [11] ScrewFit, [12] SST [13] ).
El Diccionario de estructura secundaria de proteínas, abreviado DSSP, se utiliza habitualmente para describir la estructura secundaria de proteínas con códigos de una sola letra. La estructura secundaria se asigna en base a patrones de enlaces de hidrógeno como los propuestos inicialmente por Pauling et al. en 1951 (antes de que se hubiera determinado experimentalmente alguna estructura proteica ). Hay ocho tipos de estructura secundaria que define DSSP:
'Bobina' a menudo se codifica como ' ' (espacio), C (bobina) o '–' (guión). Se requiere que las hélices (G, H e I) y las conformaciones de las láminas tengan una longitud razonable. Esto significa que 2 residuos adyacentes en la estructura primaria deben formar el mismo patrón de enlaces de hidrógeno. Si el patrón de enlaces de hidrógeno en hélice o lámina es demasiado corto, se denominan T o B, respectivamente. Existen otras categorías de asignación de estructuras secundarias de proteínas (giros cerrados, bucles Omega , etc.), pero se utilizan con menos frecuencia.
La estructura secundaria se define mediante enlaces de hidrógeno , por lo que la definición exacta de un enlace de hidrógeno es fundamental. La definición estándar de enlace de hidrógeno para estructura secundaria es la de DSSP , que es un modelo puramente electrostático. Asigna cargas de ± q 1 ≈ 0,42 e al carbono carbonilo y al oxígeno, respectivamente, y cargas de ± q 2 ≈ 0,20 e a la amida de hidrógeno y nitrógeno, respectivamente. La energía electrostática es
Según DSSP, existe un enlace de hidrógeno si y sólo si E es menor que −0,5 kcal/mol (−2,1 kJ/mol). Aunque la fórmula DSSP es una aproximación relativamente burda de la energía física del enlace de hidrógeno, generalmente se acepta como una herramienta para definir la estructura secundaria.
SST es un método bayesiano para asignar estructura secundaria a datos de coordenadas de proteínas utilizando el criterio de información de Shannon de inferencia de longitud mínima de mensaje ( MML ). SST trata cualquier asignación de estructura secundaria como una hipótesis potencial que intenta explicar ( comprimir ) datos de coordenadas de proteínas dadas. La idea central es que la mejor asignación estructural secundaria es aquella que puede explicar ( comprimir ) las coordenadas de una proteína determinada de la manera más económica, vinculando así la inferencia de la estructura secundaria con la compresión de datos sin pérdidas . SST delimita con precisión cualquier cadena proteica en regiones asociadas con los siguientes tipos de asignación: [14]
SST detecta tapas de hélices π y 3 10 en hélices α estándar y ensambla automáticamente las distintas hebras extendidas en láminas plisadas β consistentes. Proporciona una salida legible de elementos estructurales secundarios disecados y un script correspondiente cargable en PyMol para visualizar los elementos estructurales secundarios asignados individualmente.
El contenido aproximado de estructura secundaria de un biopolímero (por ejemplo, "esta proteína es 40% de hélice α y 20% de hoja β ") se puede estimar espectroscópicamente . [15] Para las proteínas, un método común es el dicroísmo circular ultravioleta lejano (UV lejano, 170–250 nm) . Un mínimo doble pronunciado a 208 y 222 nm indica una estructura de hélice α, mientras que un mínimo único a 204 nm o 217 nm refleja una estructura de bobina aleatoria o de lámina β, respectivamente. Un método menos común es la espectroscopia infrarroja , que detecta diferencias en las oscilaciones de los enlaces de los grupos amida debido a los enlaces de hidrógeno. Finalmente, el contenido de la estructura secundaria se puede estimar con precisión utilizando los cambios químicos de un espectro de RMN inicialmente no asignado . [dieciséis]
Predecir la estructura terciaria de una proteína a partir únicamente de su secuencia de aminoácidos es un problema muy desafiante (ver predicción de la estructura de la proteína ), pero usar definiciones de estructura secundaria más simples es más manejable.
Los primeros métodos de predicción de estructuras secundarias se limitaban a predecir los tres estados predominantes: hélice, lámina o espiral aleatoria. Estos métodos se basaban en las propensiones a formar hélices o láminas de aminoácidos individuales, a veces junto con reglas para estimar la energía libre de formación de elementos de estructura secundaria. Las primeras técnicas ampliamente utilizadas para predecir la estructura secundaria de proteínas a partir de la secuencia de aminoácidos fueron el método Chou-Fasman [17] [18] [19] y el método GOR . [20] Aunque dichos métodos afirmaban lograr una precisión de ~60 % en la predicción de cuál de los tres estados (hélice/hoja/bobina) adopta un residuo, las evaluaciones informáticas ciegas demostraron posteriormente que la precisión real era mucho menor. [21]
Se logró un aumento significativo en la precisión (hasta casi ~80%) mediante la explotación del alineamiento de secuencias múltiples ; conocer la distribución completa de los aminoácidos que se producen en una posición (y en sus proximidades, normalmente ~7 residuos en cada lado) a lo largo de la evolución proporciona una imagen mucho mejor de las tendencias estructurales cerca de esa posición. [22] [23] A modo de ilustración, una proteína determinada podría tener una glicina en una posición determinada, lo que por sí solo podría sugerir una espiral aleatoria allí. Sin embargo, el alineamiento de secuencias múltiples podría revelar que los aminoácidos que favorecen la hélice se encuentran en esa posición (y en posiciones cercanas) en el 95% de las proteínas homólogas que abarcan casi mil millones de años de evolución. Además, al examinar la hidrofobicidad promedio en esa posición y en las cercanas, la misma alineación también podría sugerir un patrón de accesibilidad al solvente residual consistente con una hélice α. En conjunto, estos factores sugerirían que la glicina de la proteína original adopta una estructura de hélice α, en lugar de una espiral aleatoria. Se utilizan varios tipos de métodos para combinar todos los datos disponibles para formar una predicción de 3 estados, incluidas redes neuronales , modelos ocultos de Markov y máquinas de vectores de soporte . Los métodos de predicción modernos también proporcionan una puntuación de confianza para sus predicciones en cada posición.
Los métodos de predicción de la estructura secundaria se evaluaron mediante experimentos de Evaluación Crítica de Predicción de la Estructura de las Proteínas (CASP) y se compararon continuamente, por ejemplo, mediante EVA (punto de referencia) . Con base en estas pruebas, los métodos más precisos fueron Psipred , SAM, [24] PORTER, [25] PROF, [26] y SABLE. [27] El principal área de mejora parece ser la predicción de las cadenas β; es probable que los residuos predichos con seguridad como cadena β lo sean, pero los métodos tienden a pasar por alto algunos segmentos de cadena β (falsos negativos). Es probable que exista un límite superior de ~90 % de precisión de predicción en general, debido a las idiosincrasias del método estándar ( DSSP ) para asignar clases de estructura secundaria (hélice/hebra/bobina) a las estructuras PDB, con las que se comparan las predicciones. [28]
La predicción precisa de la estructura secundaria es un elemento clave en la predicción de la estructura terciaria , en todos los casos excepto en los más simples ( modelado de homología ). Por ejemplo, un patrón predicho con seguridad de seis elementos de estructura secundaria βαββαβ es la firma de un pliegue de ferredoxina . [29]
Se pueden utilizar estructuras secundarias tanto de proteínas como de ácidos nucleicos para ayudar en el alineamiento de múltiples secuencias . Estas alineaciones pueden hacerse más precisas mediante la inclusión de información de estructura secundaria además de información de secuencia simple. A veces, esto es menos útil en el ARN porque el emparejamiento de bases está mucho más conservado que la secuencia. Las relaciones distantes entre proteínas cuyas estructuras primarias no son alineables a veces pueden encontrarse mediante estructuras secundarias. [22]
Se ha demostrado que las hélices α son más estables, resistentes a las mutaciones y diseñables que las hebras β en las proteínas naturales, [30] por lo que es probable que diseñar proteínas totalmente α funcionales sea más fácil que diseñar proteínas con hélices y hebras; esto ha sido confirmado recientemente experimentalmente. [31]
Ya había introducido los conceptos de estructura primaria, secundaria y terciaria de las proteínas en la tercera conferencia Lane (Linderstram-Lang, 1952).
Dado que la definición de pliegue debe incluir solo los elementos estructurales secundarios centrales que están presentes en la mayoría de los homólogos, definimos el pliegue similar a tiorredoxina como un sándwich α/β de dos capas con el patrón de estructura secundaria βαβββα. .