El plegamiento de proteínas es el proceso físico mediante el cual una proteína , después de ser sintetizada por un ribosoma como una cadena lineal de aminoácidos , cambia de una espiral aleatoria inestable a una estructura tridimensional más ordenada . Esta estructura permite que la proteína se vuelva biológicamente funcional. [1]
El plegamiento de muchas proteínas comienza incluso durante la traducción de la cadena polipeptídica. Los aminoácidos interactúan entre sí para producir una estructura tridimensional bien definida, conocida como estado nativo de la proteína . Esta estructura está determinada por la secuencia de aminoácidos o estructura primaria . [2]
La estructura tridimensional correcta es esencial para el funcionamiento, aunque algunas partes de las proteínas funcionales pueden permanecer desplegadas , [3] lo que indica que la dinámica de las proteínas es importante. La imposibilidad de plegarse en una estructura nativa generalmente produce proteínas inactivas, pero en algunos casos, las proteínas mal plegadas tienen una funcionalidad modificada o tóxica. Se cree que varias enfermedades neurodegenerativas y de otro tipo son el resultado de la acumulación de fibrillas de amiloide formadas por proteínas mal plegadas, cuyas variedades infecciosas se conocen como priones . [4] Muchas alergias son causadas por el plegamiento incorrecto de algunas proteínas porque el sistema inmunológico no produce anticuerpos para ciertas estructuras proteicas. [5]
La desnaturalización de proteínas es un proceso de transición de un estado plegado a uno desplegado . Sucede en la cocina , quemaduras , proteinopatías y otros contextos. La estructura residual presente, si la hay, en el estado supuestamente desplegado puede formar un sitio de inicio del plegado y guiar las reacciones de plegado posteriores. [6]
La duración del proceso de plegamiento varía drásticamente según la proteína de interés. Cuando se estudian fuera de la célula , las proteínas de plegamiento más lento requieren muchos minutos u horas para plegarse, principalmente debido a la isomerización de la prolina , y deben pasar por una serie de estados intermedios, como puntos de control, antes de que se complete el proceso. [7] Por otro lado, las proteínas muy pequeñas de un solo dominio con longitudes de hasta cien aminoácidos generalmente se pliegan en un solo paso. [8] Las escalas de tiempo de milisegundos son la norma, y las reacciones de plegamiento de proteínas más rápidas conocidas se completan en unos pocos microsegundos. [9] La escala de tiempo de plegamiento de una proteína depende de su tamaño, orden de contacto y topología del circuito . [10]
Comprender y simular el proceso de plegamiento de proteínas ha sido un desafío importante para la biología computacional desde finales de los años 1960.
La estructura primaria de una proteína, su secuencia lineal de aminoácidos, determina su conformación nativa. [11] Los residuos de aminoácidos específicos y su posición en la cadena polipeptídica son los factores determinantes para qué porciones de la proteína se pliegan estrechamente entre sí y forman su conformación tridimensional. La composición de aminoácidos no es tan importante como la secuencia. [12] Sin embargo, el hecho esencial del plegamiento sigue siendo que la secuencia de aminoácidos de cada proteína contiene la información que especifica tanto la estructura nativa como la vía para alcanzar ese estado. Esto no quiere decir que secuencias de aminoácidos casi idénticas siempre se pliegan de manera similar. [13] Las conformaciones también difieren según factores ambientales; proteínas similares se pliegan de manera diferente según dónde se encuentran.
La formación de una estructura secundaria (Estructura secundaria de proteína) es el primer paso en el proceso de plegamiento que toma una proteína para asumir su estructura nativa. Característica de la estructura secundaria son las estructuras conocidas como hélices alfa y láminas beta que se pliegan rápidamente porque están estabilizadas por enlaces de hidrógeno intramoleculares , como fue caracterizado por primera vez por Linus Pauling . La formación de enlaces de hidrógeno intramoleculares proporciona otra contribución importante a la estabilidad de las proteínas. [14] Las hélices α se forman mediante enlaces de hidrógeno de la columna vertebral para formar una forma de espiral (consulte la figura de la derecha). [12] La hoja plisada β es una estructura que se forma cuando la columna vertebral se dobla sobre sí misma para formar enlaces de hidrógeno (como se muestra en la figura de la izquierda). Los enlaces de hidrógeno se encuentran entre el hidrógeno amida y el oxígeno carbonilo del enlace peptídico . Existen láminas plisadas β antiparalelas y láminas plisadas β paralelas donde la estabilidad de los enlaces de hidrógeno es más fuerte en la lámina β antiparalela, ya que se une con el ángulo ideal de 180 grados en comparación con los enlaces de hidrógeno inclinados formados por láminas paralelas. [12]
Las hélices α y las láminas β suelen ser anfipáticas, lo que significa que tienen una porción hidrófila y otra hidrófoba. Esta capacidad ayuda a formar la estructura terciaria de una proteína en la que se produce el plegamiento de modo que los lados hidrófilos miran al entorno acuoso que rodea la proteína y los lados hidrófobos miran al núcleo hidrófobo de la proteína. [15] La estructura secundaria da paso jerárquicamente a la formación de la estructura terciaria. Una vez que las interacciones hidrófobas forman y estabilizan la estructura terciaria de la proteína, también puede haber enlaces covalentes en forma de puentes disulfuro formados entre dos residuos de cisteína . Estos contactos covalentes y no covalentes adoptan una disposición topológica específica en una estructura nativa de una proteína. La estructura terciaria de una proteína implica una única cadena polipeptídica; sin embargo, interacciones adicionales de cadenas polipeptídicas plegadas dan lugar a la formación de estructuras cuaternarias. [16]
La estructura terciaria puede dar paso a la formación de estructura cuaternaria en algunas proteínas, lo que generalmente implica el "ensamblaje" o "coensamblaje" de subunidades que ya se han plegado; en otras palabras, múltiples cadenas polipeptídicas podrían interactuar para formar una proteína cuaternaria completamente funcional. [12]
El plegamiento es un proceso espontáneo que está guiado principalmente por interacciones hidrófobas, formación de enlaces de hidrógeno intramoleculares , fuerzas de van der Waals y se opone a la entropía conformacional . [17] El proceso de plegamiento a menudo comienza de forma cotraduccional , de modo que el extremo N de la proteína comienza a plegarse mientras el ribosoma todavía sintetiza la porción C-terminal de la proteína ; sin embargo, una molécula de proteína puede plegarse espontáneamente durante o después de la biosíntesis . [18] Si bien se puede considerar que estas macromoléculas " se pliegan a sí mismas ", el proceso también depende del disolvente ( agua o bicapa lipídica ), [19] de la concentración de sales , del pH , de la temperatura , de la posible presencia de cofactores y de chaperonas moleculares .
Las proteínas tendrán limitaciones en su capacidad de plegado debido a los ángulos de flexión restringidos o las conformaciones que son posibles. Estos ángulos permitidos de plegamiento de proteínas se describen con un gráfico bidimensional conocido como gráfico de Ramachandran , representado con ángulos psi y phi de rotación permitida. [20]
El plegamiento de proteínas debe ser termodinámicamente favorable dentro de una célula para que sea una reacción espontánea. Dado que se sabe que el plegamiento de proteínas es una reacción espontánea, entonces debe asumir un valor de energía libre de Gibbs negativo. La energía libre de Gibbs en el plegamiento de proteínas está directamente relacionada con la entalpía y la entropía . [12] Para que surja un delta G negativo y para que el plegamiento de proteínas se vuelva termodinámicamente favorable, entonces la entalpía, la entropía o ambos términos deben ser favorables.
Minimizar el número de cadenas laterales hidrófobas expuestas al agua es una fuerza impulsora importante detrás del proceso de plegado. [21] El efecto hidrofóbico es el fenómeno en el que las cadenas hidrofóbicas de una proteína colapsan en el núcleo de la proteína (lejos del entorno hidrofílico). [12] En un ambiente acuoso, las moléculas de agua tienden a agregarse alrededor de las regiones hidrofóbicas o cadenas laterales de la proteína, creando capas de agua de moléculas de agua ordenadas. [22] Un ordenamiento de las moléculas de agua alrededor de una región hidrófoba aumenta el orden en un sistema y, por lo tanto, contribuye a un cambio negativo en la entropía (menos entropía en el sistema). Las moléculas de agua están fijadas en estas jaulas de agua, lo que provoca el colapso hidrofóbico o el plegamiento hacia adentro de los grupos hidrofóbicos. El colapso hidrofóbico introduce entropía nuevamente en el sistema a través de la ruptura de las jaulas de agua, lo que libera las moléculas de agua ordenadas. [12] La multitud de grupos hidrófobos que interactúan dentro del núcleo de la proteína plegada globular contribuye en gran medida a la estabilidad de la proteína después del plegamiento, debido a las fuerzas de van der Waals enormemente acumuladas (específicamente las fuerzas de dispersión de London ). [12] El efecto hidrofóbico existe como fuerza impulsora en termodinámica sólo si existe la presencia de un medio acuoso con una molécula anfifílica que contiene una gran región hidrofóbica. [23] La fuerza de los enlaces de hidrógeno depende de su entorno; por tanto, los enlaces de H envueltos en un núcleo hidrófobo contribuyen más a la estabilidad del estado nativo que los enlaces de H expuestos al entorno acuoso. [24]
En las proteínas con pliegues globulares, los aminoácidos hidrofóbicos tienden a intercalarse a lo largo de la secuencia primaria, en lugar de distribuirse aleatoriamente o agruparse. [25] [26] Sin embargo, las proteínas que han nacido recientemente de novo , que tienden a estar intrínsecamente desordenadas , [27] [28] muestran el patrón opuesto de agrupación de aminoácidos hidrofóbicos a lo largo de la secuencia primaria. [29]
Las chaperonas moleculares son una clase de proteínas que ayudan en el plegamiento correcto de otras proteínas in vivo . Las chaperonas existen en todos los compartimentos celulares e interactúan con la cadena polipeptídica para permitir que se forme la conformación tridimensional nativa de la proteína; sin embargo, las chaperonas en sí no están incluidas en la estructura final de la proteína a la que ayudan. [30] Las chaperonas pueden ayudar al plegamiento incluso cuando el polipéptido naciente está siendo sintetizado por el ribosoma. [31] Las chaperonas moleculares funcionan uniéndose para estabilizar una estructura que de otro modo sería inestable de una proteína en su vía de plegamiento, pero las chaperonas no contienen la información necesaria para conocer la estructura nativa correcta de la proteína a la que ayudan; más bien, los acompañantes funcionan evitando conformaciones de plegado incorrectas. [31] De esta manera, los acompañantes en realidad no aumentan la tasa de pasos individuales involucrados en la ruta de plegado hacia la estructura nativa; en cambio, funcionan reduciendo posibles agregaciones no deseadas de la cadena polipeptídica que de otro modo podrían ralentizar la búsqueda del intermediario adecuado y proporcionan una vía más eficiente para que la cadena polipeptídica asuma las conformaciones correctas. [30] Las chaperonas no deben confundirse con las proteínas catalizadoras del plegamiento , que catalizan reacciones químicas responsables de pasos lentos en las vías de plegamiento. Ejemplos de catalizadores de plegamiento son isomerasas disulfuro de proteínas y isomerasas peptidil-prolil que pueden estar involucradas en la formación de enlaces disulfuro o la interconversión entre estereoisómeros cis y trans de un grupo peptídico. [31] Se ha demostrado que las chaperonas son fundamentales en el proceso de plegamiento de proteínas in vivo porque proporcionan a la proteína la ayuda necesaria para asumir sus alineamientos y conformaciones adecuadas de manera suficientemente eficiente como para volverse "biológicamente relevantes". [32] Esto significa que, en teoría, la cadena polipeptídica podría plegarse en su estructura nativa sin la ayuda de chaperonas, como lo demuestran los experimentos de plegamiento de proteínas realizados in vitro ; [32] sin embargo, este proceso demuestra ser demasiado ineficiente o demasiado lento para existir en sistemas biológicos; por lo tanto, las chaperonas son necesarias para el plegamiento de proteínas in vivo. Además de su función de ayudar a la formación de estructuras nativas, se ha demostrado que las chaperonas participan en diversas funciones, como el transporte y la degradación de proteínas, e incluso permiten que las proteínas desnaturalizadas expuestas a ciertos factores desnaturalizantes externos tengan la oportunidad de replegarse en sus estructuras nativas correctas. [33]
Una proteína completamente desnaturalizada carece de estructura terciaria y secundaria y existe como una denominada espiral aleatoria . En determinadas condiciones, algunas proteínas pueden replegarse; sin embargo, en muchos casos, la desnaturalización es irreversible. [34] Las células a veces protegen sus proteínas contra la influencia desnaturalizante del calor con enzimas conocidas como proteínas de choque térmico (un tipo de chaperona), que ayudan a otras proteínas tanto a plegarse como a permanecer plegadas. Se han encontrado proteínas de choque térmico en todas las especies examinadas, desde bacterias hasta humanos, lo que sugiere que evolucionaron muy temprano y tienen una función importante. Algunas proteínas nunca se pliegan en las células excepto con la ayuda de chaperonas que aíslan proteínas individuales para que su plegamiento no se vea interrumpido por interacciones con otras proteínas o ayudan a desplegar proteínas mal plegadas, permitiéndoles replegarse en la estructura nativa correcta. [35] Esta función es crucial para prevenir el riesgo de precipitación en agregados amorfos insolubles . Los factores externos involucrados en la desnaturalización de proteínas o la alteración del estado nativo incluyen la temperatura, los campos externos (eléctricos, magnéticos), [36] el hacinamiento molecular, [37] e incluso la limitación del espacio (es decir, el confinamiento), que puede tener una gran influencia. sobre el plegamiento de proteínas. [38] Las altas concentraciones de solutos , los extremos de pH , las fuerzas mecánicas y la presencia de desnaturalizantes químicos también pueden contribuir a la desnaturalización de las proteínas. Estos factores individuales se clasifican juntos como tensiones. Se ha demostrado que las chaperonas existen en concentraciones cada vez mayores durante momentos de estrés celular y ayudan al plegamiento adecuado de las proteínas emergentes, así como de las desnaturalizadas o mal plegadas. [30]
En algunas condiciones, las proteínas no se pliegan en sus formas bioquímicamente funcionales. Las temperaturas por encima o por debajo del rango en el que las células tienden a vivir harán que las proteínas térmicamente inestables se desplieguen o desnaturalicen (esta es la razón por la que la ebullición hace que la clara de huevo se vuelva opaca). Sin embargo, la estabilidad térmica de las proteínas está lejos de ser constante; por ejemplo, se ha descubierto que las bacterias hipertermófilas crecen a temperaturas de hasta 122 °C, [39] lo que, por supuesto, requiere que su complemento completo de proteínas vitales y conjuntos de proteínas sea estable a esa temperatura o más.
La bacteria E. coli es el huésped del bacteriófago T4 , y la proteína gp31 codificada por el fago ( P17313 ) parece ser estructural y funcionalmente homóloga a la proteína chaperona GroES de E. coli y capaz de sustituirla en el ensamblaje de partículas del virus del bacteriófago T4 durante infección. [40] Al igual que GroES, gp31 forma un complejo estable con la chaperonina GroEL que es absolutamente necesaria para el plegamiento y ensamblaje in vivo de la proteína gp23 de la cápsida principal del bacteriófago T4. [40]
Algunas proteínas tienen múltiples estructuras nativas y cambian su pliegue en función de algunos factores externos. Por ejemplo, los interruptores de proteína KaiB se pliegan a lo largo del día , actuando como un reloj para las cianobacterias. Se ha estimado que alrededor del 0,5 al 4% de las proteínas PDB ( Banco de datos de proteínas ) cambian de pliegue. [41]
Se considera que una proteína está mal plegada si no puede alcanzar su estado nativo normal. Esto puede deberse a mutaciones en la secuencia de aminoácidos o a una alteración del proceso de plegamiento normal por factores externos. [42] La proteína mal plegada normalmente contiene láminas β que están organizadas en una disposición supramolecular conocida como estructura β cruzada. Estos conjuntos ricos en láminas β son muy estables, muy insolubles y generalmente resistentes a la proteólisis. [43] La estabilidad estructural de estos conjuntos fibrilares es causada por extensas interacciones entre los monómeros de proteínas, formados por enlaces de hidrógeno entre sus cadenas β. [43] El plegamiento incorrecto de las proteínas puede desencadenar un mayor plegamiento incorrecto y acumulación de otras proteínas en agregados u oligómeros. Los niveles elevados de proteínas agregadas en la célula conducen a la formación de estructuras similares a amiloide que pueden causar trastornos degenerativos y muerte celular. [42] Los amiloides son estructuras fibrilares que contienen enlaces de hidrógeno intermoleculares que son altamente insolubles y están hechos de agregados de proteínas convertidas. [42] Por lo tanto, la vía del proteosoma puede no ser lo suficientemente eficiente para degradar las proteínas mal plegadas antes de la agregación. Las proteínas mal plegadas pueden interactuar entre sí y formar agregados estructurados y adquirir toxicidad a través de interacciones intermoleculares. [42]
Las proteínas agregadas están asociadas con enfermedades relacionadas con priones como la enfermedad de Creutzfeldt-Jakob , la encefalopatía espongiforme bovina (enfermedad de las vacas locas), enfermedades relacionadas con amiloide como la enfermedad de Alzheimer y la miocardiopatía o polineuropatía amiloide familiar , [44] así como enfermedades de agregación intracelular como como la enfermedad de Huntington y la enfermedad de Parkinson . [4] [45] Estas enfermedades degenerativas que aparecen con la edad están asociadas con la agregación de proteínas mal plegadas en agregados extracelulares insolubles y/o inclusiones intracelulares que incluyen fibrillas de amiloide β cruzadas . No está del todo claro si los agregados son la causa o simplemente un reflejo de la pérdida de la homeostasis de las proteínas, el equilibrio entre síntesis, plegamiento, agregación y recambio de proteínas. Recientemente, la Agencia Europea de Medicamentos aprobó el uso de Tafamidis o Vyndaqel (un estabilizador cinético de la transtiretina tetramérica) para el tratamiento de enfermedades amiloides por transtiretina. Esto sugiere que el proceso de formación de fibrillas de amiloide (y no las fibrillas en sí) causa la degeneración del tejido posmitótico en las enfermedades amiloides humanas. [46] El plegamiento incorrecto y la degradación excesiva en lugar del plegamiento y la función conducen a una serie de enfermedades proteopatías como el enfisema asociado a antitripsina , la fibrosis quística y las enfermedades de almacenamiento lisosomal , donde la pérdida de función es el origen del trastorno. Si bien la terapia de reemplazo de proteínas se ha utilizado históricamente para corregir estos últimos trastornos, un enfoque emergente es utilizar chaperonas farmacéuticas para plegar proteínas mutadas y hacerlas funcionales.
Si bien se pueden hacer inferencias sobre el plegamiento de proteínas a través de estudios de mutación , normalmente las técnicas experimentales para estudiar el plegamiento de proteínas se basan en el despliegue o plegamiento gradual de las proteínas y en la observación de cambios conformacionales utilizando técnicas no cristalográficas estándar.
La cristalografía de rayos X es uno de los métodos más eficaces e importantes para intentar descifrar la configuración tridimensional de una proteína plegada. [47] Para poder realizar cristalografía de rayos X, la proteína bajo investigación debe estar ubicada dentro de una red cristalina. Para colocar una proteína dentro de una red cristalina, se debe tener un solvente adecuado para la cristalización, obtener una proteína pura en niveles sobresaturados en solución y precipitar los cristales en solución. [48] Una vez que una proteína cristaliza, los rayos X se pueden concentrar a través de la red cristalina, lo que difractaría los rayos o los dispararía hacia afuera en varias direcciones. Estos haces salientes están correlacionados con la configuración tridimensional específica de la proteína contenida en su interior. Los rayos X interactúan específicamente con las nubes de electrones que rodean los átomos individuales dentro de la red cristalina de proteínas y producen un patrón de difracción discernible. [15] Sólo relacionando las nubes de densidad de electrones con la amplitud de los rayos X se puede leer este patrón y conducir a suposiciones de las fases o ángulos de fase involucrados que complican este método. [49] Sin la relación establecida a través de una base matemática conocida como transformada de Fourier , el " problema de fase " haría muy difícil predecir los patrones de difracción. [15] Los métodos emergentes, como el reemplazo isomorfo múltiple, utilizan la presencia de un ion de metal pesado para difractar los rayos X de una manera más predecible, reduciendo el número de variables involucradas y resolviendo el problema de fase. [47]
La espectroscopia de fluorescencia es un método muy sensible para estudiar el estado de plegamiento de las proteínas. Tres aminoácidos, fenilalanina (Phe), tirosina (Tyr) y triptófano (Trp), tienen propiedades de fluorescencia intrínsecas, pero sólo Tyr y Trp se utilizan experimentalmente porque sus rendimientos cuánticos son lo suficientemente altos como para dar buenas señales de fluorescencia. Tanto Trp como Tyr se excitan con una longitud de onda de 280 nm, mientras que sólo Trp se excita con una longitud de onda de 295 nm. Debido a su carácter aromático, los residuos Trp y Tyr a menudo se encuentran total o parcialmente enterrados en el núcleo hidrofóbico de las proteínas, en la interfaz entre dos dominios proteicos o en la interfaz entre subunidades de proteínas oligoméricas. En este entorno apolar, tienen altos rendimientos cuánticos y, por tanto, altas intensidades de fluorescencia. Tras la alteración de la estructura terciaria o cuaternaria de la proteína, estas cadenas laterales quedan más expuestas al entorno hidrófilo del disolvente y sus rendimientos cuánticos disminuyen, lo que lleva a bajas intensidades de fluorescencia. Para los residuos de Trp, la longitud de onda de su máxima emisión de fluorescencia también depende de su entorno.
La espectroscopia de fluorescencia se puede utilizar para caracterizar el desarrollo del equilibrio de las proteínas midiendo la variación en la intensidad de la emisión de fluorescencia o en la longitud de onda de la emisión máxima en función de un valor desnaturalizante. [50] [51] El desnaturalizante puede ser una molécula química (urea, clorhidrato de guanidinio), temperatura, pH, presión, etc. El equilibrio entre los diferentes pero discretos estados proteicos, es decir, estado nativo, estados intermedios, estado desplegado, depende de el valor desnaturalizante; por tanto, la señal de fluorescencia global de su mezcla en equilibrio también depende de este valor. Se obtiene así un perfil que relaciona la señal proteica global con el valor desnaturalizante. El perfil del desarrollo del equilibrio puede permitir detectar e identificar intermediarios del desarrollo. [52] [53] Hugues Bedouelle ha desarrollado ecuaciones generales para obtener los parámetros termodinámicos que caracterizan los equilibrios de desarrollo de proteínas homoméricas o heteroméricas, hasta trímeros y potencialmente tetrámeros, a partir de dichos perfiles. [50] La espectroscopia de fluorescencia se puede combinar con dispositivos de mezcla rápida, como flujo detenido , para medir la cinética de plegamiento de proteínas, [54] generar un gráfico de chevron y derivar un análisis del valor Phi .
El dicroísmo circular es una de las herramientas más generales y básicas para estudiar el plegamiento de proteínas. La espectroscopia de dicroísmo circular mide la absorción de luz polarizada circularmente . En las proteínas, estructuras como las hélices alfa y las láminas beta son quirales y, por tanto, absorben dicha luz. La absorción de esta luz actúa como marcador del grado de plegamiento del conjunto proteico. Esta técnica se ha utilizado para medir el desarrollo del equilibrio de la proteína midiendo el cambio en esta absorción en función de la concentración de desnaturalizante o la temperatura . Una masa fundida desnaturalizante mide la energía libre de despliegue, así como el valor m de la proteína o la dependencia del desnaturalizante. Una temperatura fundida mide la temperatura de desnaturalización (Tm) de la proteína. [50] En cuanto a la espectroscopia de fluorescencia, la espectroscopia de dicroísmo circular se puede combinar con dispositivos de mezcla rápida, como flujo detenido, para medir la cinética de plegamiento de proteínas y generar gráficos de chevron .
Los desarrollos más recientes de técnicas de dicroísmo circular vibratorio (VCD) para proteínas, que actualmente involucran instrumentos de transformada de Fourier (FT), proporcionan medios poderosos para determinar las conformaciones de proteínas en solución incluso para moléculas de proteínas muy grandes. Estos estudios VCD de proteínas se pueden combinar con datos de difracción de rayos X para cristales de proteínas, datos FT-IR para soluciones de proteínas en agua pesada (D 2 O) o cálculos cuánticos .
La resonancia magnética nuclear (RMN) de proteínas puede recopilar datos estructurales de proteínas induciendo un campo magnético a través de muestras de proteína concentrada. En RMN, dependiendo del entorno químico, ciertos núcleos absorberán radiofrecuencias específicas. [55] [56] Debido a que los cambios estructurales de las proteínas operan en una escala de tiempo de ns a ms, la RMN está especialmente equipada para estudiar estructuras intermedias en escalas de tiempo de ps a s. [57] Algunas de las principales técnicas para estudiar la estructura de las proteínas y los cambios estructurales de las proteínas que no se pliegan incluyen COSY , TOCSY , HSQC , tiempo de relajación (T1 y T2) y NOE . [55] NOE es especialmente útil porque se pueden observar transferencias de magnetización entre hidrógenos espacialmente proximales. [55] Los diferentes experimentos de RMN tienen distintos grados de sensibilidad en escalas de tiempo que son apropiados para diferentes cambios estructurales de proteínas. NOE puede captar vibraciones de enlaces o rotaciones de cadenas laterales; sin embargo, NOE es demasiado sensible para captar el plegamiento de proteínas porque ocurre en una escala de tiempo mayor. [57]
Debido a que el plegamiento de proteínas tiene lugar en aproximadamente 50 a 3000 s −1 CPMG, la dispersión por relajación y la transferencia de saturación por intercambio químico se han convertido en algunas de las técnicas principales para el análisis del plegamiento por RMN. [56] Además, ambas técnicas se utilizan para descubrir estados intermedios excitados en el paisaje de plegamiento de proteínas. [58] Para hacer esto, la dispersión de relajación CPMG aprovecha el fenómeno del eco de espín . Esta técnica expone los núcleos objetivo a un pulso de 90 seguido de uno o más pulsos de 180. [59] A medida que los núcleos se reenfocan, una distribución amplia indica que los núcleos objetivo están involucrados en un estado excitado intermedio. Al observar los gráficos de dispersión de relajación, los datos recopilan información sobre la termodinámica y la cinética entre el excitado y el suelo. [59] [58] La transferencia de saturación mide los cambios en la señal del estado fundamental a medida que los estados excitados se perturban. Utiliza una irradiación de radiofrecuencia débil para saturar el estado excitado de un núcleo particular, que transfiere su saturación al estado fundamental. [56] Esta señal se amplifica al disminuir la magnetización (y la señal) del estado fundamental. [56] [58]
Las principales limitaciones de la RMN es que su resolución disminuye con proteínas mayores de 25 kDa y no es tan detallada como la cristalografía de rayos X. [56] Además, el análisis de proteínas por RMN es bastante difícil y puede proponer múltiples soluciones del mismo espectro de RMN. [55]
En un estudio centrado en el plegamiento de una proteína SOD1 implicada en la esclerosis lateral amiotrófica , se estudiaron intermedios excitados con dispersión de relajación y transferencia de saturación. [60] SOD1 se había vinculado previamente a muchos mutantes causantes de enfermedades que se suponía que estaban involucrados en la agregación de proteínas; sin embargo, el mecanismo aún se desconocía. Mediante el uso de experimentos de dispersión de relajación y transferencia de saturación se descubrieron muchos estados intermedios excitados que estaban mal plegados en los mutantes SOD1. [60]
La interferometría de polarización dual es una técnica basada en superficies para medir las propiedades ópticas de las capas moleculares. Cuando se utiliza para caracterizar el plegamiento de proteínas, mide la conformación determinando el tamaño total de una monocapa de la proteína y su densidad en tiempo real con una resolución sub-Angstrom, [61] aunque la medición en tiempo real de la cinética del plegamiento de proteínas es limitada. a procesos que ocurren a una velocidad inferior a ~10 Hz. De manera similar al dicroísmo circular , el estímulo para el plegado puede ser un desnaturalizante o la temperatura .
El estudio del plegamiento de proteínas ha avanzado mucho en los últimos años gracias al desarrollo de técnicas rápidas y de resolución temporal. Los experimentadores desencadenan rápidamente el plegamiento de una muestra de proteína desplegada y observan la dinámica resultante . Las técnicas rápidas en uso incluyen dispersión de neutrones , [62] mezcla ultrarrápida de soluciones, métodos fotoquímicos y espectroscopia de salto de temperatura con láser . Entre los muchos científicos que han contribuido al desarrollo de estas técnicas se encuentran Jeremy Cook, Heinrich Roder, Terry Oas, Harry Gray , Martin Gruebele , Brian Dyer, William Eaton, Sheena Radford , Chris Dobson , Alan Fersht , Bengt Nölting y Lars Konermann.
La proteólisis se utiliza habitualmente para sondear la fracción desplegada en una amplia gama de condiciones de solución (por ejemplo, proteólisis paralela rápida (FASTpp) . [63] [64]
Se han utilizado técnicas de molécula única, como pinzas ópticas y AFM, para comprender los mecanismos de plegamiento de proteínas de proteínas aisladas, así como de proteínas con chaperonas. [65] Se han utilizado pinzas ópticas para estirar moléculas de proteínas individuales desde sus extremos C y N y desplegarlas para permitir el estudio del replegamiento posterior. [66] La técnica permite medir las tasas de plegamiento a nivel de una sola molécula; por ejemplo, recientemente se han aplicado pinzas ópticas para estudiar el plegamiento y desplegamiento de proteínas implicadas en la coagulación sanguínea. El factor von Willebrand (vWF) es una proteína con un papel esencial en el proceso de formación de coágulos sanguíneos. Descubrió, mediante la medición con pinzas ópticas de una sola molécula, que el vWF unido a calcio actúa como un sensor de fuerza de corte en la sangre. La fuerza de corte conduce al despliegue del dominio A2 del vWF, cuya velocidad de replegamiento aumenta dramáticamente en presencia de calcio. [67] Recientemente, también se demostró que el dominio src SH3 simple accede a múltiples vías de desarrollo bajo fuerza. [68]
La pintura con biotina permite obtener instantáneas celulares específicas de cada condición de proteínas (des)plegadas. "La 'pintura' de biotina muestra un sesgo hacia las proteínas intrínsecamente desordenadas predichas" . [69]
Los estudios computacionales del plegamiento de proteínas incluyen tres aspectos principales relacionados con la predicción de la estabilidad, cinética y estructura de las proteínas. Una revisión de 2013 resume los métodos computacionales disponibles para el plegamiento de proteínas. [70]
En 1969, Cyrus Levinthal observó que, debido al gran número de grados de libertad en una cadena polipeptídica desplegada, la molécula tiene un número astronómico de conformaciones posibles. En uno de sus artículos se hizo una estimación de 3.300 o 10.143 . [71] La paradoja de Levinthal es un experimento mental basado en la observación de que si una proteína se plegara mediante un muestreo secuencial de todas las conformaciones posibles, tomaría una cantidad de tiempo astronómica hacerlo, incluso si las conformaciones se muestrearan a un ritmo rápido ( en la escala de nanosegundos o picosegundos ). [72] Basándose en la observación de que las proteínas se pliegan mucho más rápido que esto, Levinthal propuso que no se produce una búsqueda conformacional aleatoria y que, por lo tanto, la proteína debe plegarse a través de una serie de estados intermedios metaestables .
El espacio de configuración de una proteína durante el plegamiento puede visualizarse como un paisaje energético . Según Joseph Bryngelson y Peter Wolynes , las proteínas siguen el principio de frustración mínima , lo que significa que las proteínas evolucionadas naturalmente han optimizado sus paisajes energéticos de plegamiento, [73] y que la naturaleza ha elegido secuencias de aminoácidos para que el estado plegado de la proteína sea suficientemente estable. . Además, la adquisición del estado plegado tenía que ser un proceso suficientemente rápido. Aunque la naturaleza ha reducido el nivel de frustración en las proteínas, hasta ahora persiste cierto grado, como se puede observar en la presencia de mínimos locales en el paisaje energético de las proteínas.
Una consecuencia de estas secuencias seleccionadas evolutivamente es que generalmente se piensa que las proteínas tienen "paisajes energéticos canalizados" globalmente (un término acuñado por José Onuchic ) [74] que están dirigidos en gran medida hacia el estado nativo. Este paisaje de " embudo de plegado " permite que la proteína se pliegue al estado nativo a través de cualquiera de una gran cantidad de vías e intermediarios, en lugar de restringirse a un solo mecanismo. La teoría está respaldada tanto por simulaciones computacionales de proteínas modelo como por estudios experimentales [73] y se ha utilizado para mejorar los métodos de predicción y diseño de la estructura de proteínas . [73] La descripción del plegamiento de proteínas por el paisaje nivelador de energía libre también es consistente con la segunda ley de la termodinámica. [75] Físicamente, pensar en los paisajes en términos de potencial visualizable o superficies de energía total simplemente con máximos, puntos de silla, mínimos y embudos, más bien como paisajes geográficos, es quizás un poco engañoso. La descripción relevante es en realidad un espacio de fase de alta dimensión en el que las variedades pueden tomar una variedad de formas topológicas más complicadas. [76]
La cadena polipeptídica desplegada comienza en la parte superior del embudo, donde puede asumir el mayor número de variaciones desplegadas y se encuentra en su estado de mayor energía. Paisajes energéticos como estos indican que hay un gran número de posibilidades iniciales, pero sólo es posible un único estado nativo; sin embargo, no revela las numerosas vías de plegado que son posibles. Una molécula diferente de exactamente la misma proteína puede seguir rutas de plegamiento marginalmente diferentes, buscando diferentes intermediarios de menor energía, siempre que se alcance la misma estructura nativa. [77] Diferentes vías pueden tener diferentes frecuencias de utilización dependiendo de la favorabilidad termodinámica de cada vía. Esto significa que si se descubre que una vía es termodinámicamente más favorable que otra, es probable que se utilice con mayor frecuencia en la búsqueda de la estructura nativa. [77] A medida que la proteína comienza a plegarse y asumir sus diversas conformaciones, siempre busca una estructura termodinámicamente más favorable que antes y, por lo tanto, continúa a través del embudo de energía. La formación de estructuras secundarias es una fuerte indicación de una mayor estabilidad dentro de la proteína, y sólo una combinación de estructuras secundarias asumidas por la estructura polipeptídica tendrá la energía más baja y, por lo tanto, estará presente en el estado nativo de la proteína. [77] Entre las primeras estructuras que se forman una vez que el polipéptido comienza a plegarse se encuentran las hélices alfa y los giros beta, donde las hélices alfa se pueden formar en tan solo 100 nanosegundos y los giros beta en 1 microsegundo. [30]
Existe un punto de silla en el paisaje del embudo de energía donde se encuentra el estado de transición para una proteína en particular. [30] El estado de transición en el diagrama de embudo de energía es la conformación que debe asumir cada molécula de esa proteína si la proteína desea finalmente asumir la estructura nativa. Ninguna proteína puede asumir la estructura nativa sin pasar primero por el estado de transición. [30] El estado de transición puede denominarse una variante o forma prematura del estado nativo en lugar de simplemente otro paso intermedio. [78] Se ha demostrado que el plegamiento del estado de transición determina la velocidad y, aunque existe en un estado de mayor energía que el plegamiento nativo, se parece mucho a la estructura nativa. Dentro del estado de transición, existe un núcleo alrededor del cual la proteína puede plegarse, formado por un proceso denominado "condensación de nucleación" donde la estructura comienza a colapsar sobre el núcleo. [78]
Se pueden utilizar técnicas de novo o ab initio para la predicción computacional de la estructura de proteínas para simular diversos aspectos del plegamiento de proteínas. La dinámica molecular (MD) se utilizó en simulaciones de plegamiento de proteínas y dinámica in silico . [79] Las primeras simulaciones de plegamiento en equilibrio se realizaron utilizando un modelo de disolvente implícito y un muestreo general . [80] Debido al costo computacional, las simulaciones de plegamiento MD ab initio con agua explícita se limitan a péptidos y proteínas pequeñas. [81] [82] Las simulaciones MD de proteínas más grandes permanecen restringidas a la dinámica de la estructura experimental o su desarrollo a alta temperatura. Se puede acceder a procesos de plegado de larga duración (más de aproximadamente 1 milisegundo), como el plegamiento de proteínas más grandes (>150 residuos), utilizando modelos de grano grueso . [83] [84] [85]
Varios proyectos computacionales a gran escala, como Rosetta@home , [86] Folding@home [87] y Foldit , [88] tienen como objetivo el plegamiento de proteínas.
Se han realizado largas simulaciones de trayectoria continua en Anton , una supercomputadora masivamente paralela diseñada y construida alrededor de ASIC e interconexiones personalizadas por DE Shaw Research . El resultado publicado más largo de una simulación realizada con Anton en 2011 fue una simulación de 2,936 milisegundos de NTL9 a 355 K. [89] Actualmente, dichas simulaciones son capaces de desplegar y replegar proteínas pequeñas (<150 residuos de aminoácidos) en equilibrio y predecir cómo las mutaciones afectan la cinética de plegamiento y la estabilidad. [90]
En 2020, un equipo de investigadores que utilizó AlphaFold , un programa de predicción de estructuras de proteínas con inteligencia artificial (IA) desarrollado por DeepMind , obtuvo el primer lugar en CASP , un concurso de predicción de estructuras de larga data [91]. El equipo logró un nivel de precisión mucho más alto que cualquier otro grupo. . [92] Obtuvo una puntuación superior al 90% para aproximadamente dos tercios de las proteínas en la prueba de distancia global (GDT) de CASP , una prueba que mide el grado de similitud entre la estructura, predicha por un programa computacional, y la estructura empírica, determinada experimentalmente. en un laboratorio. Una puntuación de 100 se considera un partido completo, dentro del límite de distancia utilizado para calcular el GDT. [93]
Los resultados de predicción de la estructura de proteínas de AlphaFold en CASP se describieron como "transformacionales" y "asombrosos". [94] [95] Algunos investigadores observaron que la precisión no es lo suficientemente alta para un tercio de sus predicciones, y que no revela el mecanismo físico del plegamiento de proteínas para que el problema del plegamiento de proteínas se considere resuelto. [96] Sin embargo, se considera un logro significativo en biología computacional [93] y un gran progreso hacia un gran desafío de la biología que lleva décadas, predecir la estructura de las proteínas. [94]