El plegamiento de proteínas es el proceso físico por el cual una proteína , después de ser sintetizada por un ribosoma como una cadena lineal de aminoácidos , cambia de una espiral aleatoria inestable a una estructura tridimensional más ordenada . Esta estructura permite que la proteína se vuelva biológicamente funcional. [1]
El plegamiento de muchas proteínas comienza incluso durante la traducción de la cadena polipeptídica. Los aminoácidos interactúan entre sí para producir una estructura tridimensional bien definida, conocida como estado nativo de la proteína . Esta estructura está determinada por la secuencia de aminoácidos o estructura primaria . [2]
La estructura tridimensional correcta es esencial para el funcionamiento, aunque algunas partes de las proteínas funcionales pueden permanecer sin plegar , [3] lo que indica que la dinámica de las proteínas es importante. La falta de plegamiento en una estructura nativa generalmente produce proteínas inactivas, pero en algunos casos, las proteínas mal plegadas tienen una funcionalidad modificada o tóxica. Se cree que varias enfermedades neurodegenerativas y de otro tipo son resultado de la acumulación de fibrillas amiloides formadas por proteínas mal plegadas, cuyas variedades infecciosas se conocen como priones . [4] Muchas alergias son causadas por el plegamiento incorrecto de algunas proteínas porque el sistema inmunológico no produce los anticuerpos para ciertas estructuras proteínicas. [5]
La desnaturalización de las proteínas es un proceso de transición de un estado plegado a uno desplegado . Ocurre en la cocción , quemaduras , proteinopatías y otros contextos. La estructura residual presente, si la hay, en el estado supuestamente desplegado puede formar un sitio de inicio del plegamiento y guiar las reacciones de plegamiento posteriores. [6]
La duración del proceso de plegamiento varía drásticamente dependiendo de la proteína de interés. Cuando se estudia fuera de la célula , las proteínas de plegamiento más lento requieren muchos minutos u horas para plegarse, principalmente debido a la isomerización de la prolina , y deben pasar por una serie de estados intermedios, como puntos de control, antes de que el proceso se complete. [7] Por otro lado, las proteínas muy pequeñas de un solo dominio con longitudes de hasta cien aminoácidos generalmente se pliegan en un solo paso. [8] Las escalas de tiempo de milisegundos son la norma, y las reacciones de plegamiento de proteínas más rápidas conocidas se completan en unos pocos microsegundos. [9] La escala de tiempo de plegamiento de una proteína depende de su tamaño, orden de contacto y topología del circuito . [10]
Comprender y simular el proceso de plegamiento de proteínas ha sido un desafío importante para la biología computacional desde finales de la década de 1960.
La estructura primaria de una proteína, su secuencia lineal de aminoácidos, determina su conformación nativa. [11] Los residuos de aminoácidos específicos y su posición en la cadena polipeptídica son los factores determinantes para que las porciones de la proteína se plieguen juntas y formen su conformación tridimensional. La composición de aminoácidos no es tan importante como la secuencia. [12] Sin embargo, el hecho esencial del plegamiento sigue siendo que la secuencia de aminoácidos de cada proteína contiene la información que especifica tanto la estructura nativa como la vía para alcanzar ese estado. Esto no quiere decir que las secuencias de aminoácidos casi idénticas siempre se plieguen de manera similar. [13] Las conformaciones también difieren en función de factores ambientales; proteínas similares se pliegan de manera diferente según el lugar donde se encuentren.
La formación de una estructura secundaria es el primer paso en el proceso de plegamiento que una proteína realiza para asumir su estructura nativa. Las estructuras conocidas como hélices alfa y láminas beta son características de la estructura secundaria , ya que se pliegan rápidamente porque están estabilizadas por enlaces de hidrógeno intramoleculares , como fue caracterizado por primera vez por Linus Pauling . La formación de enlaces de hidrógeno intramoleculares proporciona otra contribución importante a la estabilidad de la proteína. [14] Las hélices α se forman mediante enlaces de hidrógeno de la cadena principal para formar una forma espiral (consulte la figura de la derecha). [12] La lámina β plegada es una estructura que se forma con la cadena principal doblándose sobre sí misma para formar los enlaces de hidrógeno (como se muestra en la figura de la izquierda). Los enlaces de hidrógeno están entre el hidrógeno de la amida y el oxígeno del carbonilo del enlace peptídico . Existen láminas β plegadas antiparalelas y láminas β plegadas paralelas donde la estabilidad de los enlaces de hidrógeno es más fuerte en la lámina β antiparalela ya que forma enlaces de hidrógeno con el ángulo ideal de 180 grados en comparación con los enlaces de hidrógeno inclinados formados por láminas paralelas. [12]
Las hélices α y las láminas β son comúnmente anfipáticas, lo que significa que tienen una porción hidrófila y otra hidrófoba. Esta capacidad ayuda a formar la estructura terciaria de una proteína en la que el plegamiento se produce de modo que los lados hidrófilos estén orientados hacia el entorno acuoso que rodea a la proteína y los lados hidrófobos estén orientados hacia el núcleo hidrófobo de la proteína. [15] La estructura secundaria da paso jerárquicamente a la formación de la estructura terciaria. Una vez que la estructura terciaria de la proteína se forma y se estabiliza mediante las interacciones hidrófobas, también puede haber enlaces covalentes en forma de puentes disulfuro formados entre dos residuos de cisteína . Estos contactos no covalentes y covalentes adoptan una disposición topológica específica en una estructura nativa de una proteína. La estructura terciaria de una proteína implica una sola cadena polipeptídica; sin embargo, interacciones adicionales de cadenas polipeptídicas plegadas dan lugar a la formación de una estructura cuaternaria. [16]
La estructura terciaria puede dar lugar a la formación de una estructura cuaternaria en algunas proteínas, lo que generalmente implica el "ensamblaje" o "coensamblaje" de subunidades que ya se han plegado; en otras palabras, múltiples cadenas polipeptídicas podrían interactuar para formar una proteína cuaternaria completamente funcional. [12]
El plegamiento es un proceso espontáneo que está guiado principalmente por interacciones hidrofóbicas, formación de enlaces de hidrógeno intramoleculares , fuerzas de van der Waals , y se opone a la entropía conformacional . [17] El proceso de plegamiento a menudo comienza co-traduccionalmente , de modo que el extremo N de la proteína comienza a plegarse mientras que la porción C-terminal de la proteína todavía está siendo sintetizada por el ribosoma ; sin embargo, una molécula de proteína puede plegarse espontáneamente durante o después de la biosíntesis . [18] Si bien estas macromoléculas pueden considerarse como " plegándose a sí mismas ", el proceso también depende del solvente ( agua o bicapa lipídica ), [19] la concentración de sales , el pH , la temperatura , la posible presencia de cofactores y de chaperonas moleculares .
Las proteínas tendrán limitaciones en sus capacidades de plegamiento debido a los ángulos de flexión restringidos o las conformaciones que son posibles. Estos ángulos permisibles de plegamiento de proteínas se describen con un gráfico bidimensional conocido como el gráfico de Ramachandran , representado con ángulos psi y phi de rotación permisible. [20]
El plegamiento de proteínas debe ser termodinámicamente favorable dentro de una célula para que sea una reacción espontánea. Dado que se sabe que el plegamiento de proteínas es una reacción espontánea, entonces debe asumir un valor de energía libre de Gibbs negativo . La energía libre de Gibbs en el plegamiento de proteínas está directamente relacionada con la entalpía y la entropía . [12] Para que surja un delta G negativo y para que el plegamiento de proteínas se vuelva termodinámicamente favorable, entonces la entalpía, la entropía o ambos términos deben ser favorables.
Minimizar el número de cadenas laterales hidrofóbicas expuestas al agua es una fuerza impulsora importante detrás del proceso de plegamiento. [21] El efecto hidrofóbico es el fenómeno en el que las cadenas hidrofóbicas de una proteína colapsan en el núcleo de la proteína (lejos del entorno hidrofílico). [12] En un entorno acuoso, las moléculas de agua tienden a agregarse alrededor de las regiones hidrofóbicas o cadenas laterales de la proteína, creando capas de agua de moléculas de agua ordenadas. [22] Un ordenamiento de las moléculas de agua alrededor de una región hidrofóbica aumenta el orden en un sistema y, por lo tanto, contribuye a un cambio negativo en la entropía (menos entropía en el sistema). Las moléculas de agua se fijan en estas jaulas de agua, lo que impulsa el colapso hidrofóbico o el plegamiento hacia adentro de los grupos hidrofóbicos. El colapso hidrofóbico introduce entropía nuevamente en el sistema a través de la ruptura de las jaulas de agua que liberan las moléculas de agua ordenadas. [12] La multitud de grupos hidrófobos que interactúan dentro del núcleo de la proteína plegada globular contribuye en gran medida a la estabilidad de la proteína después del plegado, debido a las fuerzas de van der Waals enormemente acumuladas (específicamente las fuerzas de dispersión de London ). [12] El efecto hidrófobo existe como una fuerza impulsora en la termodinámica solo si existe la presencia de un medio acuoso con una molécula anfifílica que contiene una gran región hidrófoba. [23] La fuerza de los enlaces de hidrógeno depende de su entorno; por lo tanto, los enlaces de H envueltos en un núcleo hidrófobo contribuyen más que los enlaces de H expuestos al entorno acuoso a la estabilidad del estado nativo. [24]
En las proteínas con pliegues globulares, los aminoácidos hidrófobos tienden a estar intercalados a lo largo de la secuencia primaria, en lugar de estar distribuidos aleatoriamente o agrupados. [25] [26] Sin embargo, las proteínas que han nacido recientemente de novo , que tienden a estar intrínsecamente desordenadas , [27] [28] muestran el patrón opuesto de agrupamiento de aminoácidos hidrófobos a lo largo de la secuencia primaria. [29]
Las chaperonas moleculares son una clase de proteínas que ayudan en el plegamiento correcto de otras proteínas in vivo . Las chaperonas existen en todos los compartimentos celulares e interactúan con la cadena polipeptídica para permitir que se forme la conformación tridimensional nativa de la proteína; sin embargo, las chaperonas en sí mismas no están incluidas en la estructura final de la proteína en la que están ayudando. [30] Las chaperonas pueden ayudar en el plegamiento incluso cuando el polipéptido naciente está siendo sintetizado por el ribosoma. [31] Las chaperonas moleculares operan uniéndose para estabilizar una estructura de otra manera inestable de una proteína en su vía de plegamiento, pero las chaperonas no contienen la información necesaria para conocer la estructura nativa correcta de la proteína a la que están ayudando; más bien, las chaperonas funcionan previniendo conformaciones de plegamiento incorrectas. [31] De esta manera, las chaperonas en realidad no aumentan la tasa de pasos individuales involucrados en la vía de plegamiento hacia la estructura nativa; en cambio, funcionan reduciendo posibles agregaciones no deseadas de la cadena polipeptídica que de otro modo podrían ralentizar la búsqueda del intermedio adecuado y proporcionan una vía más eficiente para que la cadena polipeptídica asuma las conformaciones correctas. [30] Las chaperonas no deben confundirse con las proteínas catalizadoras de plegamiento , que catalizan las reacciones químicas responsables de los pasos lentos en las vías de plegamiento. Ejemplos de catalizadores de plegamiento son las isomerasas de disulfuro de proteínas y las isomerasas de peptidil-prolil que pueden estar involucradas en la formación de enlaces disulfuro o la interconversión entre estereoisómeros cis y trans del grupo peptídico. [31] Se ha demostrado que las chaperonas son fundamentales en el proceso de plegamiento de proteínas in vivo porque proporcionan a la proteína la ayuda necesaria para asumir sus alineaciones y conformaciones adecuadas con la suficiente eficiencia para volverse "biológicamente relevante". [32] Esto significa que la cadena polipeptídica podría, teóricamente, plegarse en su estructura nativa sin la ayuda de chaperonas, como lo demuestran los experimentos de plegamiento de proteínas realizados in vitro ; [32] Sin embargo, este proceso resulta demasiado ineficiente o demasiado lento para existir en sistemas biológicos; por lo tanto, las chaperonas son necesarias para el plegamiento de proteínas in vivo. Junto con su papel en la ayuda a la formación de la estructura nativa, se ha demostrado que las chaperonas están involucradas en varias funciones, como el transporte de proteínas, la degradación e incluso permiten que las proteínas desnaturalizadas expuestas a ciertos factores desnaturalizantes externos tengan la oportunidad de volver a plegarse en sus estructuras nativas correctas. [33]
Una proteína completamente desnaturalizada carece tanto de estructura terciaria como secundaria, y existe como una denominada bobina aleatoria . Bajo ciertas condiciones, algunas proteínas pueden replegarse; sin embargo, en muchos casos, la desnaturalización es irreversible. [34] Las células a veces protegen sus proteínas contra la influencia desnaturalizante del calor con enzimas conocidas como proteínas de choque térmico (un tipo de chaperona), que ayudan a otras proteínas tanto a plegarse como a permanecer plegadas. Se han encontrado proteínas de choque térmico en todas las especies examinadas, desde bacterias hasta humanos, lo que sugiere que evolucionaron muy temprano y tienen una función importante. Algunas proteínas nunca se pliegan en las células excepto con la ayuda de chaperonas que aíslan proteínas individuales para que su plegamiento no se interrumpa por interacciones con otras proteínas o ayudan a desplegar proteínas mal plegadas, lo que les permite replegarse en la estructura nativa correcta. [35] Esta función es crucial para prevenir el riesgo de precipitación en agregados amorfos insolubles . Los factores externos implicados en la desnaturalización de proteínas o la alteración de su estado nativo incluyen la temperatura, los campos externos (eléctricos, magnéticos), [36] el hacinamiento molecular, [37] e incluso la limitación del espacio (es decir, el confinamiento), que pueden tener una gran influencia en el plegamiento de las proteínas. [38] Las altas concentraciones de solutos , los extremos de pH , las fuerzas mecánicas y la presencia de desnaturalizantes químicos también pueden contribuir a la desnaturalización de proteínas. Estos factores individuales se clasifican juntos como estreses. Se ha demostrado que las chaperonas existen en concentraciones crecientes durante los momentos de estrés celular y ayudan al plegamiento adecuado de las proteínas emergentes, así como de las desnaturalizadas o mal plegadas. [30]
En determinadas condiciones, las proteínas no se plegarán hasta adoptar sus formas bioquímicamente funcionales. Las temperaturas superiores o inferiores al rango en el que las células tienden a vivir harán que las proteínas térmicamente inestables se desplieguen o desnaturalicen (por eso, al hervirlas , la clara de un huevo se vuelve opaca). Sin embargo, la estabilidad térmica de las proteínas dista mucho de ser constante; por ejemplo, se han descubierto bacterias hipertermófilas que crecen a temperaturas de hasta 122 °C [39] , lo que, por supuesto, requiere que su dotación completa de proteínas vitales y conjuntos proteínicos sea estable a esa temperatura o a una temperatura superior.
La bacteria E. coli es el huésped del bacteriófago T4 , y la proteína gp31 codificada por el fago ( P17313 ) parece ser estructural y funcionalmente homóloga a la proteína chaperona GroES de E. coli y capaz de sustituirla en el ensamblaje de partículas del virus del bacteriófago T4 durante la infección. [40] Al igual que GroES, gp31 forma un complejo estable con la chaperonina GroEL que es absolutamente necesario para el plegamiento y ensamblaje in vivo de la proteína gp23 de la cápside principal del bacteriófago T4. [40]
Algunas proteínas tienen múltiples estructuras nativas y cambian su plegamiento en función de algunos factores externos. Por ejemplo, la proteína KaiB cambia de plegamiento a lo largo del día , actuando como un reloj para las cianobacterias. Se ha estimado que alrededor del 0,5 al 4 % de las proteínas del PDB ( Protein Data Bank ) cambian de plegamiento. [41]
Se considera que una proteína está mal plegada si no puede alcanzar su estado nativo normal. Esto puede deberse a mutaciones en la secuencia de aminoácidos o a una interrupción del proceso de plegamiento normal por factores externos. [42] La proteína mal plegada normalmente contiene láminas β que están organizadas en una disposición supramolecular conocida como estructura β cruzada. Estos ensamblajes ricos en láminas β son muy estables, muy insolubles y generalmente resistentes a la proteólisis. [43] La estabilidad estructural de estos ensamblajes fibrilares es causada por interacciones extensas entre los monómeros de la proteína, formados por enlaces de hidrógeno de la cadena principal entre sus cadenas β. [43] El plegamiento incorrecto de las proteínas puede desencadenar un mayor plegamiento incorrecto y la acumulación de otras proteínas en agregados u oligómeros. El aumento de los niveles de proteínas agregadas en la célula conduce a la formación de estructuras similares a amiloide que pueden causar trastornos degenerativos y muerte celular. [42] Los amiloides son estructuras fibrilares que contienen enlaces de hidrógeno intermoleculares que son altamente insolubles y están hechos de agregados de proteínas transformadas. [42] Por lo tanto, la vía del proteasoma puede no ser lo suficientemente eficiente para degradar las proteínas mal plegadas antes de la agregación. Las proteínas mal plegadas pueden interactuar entre sí y formar agregados estructurados y adquirir toxicidad a través de interacciones intermoleculares. [42]
Las proteínas agregadas se asocian con enfermedades relacionadas con priones como la enfermedad de Creutzfeldt-Jakob , la encefalopatía espongiforme bovina (enfermedad de las vacas locas), enfermedades relacionadas con amiloide como la enfermedad de Alzheimer y la miocardiopatía o polineuropatía amiloide familiar , [44] así como enfermedades de agregación intracelular como la enfermedad de Huntington y la enfermedad de Parkinson . [4] [45] Estas enfermedades degenerativas de inicio en la edad están asociadas con la agregación de proteínas mal plegadas en agregados extracelulares insolubles y/o inclusiones intracelulares incluyendo fibrillas de amiloide β cruzadas . No está completamente claro si los agregados son la causa o simplemente un reflejo de la pérdida de la homeostasis proteica, el equilibrio entre síntesis, plegamiento, agregación y recambio proteico. Recientemente la Agencia Europea de Medicamentos aprobó el uso de Tafamidis o Vyndaqel (un estabilizador cinético de la transtiretina tetramérica) para el tratamiento de enfermedades amiloides por transtiretina. Esto sugiere que el proceso de formación de fibrillas amiloides (y no las fibrillas en sí) causa la degeneración del tejido postmitótico en las enfermedades amiloides humanas. [46] El plegamiento incorrecto y la degradación excesiva en lugar del plegamiento y la función conducen a una serie de enfermedades proteopáticos como el enfisema asociado a la antitripsina , la fibrosis quística y las enfermedades de almacenamiento lisosomal , donde la pérdida de función es el origen del trastorno. Si bien la terapia de reemplazo de proteínas se ha utilizado históricamente para corregir estos últimos trastornos, un enfoque emergente es utilizar chaperonas farmacéuticas para plegar proteínas mutadas para hacerlas funcionales.
Si bien se pueden hacer inferencias sobre el plegamiento de proteínas a través de estudios de mutación , normalmente las técnicas experimentales para estudiar el plegamiento de proteínas se basan en el desdoblamiento o plegamiento gradual de las proteínas y en la observación de cambios conformacionales utilizando técnicas estándar no cristalográficas.
La cristalografía de rayos X es uno de los métodos más eficientes e importantes para intentar descifrar la configuración tridimensional de una proteína plegada. [47] Para poder realizar la cristalografía de rayos X, la proteína bajo investigación debe estar ubicada dentro de una red cristalina. Para colocar una proteína dentro de una red cristalina, uno debe tener un solvente adecuado para la cristalización, obtener una proteína pura a niveles sobresaturados en solución y precipitar los cristales en solución. [48] Una vez que una proteína se cristaliza, los rayos X se pueden concentrar a través de la red cristalina que difractaría los rayos o los dispararía hacia afuera en varias direcciones. Estos rayos salientes están correlacionados con la configuración tridimensional específica de la proteína encerrada en su interior. Los rayos X interactúan específicamente con las nubes de electrones que rodean los átomos individuales dentro de la red cristalina de la proteína y producen un patrón de difracción discernible. [15] Solamente relacionando las nubes de densidad electrónica con la amplitud de los rayos X se puede leer este patrón y conducir a suposiciones de las fases o ángulos de fase involucrados que complican este método. [49] Sin la relación establecida a través de una base matemática conocida como transformada de Fourier , el " problema de fase " haría muy difícil predecir los patrones de difracción. [15] Los métodos emergentes como el reemplazo isomorfo múltiple utilizan la presencia de un ion de metal pesado para difractar los rayos X de una manera más predecible, reduciendo el número de variables involucradas y resolviendo el problema de fase. [47]
La espectroscopia de fluorescencia es un método muy sensible para estudiar el estado de plegamiento de las proteínas. Tres aminoácidos, la fenilalanina (Phe), la tirosina (Tyr) y el triptófano (Trp), tienen propiedades intrínsecas de fluorescencia, pero solo Tyr y Trp se utilizan experimentalmente porque sus rendimientos cuánticos son lo suficientemente altos como para dar buenas señales de fluorescencia. Tanto Trp como Tyr se excitan con una longitud de onda de 280 nm, mientras que solo Trp se excita con una longitud de onda de 295 nm. Debido a su carácter aromático, los residuos de Trp y Tyr a menudo se encuentran enterrados total o parcialmente en el núcleo hidrofóbico de las proteínas, en la interfaz entre dos dominios proteicos o en la interfaz entre subunidades de proteínas oligoméricas. En este entorno apolar, tienen altos rendimientos cuánticos y, por lo tanto, altas intensidades de fluorescencia. Al interrumpirse la estructura terciaria o cuaternaria de la proteína, estas cadenas laterales quedan más expuestas al entorno hidrofílico del disolvente y sus rendimientos cuánticos disminuyen, lo que conduce a bajas intensidades de fluorescencia. Para los residuos de Trp, la longitud de onda de su emisión máxima de fluorescencia también depende de su entorno.
La espectroscopia de fluorescencia se puede utilizar para caracterizar el desdoblamiento en equilibrio de las proteínas midiendo la variación en la intensidad de la emisión de fluorescencia o en la longitud de onda de emisión máxima como funciones de un valor desnaturalizante. [50] [51] El desnaturalizante puede ser una molécula química (urea, clorhidrato de guanidinio), temperatura, pH, presión, etc. El equilibrio entre los diferentes pero discretos estados de la proteína, es decir, estado nativo, estados intermedios, estado desdoblado, depende del valor desnaturalizante; por lo tanto, la señal de fluorescencia global de su mezcla de equilibrio también depende de este valor. De este modo, se obtiene un perfil que relaciona la señal global de la proteína con el valor desnaturalizante. El perfil de desdoblamiento en equilibrio puede permitir detectar e identificar intermediarios de desdoblamiento. [52] [53] Hugues Bedouelle ha desarrollado ecuaciones generales para obtener los parámetros termodinámicos que caracterizan los equilibrios de desdoblamiento para proteínas homoméricas o heteroméricas, hasta trímeros y potencialmente tetrámeros, a partir de dichos perfiles. [50] La espectroscopia de fluorescencia se puede combinar con dispositivos de mezcla rápida, como el flujo detenido , para medir la cinética de plegamiento de proteínas, [54] generar un gráfico de chevron y derivar un análisis del valor Phi .
El dicroísmo circular es una de las herramientas más generales y básicas para estudiar el plegamiento de proteínas. La espectroscopia de dicroísmo circular mide la absorción de luz polarizada circularmente . En las proteínas, las estructuras como las hélices alfa y las láminas beta son quirales y, por lo tanto, absorben dicha luz. La absorción de esta luz actúa como un marcador del grado de plegamiento del conjunto de proteínas. Esta técnica se ha utilizado para medir el desdoblamiento en equilibrio de la proteína midiendo el cambio en esta absorción como una función de la concentración de desnaturalizante o la temperatura . Una fusión de desnaturalizante mide la energía libre de desdoblamiento, así como el valor m de la proteína, o la dependencia del desnaturalizante. Una fusión de temperatura mide la temperatura de desnaturalización (Tm) de la proteína. [50] En cuanto a la espectroscopia de fluorescencia, la espectroscopia de dicroísmo circular se puede combinar con dispositivos de mezcla rápida como el flujo detenido para medir la cinética de plegamiento de proteínas y generar gráficos de chevron .
Los desarrollos más recientes de las técnicas de dicroísmo circular vibracional (VCD) para proteínas, que actualmente involucran instrumentos de transformada de Fourier (FT), proporcionan medios poderosos para determinar conformaciones de proteínas en solución incluso para moléculas de proteínas muy grandes. Estos estudios de VCD de proteínas se pueden combinar con datos de difracción de rayos X para cristales de proteínas, datos de FT-IR para soluciones de proteínas en agua pesada (D 2 O) o cálculos cuánticos .
La resonancia magnética nuclear (RMN) de proteínas es capaz de recolectar datos estructurales de proteínas induciendo un campo magnético a través de muestras de proteína concentrada. En RMN, dependiendo del entorno químico, ciertos núcleos absorberán radiofrecuencias específicas. [55] [56] Debido a que los cambios estructurales de las proteínas operan en una escala de tiempo de ns a ms, la RMN está especialmente equipada para estudiar estructuras intermedias en escalas de tiempo de ps a s. [57] Algunas de las principales técnicas para estudiar la estructura de las proteínas y los cambios estructurales de las proteínas sin plegamiento incluyen COSY , TOCSY , HSQC , relajación temporal (T1 y T2) y NOE . [55] La NOE es especialmente útil porque se pueden observar transferencias de magnetización entre hidrógenos espacialmente proximales. [55] Diferentes experimentos de RMN tienen diferentes grados de sensibilidad a la escala de tiempo que son apropiados para diferentes cambios estructurales de las proteínas. La NOE puede captar vibraciones de enlaces o rotaciones de cadenas laterales, sin embargo, la NOE es demasiado sensible para captar el plegamiento de proteínas porque ocurre en una escala de tiempo mayor. [57]
Debido a que el plegamiento de proteínas ocurre en aproximadamente 50 a 3000 s −1, la dispersión de relajación CPMG y la transferencia de saturación por intercambio químico se han convertido en algunas de las técnicas principales para el análisis de RMN del plegamiento. [56] Además, ambas técnicas se utilizan para descubrir estados intermedios excitados en el paisaje de plegamiento de proteínas. [58] Para hacer esto, la dispersión de relajación CPMG aprovecha el fenómeno del eco de espín . Esta técnica expone los núcleos objetivo a un pulso de 90 seguido de uno o más pulsos de 180. [59] A medida que los núcleos se reorientan, una distribución amplia indica que los núcleos objetivo están involucrados en un estado excitado intermedio. Al observar los gráficos de dispersión de relajación, los datos recopilan información sobre la termodinámica y la cinética entre el estado excitado y el fundamental. [59] [58] La transferencia de saturación mide los cambios en la señal del estado fundamental a medida que los estados excitados se perturban. Utiliza una irradiación de radiofrecuencia débil para saturar el estado excitado de un núcleo particular que transfiere su saturación al estado fundamental. [56] Esta señal se amplifica disminuyendo la magnetización (y la señal) del estado fundamental. [56] [58]
Las principales limitaciones de la RMN es que su resolución disminuye con proteínas mayores de 25 kDa y no es tan detallada como la cristalografía de rayos X. [56] Además, el análisis de RMN de proteínas es bastante difícil y puede proponer múltiples soluciones a partir del mismo espectro de RMN. [55]
En un estudio centrado en el plegamiento de una proteína involucrada en la esclerosis lateral amiotrófica , SOD1 , se estudiaron los intermediarios excitados con dispersión de relajación y transferencia de saturación. [60] La SOD1 se había vinculado previamente a muchos mutantes causantes de enfermedades que se suponía que estaban involucrados en la agregación de proteínas, sin embargo, el mecanismo aún era desconocido. Mediante el uso de experimentos de dispersión de relajación y transferencia de saturación, se descubrió que muchos estados intermedios excitados estaban mal plegados en los mutantes SOD1. [60]
La interferometría de polarización dual es una técnica basada en la superficie para medir las propiedades ópticas de las capas moleculares. Cuando se utiliza para caracterizar el plegamiento de proteínas, mide la conformación determinando el tamaño total de una monocapa de la proteína y su densidad en tiempo real con una resolución sub-Angstrom, [61] aunque la medición en tiempo real de la cinética del plegamiento de proteínas se limita a procesos que ocurren a una velocidad inferior a ~10 Hz. De manera similar al dicroísmo circular , el estímulo para el plegamiento puede ser un desnaturalizante o la temperatura .
El estudio del plegamiento de proteínas ha avanzado mucho en los últimos años gracias al desarrollo de técnicas rápidas y resueltas en el tiempo. Los experimentadores desencadenan rápidamente el plegamiento de una muestra de proteína desplegada y observan la dinámica resultante . Las técnicas rápidas en uso incluyen dispersión de neutrones , [62] mezcla ultrarrápida de soluciones, métodos fotoquímicos y espectroscopia de salto de temperatura láser . Entre los muchos científicos que han contribuido al desarrollo de estas técnicas se encuentran Jeremy Cook, Heinrich Roder, Terry Oas, Harry Gray , Martin Gruebele , Brian Dyer, William Eaton, Sheena Radford , Chris Dobson , Alan Fersht , Bengt Nölting y Lars Konermann.
La proteólisis se utiliza rutinariamente para investigar la fracción desplegada en una amplia gama de condiciones de solución (por ejemplo, proteólisis paralela rápida (FASTpp) . [63] [64]
Las técnicas de moléculas individuales, como las pinzas ópticas y el AFM, se han utilizado para comprender los mecanismos de plegamiento de proteínas de proteínas aisladas, así como de proteínas con chaperonas. [65] Las pinzas ópticas se han utilizado para estirar moléculas de proteínas individuales desde sus extremos C y N y desplegarlas para permitir el estudio del replegamiento posterior. [66] La técnica permite medir las tasas de plegamiento a nivel de una sola molécula; por ejemplo, las pinzas ópticas se han aplicado recientemente para estudiar el plegamiento y desplegamiento de proteínas implicadas en la coagulación sanguínea. El factor de von Willebrand (vWF) es una proteína con un papel esencial en el proceso de formación de coágulos sanguíneos. Se descubrió, utilizando la medición con pinzas ópticas de una sola molécula, que el vWF unido al calcio actúa como un sensor de fuerza de corte en la sangre. La fuerza de corte conduce al desplegamiento del dominio A2 del vWF, cuya tasa de replegamiento aumenta drásticamente en presencia de calcio. [67] Recientemente, también se demostró que el simple dominio src SH3 accede a múltiples vías de desplegamiento bajo fuerza. [68]
La pintura con biotina permite obtener instantáneas celulares específicas de la condición de las proteínas (no) plegadas. La "pintura" con biotina muestra un sesgo hacia las proteínas intrínsecamente desordenadas predichas . [69]
Los estudios computacionales del plegamiento de proteínas incluyen tres aspectos principales relacionados con la predicción de la estabilidad, la cinética y la estructura de las proteínas. Una revisión de 2013 resume los métodos computacionales disponibles para el plegamiento de proteínas. [70]
En 1969, Cyrus Levinthal observó que, debido a la gran cantidad de grados de libertad en una cadena polipeptídica desplegada, la molécula tiene una cantidad astronómica de conformaciones posibles. En uno de sus artículos, realizó una estimación de 3 300 o 10 143. [71] La paradoja de Levinthal es un experimento mental basado en la observación de que si una proteína se plegara mediante un muestreo secuencial de todas las conformaciones posibles, tomaría una cantidad astronómica de tiempo hacerlo, incluso si las conformaciones se muestrearan a una velocidad rápida (en la escala de nanosegundos o picosegundos ). [72] Basándose en la observación de que las proteínas se pliegan mucho más rápido que esto, Levinthal propuso entonces que no se produce una búsqueda conformacional aleatoria y que, por lo tanto, la proteína debe plegarse a través de una serie de estados intermedios metaestables .
El espacio de configuración de una proteína durante el plegamiento se puede visualizar como un paisaje energético . Según Joseph Bryngelson y Peter Wolynes , las proteínas siguen el principio de frustración mínima , lo que significa que las proteínas evolucionadas naturalmente han optimizado sus paisajes energéticos de plegamiento, [73] y que la naturaleza ha elegido secuencias de aminoácidos de modo que el estado plegado de la proteína sea suficientemente estable. Además, la adquisición del estado plegado tuvo que convertirse en un proceso suficientemente rápido. Aunque la naturaleza ha reducido el nivel de frustración en las proteínas, hasta ahora persiste cierto grado de ella, como se puede observar en la presencia de mínimos locales en el paisaje energético de las proteínas.
Una consecuencia de estas secuencias seleccionadas evolutivamente es que generalmente se piensa que las proteínas tienen "paisajes de energía en embudo" globalmente (un término acuñado por José Onuchic ) [74] que están dirigidos en gran medida hacia el estado nativo. Este paisaje de " embudo de plegamiento " permite que la proteína se pliegue al estado nativo a través de cualquiera de un gran número de vías e intermediarios, en lugar de estar restringida a un solo mecanismo. La teoría está respaldada tanto por simulaciones computacionales de proteínas modelo como por estudios experimentales [73] , y se ha utilizado para mejorar los métodos de predicción y diseño de la estructura de proteínas [73] . La descripción del plegamiento de proteínas por el paisaje de energía libre nivelador también es consistente con la segunda ley de la termodinámica [ 75] . Físicamente, pensar en paisajes en términos de superficies de energía potencial o total visualizables simplemente con máximos, puntos de silla, mínimos y embudos, más bien como paisajes geográficos, es quizás un poco engañoso. La descripción relevante es realmente un espacio de fase de alta dimensión en el que las variedades pueden tomar una variedad de formas topológicas más complicadas [76] .
La cadena polipeptídica desplegada comienza en la parte superior del embudo, donde puede asumir la mayor cantidad de variaciones desplegadas y se encuentra en su estado de energía más alto. Los paisajes energéticos como estos indican que hay una gran cantidad de posibilidades iniciales, pero solo es posible un único estado nativo; sin embargo, no revelan las numerosas vías de plegamiento que son posibles. Una molécula diferente de la misma proteína exacta puede ser capaz de seguir vías de plegamiento marginalmente diferentes, buscando diferentes intermediarios de menor energía, siempre que se alcance la misma estructura nativa. [77] Diferentes vías pueden tener diferentes frecuencias de utilización dependiendo de la favorabilidad termodinámica de cada vía. Esto significa que si se descubre que una vía es termodinámicamente más favorable que otra, es probable que se use con más frecuencia en la búsqueda de la estructura nativa. [77] A medida que la proteína comienza a plegarse y asumir sus diversas conformaciones, siempre busca una estructura termodinámicamente más favorable que antes y, por lo tanto, continúa a través del embudo de energía. La formación de estructuras secundarias es un fuerte indicio de una mayor estabilidad dentro de la proteína, y solo una combinación de estructuras secundarias asumidas por la estructura principal del polipéptido tendrá la energía más baja y, por lo tanto, estará presente en el estado nativo de la proteína. [77] Entre las primeras estructuras que se forman una vez que el polipéptido comienza a plegarse se encuentran las hélices alfa y los giros beta, donde las hélices alfa pueden formarse en tan solo 100 nanosegundos y los giros beta en 1 microsegundo. [30]
Existe un punto de silla en el diagrama del embudo de energía donde se encuentra el estado de transición para una proteína en particular. [30] El estado de transición en el diagrama del embudo de energía es la conformación que debe adoptar cada molécula de esa proteína si la proteína desea finalmente asumir la estructura nativa. Ninguna proteína puede asumir la estructura nativa sin pasar primero por el estado de transición. [30] El estado de transición puede considerarse una variante o forma prematura del estado nativo en lugar de simplemente otro paso intermedio. [78] Se ha demostrado que el plegamiento del estado de transición determina la velocidad y, aunque existe en un estado de energía más alto que el plegamiento nativo, se parece mucho a la estructura nativa. Dentro del estado de transición, existe un núcleo alrededor del cual la proteína puede plegarse, formado por un proceso conocido como "condensación de nucleación", donde la estructura comienza a colapsar sobre el núcleo. [78]
Las técnicas de novo o ab initio para la predicción computacional de la estructura de proteínas se pueden utilizar para simular varios aspectos del plegamiento de proteínas. La dinámica molecular (MD) se utilizó en simulaciones de plegamiento de proteínas y dinámica in silico . [79] Las primeras simulaciones de plegamiento de equilibrio se realizaron utilizando un modelo de solvente implícito y muestreo de paraguas . [80] Debido al costo computacional, las simulaciones de plegamiento MD ab initio con agua explícita están limitadas a péptidos y proteínas pequeñas. [81] [82] Las simulaciones MD de proteínas más grandes permanecen restringidas a la dinámica de la estructura experimental o su desdoblamiento a alta temperatura. Se puede acceder a los procesos de plegamiento de largo plazo (más allá de aproximadamente 1 milisegundo), como el plegamiento de proteínas más grandes (>150 residuos) utilizando modelos de grano grueso . [83] [84] [85]
Varios proyectos computacionales a gran escala, como Rosetta@home , [86] Folding@home [87] y Foldit , [88], se centran en el plegamiento de proteínas.
Se han realizado simulaciones de trayectoria continua de largo alcance en Anton , una supercomputadora masivamente paralela diseñada y construida alrededor de interconexiones y circuitos integrados de aplicación específica (ASIC) personalizados por DE Shaw Research . El resultado más extenso publicado de una simulación realizada con Anton hasta 2011 fue una simulación de 2,936 milisegundos de NTL9 a 355 K. [89] Dichas simulaciones actualmente pueden desplegar y replegar proteínas pequeñas (<150 residuos de aminoácidos) en equilibrio y predecir cómo las mutaciones afectan la cinética y la estabilidad del plegamiento. [90]
En 2020, un equipo de investigadores que utilizó AlphaFold , un programa de predicción de la estructura de proteínas de inteligencia artificial (IA) desarrollado por DeepMind, obtuvo el primer puesto en CASP , un concurso de predicción de estructuras de larga data. [91] El equipo logró un nivel de precisión mucho mayor que cualquier otro grupo. [92] Obtuvo una puntuación superior al 90 % para alrededor de dos tercios de las proteínas en la prueba de distancia global (GDT) de CASP , una prueba que mide el grado de similitud entre la estructura predicha por un programa computacional y la estructura empírica determinada experimentalmente en un laboratorio. Una puntuación de 100 se considera una coincidencia completa, dentro del límite de distancia utilizado para calcular la GDT. [93]
Los resultados de la predicción de la estructura de las proteínas de AlphaFold en CASP fueron descritos como "transformacionales" y "asombrosos". [94] [95] Algunos investigadores notaron que la precisión no es lo suficientemente alta para un tercio de sus predicciones, y que no revela el mecanismo físico del plegamiento de proteínas para que el problema del plegamiento de proteínas se considere resuelto. [96] Sin embargo, se considera un logro significativo en biología computacional [93] y un gran avance hacia un gran desafío de la biología que lleva décadas en marcha, predecir la estructura de las proteínas. [94]