Un complejo proteico o complejo multiproteico es un grupo de dos o más cadenas polipeptídicas asociadas . Los complejos proteicos se diferencian de las enzimas multidominio, en las que se encuentran múltiples dominios catalíticos en una sola cadena polipeptídica. [1]
Los complejos proteicos son una forma de estructura cuaternaria. Las proteínas de un complejo proteico están unidas por interacciones proteína-proteína no covalentes . Estos complejos son la piedra angular de muchos procesos biológicos (si no de la mayoría). Se considera que la célula está compuesta por complejos supramoleculares modulares, cada uno de los cuales realiza una función biológica independiente y discreta. [2]
Gracias a la proximidad, se puede mejorar enormemente la velocidad y la selectividad de las interacciones de unión entre el complejo enzimático y los sustratos, lo que conduce a una mayor eficiencia celular. Muchas de las técnicas utilizadas para ingresar a las células y aislar proteínas son inherentemente disruptivas para complejos tan grandes, lo que complica la tarea de determinar los componentes de un complejo.
Entre los ejemplos de complejos proteicos se incluyen el proteasoma para la degradación molecular y la mayoría de las ARN polimerasas . En los complejos estables, las grandes interfaces hidrofóbicas entre proteínas suelen enterrarse en áreas superficiales mayores a 2500 Ås cuadrados . [3]
La formación de complejos proteicos puede activar o inhibir uno o más de los miembros del complejo y, de esta manera, la formación de complejos proteicos puede ser similar a la fosforilación . Las proteínas individuales pueden participar en una variedad de complejos proteicos. Diferentes complejos realizan diferentes funciones y el mismo complejo puede realizar múltiples funciones dependiendo de varios factores. Los factores incluyen:
Muchos complejos proteicos son bien conocidos, en particular en el organismo modelo Saccharomyces cerevisiae (levadura). En el caso de este organismo relativamente simple, el estudio de los complejos proteicos abarca ahora todo el genoma y la elucidación de la mayoría de sus complejos proteicos está en curso. [ cita requerida ] En 2021, los investigadores utilizaron el software de aprendizaje profundo RoseTTAFold junto con AlphaFold para resolver las estructuras de 712 complejos eucariotas . Compararon 6000 proteínas de levadura con las de otros 2026 hongos y 4325 eucariotas. [4]
Si una proteína puede formar una estructura estable y bien plegada por sí sola (sin ninguna otra proteína asociada) in vivo , entonces los complejos formados por dichas proteínas se denominan "complejos proteicos no obligados". Sin embargo, no se puede encontrar que algunas proteínas creen una estructura estable y bien plegada por sí solas, sino que pueden encontrarse como parte de un complejo proteico que estabiliza las proteínas constituyentes. Dichos complejos proteicos se denominan "complejos proteicos obligados". [5]
Los complejos proteicos transitorios se forman y se descomponen transitoriamente in vivo , mientras que los complejos permanentes tienen una vida media relativamente larga. Normalmente, las interacciones obligadas (interacciones proteína-proteína en un complejo obligado) son permanentes, mientras que se ha descubierto que las interacciones no obligadas son permanentes o transitorias. [5] Nótese que no hay una distinción clara entre interacción obligada y no obligada, sino que existe un continuo entre ellas que depende de varias condiciones, por ejemplo, pH, concentración de proteína, etc. [6] Sin embargo, hay distinciones importantes entre las propiedades de las interacciones transitorias y permanentes/estables: las interacciones estables están altamente conservadas, pero las interacciones transitorias están mucho menos conservadas, las proteínas interactuantes en los dos lados de una interacción estable tienen más tendencia a ser coexpresadas que las de una interacción transitoria (de hecho, la probabilidad de coexpresión entre dos proteínas que interactúan transitoriamente no es mayor que la de dos proteínas aleatorias), y las interacciones transitorias están mucho menos co-localizadas que las interacciones estables. [7] Aunque transitorias por naturaleza, las interacciones transitorias son muy importantes para la biología celular: el interactoma humano está enriquecido en tales interacciones, estas interacciones son los actores dominantes de la regulación genética y la transducción de señales, y se ha descubierto que las proteínas con regiones intrínsecamente desordenadas (IDR: regiones en la proteína que muestran estructuras de interconversión dinámicas en el estado nativo) están enriquecidas en interacciones transitorias de regulación y señalización. [5]
Los complejos proteicos difusos tienen más de una forma estructural o desorden estructural dinámico en el estado ligado. [8] Esto significa que las proteínas pueden no plegarse completamente en complejos transitorios o permanentes. En consecuencia, complejos específicos pueden tener interacciones ambiguas, que varían según las señales ambientales. Por lo tanto, diferentes conjuntos de estructuras dan como resultado funciones biológicas diferentes (incluso opuestas). [9] Las modificaciones postraduccionales, las interacciones proteicas o el empalme alternativo modulan los conjuntos conformacionales de los complejos difusos, para ajustar la afinidad o especificidad de las interacciones. Estos mecanismos se utilizan a menudo para la regulación dentro de la maquinaria de transcripción eucariota . [10]
Aunque algunos estudios tempranos [12] sugirieron una fuerte correlación entre la esencialidad y el grado de interacción de proteínas (la regla de "centralidad-letalidad"), análisis posteriores han demostrado que esta correlación es débil para interacciones binarias o transitorias (por ejemplo, dos híbridos de levadura ). [13] [14] Sin embargo, la correlación es robusta para redes de interacciones estables de co-complejos. De hecho, un número desproporcionado de genes esenciales pertenecen a complejos proteicos. [15] Esto llevó a la conclusión de que la esencialidad es una propiedad de las máquinas moleculares (es decir, complejos) en lugar de componentes individuales. [15] Wang et al. (2009) notaron que los complejos proteicos más grandes tienen más probabilidades de ser esenciales, lo que explica por qué los genes esenciales tienen más probabilidades de tener un alto grado de interacción de co-complejos. [16] Ryan et al. (2013) se refirieron a la observación de que complejos enteros parecen esenciales como " esencialidad modular ". [11] Estos autores también demostraron que los complejos tienden a estar compuestos de proteínas esenciales o no esenciales en lugar de mostrar una distribución aleatoria (ver Figura). Sin embargo, este no es un fenómeno de todo o nada: solo alrededor del 26% (105/401) de los complejos de levadura consisten únicamente en subunidades esenciales o únicamente no esenciales. [11]
En los seres humanos, los genes cuyos productos proteicos pertenecen al mismo complejo tienen más probabilidades de dar lugar al mismo fenotipo de enfermedad. [17] [18] [19]
Las subunidades de una proteína multimérica pueden ser idénticas como en una proteína homomultimérica (homooligomérica) o diferentes como en una proteína heteromultimérica. Muchas proteínas solubles y de membrana forman complejos homomultiméricos en una célula; la mayoría de las proteínas del Protein Data Bank son homomultiméricas. [20] Los homooligómeros son responsables de la diversidad y especificidad de muchas vías, pueden mediar y regular la expresión génica, la actividad de las enzimas, los canales iónicos, los receptores y los procesos de adhesión celular.
Los canales de potasio dependientes del voltaje en la membrana plasmática de una neurona son proteínas heteromultiméricas compuestas por cuatro de las cuarenta subunidades alfa conocidas. Las subunidades deben ser de la misma subfamilia para formar el canal proteico multimérico. La estructura terciaria del canal permite que los iones fluyan a través de la membrana plasmática hidrofóbica. Los conexones son un ejemplo de una proteína homomultimérica compuesta por seis conexinas idénticas . Un grupo de conexones forma la unión en hendidura en dos neuronas que transmiten señales a través de una sinapsis eléctrica .
Cuando varias copias de un polipéptido codificado por un gen forman un complejo, esta estructura proteica se denomina multímero. Cuando un multímero se forma a partir de polipéptidos producidos por dos alelos mutantes diferentes de un gen particular, el multímero mixto puede exhibir una mayor actividad funcional que los multímeros no mezclados formados por cada uno de los mutantes solos. En tal caso, el fenómeno se denomina complementación intragénica (también llamada complementación interalélica). La complementación intragénica se ha demostrado en muchos genes diferentes en una variedad de organismos, incluidos los hongos Neurospora crassa , Saccharomyces cerevisiae y Schizosaccharomyces pombe ; la bacteria Salmonella typhimurium ; el virus bacteriófago T4 , [21] un virus de ARN [22] y humanos. [23] En tales estudios, numerosas mutaciones defectuosas en el mismo gen a menudo se aislaron y mapearon en un orden lineal sobre la base de frecuencias de recombinación para formar un mapa genético del gen. Por otra parte, se analizaron los mutantes en combinaciones de pares para medir la complementación. Un análisis de los resultados de dichos estudios condujo a la conclusión de que la complementación intragénica, en general, surge de la interacción de monómeros polipeptídicos defectuosos de diferente tipo para formar un multímero. [24] Los genes que codifican polipéptidos formadores de multímeros parecen ser comunes. Una interpretación de los datos es que los monómeros polipeptídicos a menudo se alinean en el multímero de tal manera que los polipéptidos mutantes defectuosos en sitios cercanos en el mapa genético tienden a formar un multímero mixto que funciona mal, mientras que los polipéptidos mutantes defectuosos en sitios distantes tienden a formar un multímero mixto que funciona de manera más eficaz. Jehle analizó las fuerzas intermoleculares probablemente responsables del autorreconocimiento y la formación de multímeros. [25]
La estructura molecular de los complejos proteicos se puede determinar mediante técnicas experimentales como la cristalografía de rayos X , el análisis de partículas individuales o la resonancia magnética nuclear . Cada vez más , también está disponible la opción teórica del acoplamiento proteína-proteína . Un método que se utiliza comúnmente para identificar los complejos proteicos [ aclaración necesaria ] es la inmunoprecipitación . Recientemente, Raicu y sus colaboradores desarrollaron un método para determinar la estructura cuaternaria de los complejos proteicos en células vivas. Este método se basa en la determinación de la eficiencia de transferencia de energía por resonancia de Förster (FRET) a nivel de píxel junto con un microscopio de dos fotones con resolución espectral . La distribución de las eficiencias de FRET se simula frente a diferentes modelos para obtener la geometría y la estequiometría de los complejos. [26]
El ensamblaje adecuado de los complejos multiproteicos es importante, ya que un ensamblaje incorrecto puede tener consecuencias desastrosas. [27] Para estudiar el ensamblaje de la vía, los investigadores observan los pasos intermedios de la misma. Una de esas técnicas que permite hacerlo es la espectrometría de masas por electrospray , que puede identificar diferentes estados intermedios simultáneamente. Esto ha llevado al descubrimiento de que la mayoría de los complejos siguen una vía de ensamblaje ordenada. [28] En los casos en los que es posible el ensamblaje desordenado, el cambio de un estado ordenado a uno desordenado conduce a una transición de la función a la disfunción del complejo, ya que el ensamblaje desordenado conduce a la agregación. [29]
La estructura de las proteínas influye en el modo en que se ensambla el complejo multiproteico. Las interfases entre proteínas se pueden utilizar para predecir las vías de ensamblaje. [28] La flexibilidad intrínseca de las proteínas también influye: las proteínas más flexibles permiten disponer de una mayor superficie para la interacción. [30]
Si bien el ensamblaje es un proceso diferente del desensamblaje, ambos son reversibles tanto en los complejos homoméricos como en los heteroméricos. Por lo tanto, el proceso general puede denominarse (des)ensamblaje.
En los complejos homomultiméricos, las proteínas homoméricas se ensamblan de una manera que imita la evolución. Es decir, hay un intermediario en el proceso de ensamblaje en la historia evolutiva del complejo. [31] El fenómeno opuesto se observa en los complejos heteromultiméricos, donde la fusión de genes ocurre de una manera que preserva la vía de ensamblaje original. [28]
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )