Un mapa de contacto de proteínas representa la distancia entre todos los pares de residuos de aminoácidos posibles de una estructura proteica tridimensional utilizando una matriz bidimensional binaria . Para dos residuos y , el elemento de la matriz es 1 si los dos residuos están más cerca que un umbral predeterminado y 0 en caso contrario. Se han propuesto varias definiciones de contacto: la distancia entre el átomo C α -C α con umbral de 6-12 Å ; distancia entre átomos C β -C β con umbral de 6-12 Å (C α se utiliza para la glicina ); y distancia entre los centros de masa de las cadenas laterales .
Los mapas de contacto proporcionan una representación más reducida de la estructura de una proteína que sus coordenadas atómicas 3D completas. La ventaja es que los mapas de contacto son invariantes a las rotaciones y traslaciones. Se predicen más fácilmente mediante métodos de aprendizaje automático . También se ha demostrado que en determinadas circunstancias (por ejemplo, bajo contenido de contactos predichos erróneamente) es posible reconstruir las coordenadas 3D de una proteína utilizando su mapa de contacto. [1] [2]
Los mapas de contacto también se utilizan para la superposición de proteínas y para describir la similitud entre estructuras de proteínas. [3] Se predicen a partir de la secuencia de proteínas o se calculan a partir de una estructura dada.
Con la disponibilidad de un gran número de secuencias genómicas, resulta factible analizar dichas secuencias en busca de residuos que coevolucionen . La eficacia de este enfoque resulta del hecho de que es más probable que una mutación en la posición i de una proteína esté asociada con una mutación en la posición j que con una mutación inversa en i si ambas posiciones están acopladas funcionalmente (por ejemplo, al participar en un dominio enzimático, o al ser adyacentes en una proteína plegada, o incluso al ser adyacentes en un oligómero de esa proteína). [4]
Existen varios métodos estadísticos para extraer dichos pares de residuos acoplados de una alineación de secuencias múltiples : frecuencias observadas versus esperadas de pares de residuos (OMES); [5] la correlación de sustitución basada en McLachlan (McBASC); [6] el análisis de acoplamiento estadístico ; métodos basados en información mutua (MI); [7] y recientemente el análisis de acoplamiento directo (DCA). [8] [9]
Los algoritmos de aprendizaje automático han podido mejorar los métodos de análisis de MSA, especialmente para proteínas no homólogas (es decir, MSA superficiales). [10]
Los mapas de contacto predichos se han utilizado en la predicción de proteínas de membrana donde se dirigen las interacciones hélice-hélice. [11]
El conocimiento de la relación entre la estructura de una proteína y su comportamiento dinámico es esencial para comprender la función de las proteínas. La descripción de la estructura tridimensional de una proteína como una red de interacciones de enlaces de hidrógeno ( gráfico HB ) [12] se introdujo como una herramienta para explorar la estructura y la función de las proteínas. Al analizar la red de interacciones terciarias, se puede investigar la posible propagación de la información dentro de una proteína.
El diagrama HB ofrece una forma sencilla de analizar la estructura secundaria y la estructura terciaria de las proteínas . Los enlaces de hidrógeno que estabilizan los elementos estructurales secundarios ( enlaces de hidrógeno secundarios ) y los que se forman entre residuos de aminoácidos distantes (definidos como enlaces de hidrógeno terciarios ) se pueden distinguir fácilmente en el diagrama HB, por lo que se pueden identificar los residuos de aminoácidos involucrados en la estabilización de la estructura y la función de las proteínas.
En el gráfico se distinguen las interacciones de enlaces de hidrógeno entre cadenas principales, cadenas principales y cadenas laterales, y entre cadenas laterales . También se indican en los gráficos los enlaces de hidrógeno bifurcados y los enlaces de hidrógeno múltiples entre residuos de aminoácidos , así como los enlaces de hidrógeno intra e intercadena . Se distinguen tres clases de enlaces de hidrógeno mediante un código de colores: enlaces de hidrógeno cortos (distancia menor de 2,5 Å entre el donante y el aceptor), intermedios (entre 2,5 Å y 3,2 Å) y largos (mayores de 3,2 Å).
En las representaciones del diagrama HB se pueden reconocer fácilmente patrones característicos de elementos de estructura secundaria , como se indica a continuación:
Los citocromos P450 (P450s) son enzimas que metabolizan xenobióticos y que contienen hemo unido a la membrana , que utilizan oxígeno molecular y electrones de la NADPH citocromo P450 reductasa para oxidar sus sustratos . CYP2B4, un miembro de la familia del citocromo P450, es la única proteína dentro de esta familia, cuya estructura de rayos X tanto en forma abierta 11 como cerrada 12 está publicada. La comparación de las estructuras abiertas y cerradas de las estructuras de CYP2B4 revela un reordenamiento conformacional a gran escala entre los dos estados, con el mayor cambio conformacional alrededor de los residuos 215-225, que está ampliamente abierto en estado libre de ligando y cerrado después de la unión del ligando; y la región alrededor del bucle C cerca del hemo.
El examen del gráfico HB del estado cerrado y abierto del CYP2B4 reveló que el reordenamiento de los enlaces de hidrógeno terciarios estaba en excelente acuerdo con el conocimiento actual del ciclo catalítico del citocromo P450 .
El primer paso del ciclo catalítico de P450 se identifica como la unión del sustrato. La unión preliminar de un ligando cerca de la entrada rompe los enlaces de hidrógeno S212-E474, S207-H172 en la forma abierta de CYP2B4 y se forman los enlaces de hidrógeno E218-A102, Q215-L51 que fijan la entrada en la forma cerrada, como revela el diagrama HB.
El segundo paso es la transferencia del primer electrón del NADPH a través de una cadena de transferencia de electrones. Para la transferencia de electrones se produce un cambio conformacional que desencadena la interacción del P450 con la NADPH citocromo P450 reductasa. La ruptura de los enlaces de hidrógeno entre S128-N287, S128-T291, L124-N287 y la formación de S96-R434, A116-R434, R125-I435, D82-R400 en el sitio de unión de la NADPH citocromo P450 reductasa (como se ve en el diagrama HB) transforman al CYP2B4 a un estado de conformación, donde se produce la unión de la NADPH citocromo P450 reductasa.
En el tercer paso, el oxígeno ingresa al CYP2B4 en estado cerrado, el estado donde los enlaces de hidrógeno recién formados S176-T300, H172-S304, N167-R308 abren un túnel que tiene exactamente el tamaño y la forma de una molécula de oxígeno .
La familia de las lipocalinas es una familia grande y diversa de proteínas con funciones como transportadores de moléculas hidrofóbicas pequeñas. La beta-lactoglobulina es un miembro típico de la familia de las lipocalinas. Se descubrió que la beta-lactoglobulina tiene un papel en el transporte de ligandos hidrofóbicos como el retinol o los ácidos grasos . [13] Su estructura cristalina se determinó [por ejemplo, Qin, 1998] con diferentes ligandos y también en forma libre de ligando. Las estructuras cristalinas determinadas hasta ahora revelan que la lipocalina típica contiene ocho cadenas antiparalelas dispuestas para formar una cavidad central cónica en la que se une el ligando hidrofóbico. La estructura de la beta-lactoglobulina revela que la estructura en forma de barril con la cavidad central de la proteína tiene una "entrada" rodeada por cinco bucles beta con centros alrededor de 26, 35, 63, 87 y 111, que experimentan un cambio conformacional durante la unión del ligando y cierran la cavidad.
La forma general de la beta-lactoglobulina es característica de la familia de las lipocalinas. [ cita requerida ] En ausencia de hélices alfa , la diagonal principal casi desaparece y las diagonales cruzadas que representan las láminas beta dominan el gráfico. Se puede encontrar un número relativamente bajo de enlaces de hidrógeno terciarios en el gráfico, con tres regiones de alta densidad, una de las cuales está conectada a un bucle en los residuos alrededor de 63, una segunda está conectada al bucle alrededor de 87 y una tercera región que está conectada a las regiones 26 y 35. El quinto bucle alrededor de 111 está representado solo por un enlace de hidrógeno terciario en el gráfico HB.
En la estructura tridimensional, los enlaces de hidrógeno terciarios se forman (1) cerca de la entrada, directamente involucrados en el reordenamiento conformacional durante la unión del ligando; y (2) en el fondo del "barril". Los gráficos HB de las formas abierta y cerrada de beta-lactoglobulina son muy similares, todos los motivos únicos se pueden reconocer en ambas formas. La diferencia en los gráficos HB de la forma abierta y unida al ligando muestra pocos cambios individuales importantes en el patrón de enlaces de hidrógeno terciarios. Especialmente, la formación de enlaces de hidrógeno entre Y20-E157 y S21-H161 en forma cerrada podría ser crucial en el reordenamiento conformacional. Estos enlaces de hidrógeno se encuentran en el fondo de la cavidad, lo que sugiere que el cierre de la entrada de una lipocalina comienza cuando un ligando llega al fondo de la cavidad y rompe los enlaces de hidrógeno R123-Y99, R123-T18 y V41-Q120. Se sabe que las lipocalinas tienen una similitud de secuencia muy baja con una alta similitud estructural. [ cita requerida ] Las únicas regiones conservadas son exactamente la región alrededor de 20 y 160 con un papel desconocido.