Estructura biomolecular

La estructura biomolecular es la forma tridimensional intrincada y plegada que forma una molécula de proteína , ADN o ARN , y que es importante para su función. La estructura de estas moléculas puede considerarse en cualquiera de varias escalas de longitud que van desde el nivel de átomos individuales hasta las relaciones entre subunidades proteicas completas . Esta útil distinción entre escalas se expresa a menudo como una descomposición de la estructura molecular en cuatro niveles: primario, secundario, terciario y cuaternario. El andamiaje para esta organización multiescala de la molécula surge en el nivel secundario, donde los elementos estructurales fundamentales son los diversos enlaces de hidrógeno de la molécula . Esto conduce a varios dominios reconocibles de la estructura de la proteína y la estructura del ácido nucleico , incluidas características de la estructura secundaria como hélices alfa y láminas beta para proteínas, y bucles de horquilla , protuberancias y bucles internos para ácidos nucleicos. Los términos estructura primaria , secundaria , terciaria y cuaternaria fueron introducidos por Kaj Ulrik Linderstrøm-Lang en sus Lane Medical Lectures de 1951 en la Universidad de Stanford .

Estructura primaria

La estructura primaria de un biopolímero es la especificación exacta de su composición atómica y los enlaces químicos que conectan esos átomos (incluida la estereoquímica ). Para un biopolímero típico no ramificado ni reticulado (como una molécula de una proteína intracelular típica , o de ADN o ARN ), la estructura primaria es equivalente a especificar la secuencia de sus subunidades monoméricas , como aminoácidos o nucleótidos .

La estructura primaria de una proteína se informa comenzando desde el extremo N amino hasta el extremo C carboxilo , mientras que la estructura primaria de la molécula de ADN o ARN se conoce como la secuencia de ácido nucleico informada desde el extremo 5' hasta el extremo 3' . La secuencia de ácido nucleico se refiere a la secuencia exacta de nucleótidos que componen la molécula completa. A menudo, la estructura primaria codifica motivos de secuencia que son de importancia funcional. Algunos ejemplos de tales motivos son: las cajas C/D ^[1] y H/ACA ^[2] de los snoRNAs , el sitio de unión LSm encontrado en los ARN espliceosomales como U1 , U2 , U4 , U5 , U6 , U12 y U3 , la secuencia Shine-Dalgarno , ^[3] la secuencia de consenso de Kozak ^[4] y el terminador de la ARN polimerasa III . ^[5]

Estructura secundaria

La estructura secundaria de una proteína es el patrón de enlaces de hidrógeno en un biopolímero. Estos determinan la forma tridimensional general de los segmentos locales de los biopolímeros, pero no describen la estructura global de posiciones atómicas específicas en el espacio tridimensional, que se consideran estructura terciaria . La estructura secundaria se define formalmente por los enlaces de hidrógeno del biopolímero, como se observa en una estructura de resolución atómica. En las proteínas, la estructura secundaria se define por patrones de enlaces de hidrógeno entre los grupos amina y carboxilo de la cadena principal (los enlaces de hidrógeno cadena lateral-cadena principal y cadena lateral-cadena lateral son irrelevantes), donde se utiliza la definición DSSP de un enlace de hidrógeno.

La estructura secundaria de un ácido nucleico está definida por el enlace de hidrógeno entre las bases nitrogenadas.

Sin embargo, en el caso de las proteínas, el enlace de hidrógeno está correlacionado con otras características estructurales, lo que ha dado lugar a definiciones menos formales de la estructura secundaria. Por ejemplo, las hélices pueden adoptar ángulos diedros de la cadena principal en algunas regiones del diagrama de Ramachandran ; por lo tanto, un segmento de residuos con tales ángulos diedros a menudo se denomina hélice , independientemente de si tiene los enlaces de hidrógeno correctos. Se han propuesto muchas otras definiciones menos formales, que a menudo aplican conceptos de la geometría diferencial de curvas, como curvatura y torsión . Los biólogos estructurales que resuelven una nueva estructura de resolución atómica a veces asignan su estructura secundaria a simple vista y registran sus asignaciones en el archivo del Banco de Datos de Proteínas (PDB) correspondiente.

La estructura secundaria de una molécula de ácido nucleico se refiere a las interacciones de apareamiento de bases dentro de una molécula o conjunto de moléculas que interactúan. La estructura secundaria de los ARN biológicos a menudo se puede descomponer de forma única en tallos y bucles. A menudo, estos elementos o combinaciones de ellos se pueden clasificar aún más, por ejemplo, tetraloops , pseudonudos y tallo-bucles . Hay muchos elementos de estructura secundaria de importancia funcional para el ARN biológico. Los ejemplos famosos incluyen los tallo-bucles terminadores independientes de Rho y el trébol del ARN de transferencia (ARNt). Existe una pequeña industria de investigadores que intenta determinar la estructura secundaria de las moléculas de ARN. Los enfoques incluyen métodos tanto experimentales como computacionales (consulte también la Lista de software de predicción de la estructura del ARN ).

Estructura terciaria

La estructura terciaria de una proteína o cualquier otra macromolécula es su estructura tridimensional, definida por las coordenadas atómicas. ^[6] Las proteínas y los ácidos nucleicos se pliegan en estructuras tridimensionales complejas que dan lugar a las funciones de las moléculas. Si bien dichas estructuras son diversas y complejas, a menudo están compuestas por motivos y dominios de estructura terciaria reconocibles y recurrentes que sirven como bloques de construcción molecular. Se considera que la estructura terciaria está determinada en gran medida por la estructura primaria de la biomolécula (su secuencia de aminoácidos o nucleótidos ).

Estructura cuaternaria

La estructura cuaternaria de la proteína ^[a] se refiere al número y disposición de múltiples moléculas de proteína en un complejo de múltiples subunidades.

En el caso de los ácidos nucleicos, el término es menos común, pero puede referirse a la organización de nivel superior del ADN en la cromatina , ^[7] incluidas sus interacciones con las histonas , o a las interacciones entre unidades de ARN separadas en el ribosoma ^[8]^[9] o el espliceosoma .

Los virus , en general, pueden considerarse como máquinas moleculares. El bacteriófago T4 es un virus particularmente bien estudiado y su estructura cuaternaria de proteínas está relativamente bien definida. ^[10] Un estudio de Floor (1970) ^[11] mostró que, durante la construcción in vivo del virus por proteínas morfogenéticas específicas , estas proteínas deben producirse en proporciones equilibradas para que se produzca el ensamblaje adecuado del virus. La insuficiencia (debido a la mutación ) en la producción de una proteína morfogenética particular (por ejemplo, una proteína crítica de la fibra de la cola), puede conducir a la producción de virus descendientes casi todos los cuales tienen muy poco del componente proteico particular para funcionar correctamente, es decir, para infectar células huésped. ^[11] Sin embargo, una segunda mutación que reduce otro componente morfogenético (por ejemplo, en la placa base o la cabeza del fago) podría en algunos casos restablecer un equilibrio de modo que una mayor proporción de las partículas de virus producidas sean capaces de funcionar. ^[11] De este modo, se descubrió que una mutación que reduce la expresión de un gen, cuyo producto se emplea en la morfogénesis, puede ser suprimida parcialmente por una mutación que reduce la expresión de un segundo gen morfogenético, lo que da como resultado una producción más equilibrada de los productos génicos del virus. El concepto de que, in vivo , es necesaria una disponibilidad equilibrada de componentes para una morfogénesis molecular adecuada puede tener una aplicabilidad general para comprender el ensamblaje de las máquinas moleculares de las proteínas.

Determinación de la estructura

El sondeo de estructura es el proceso mediante el cual se utilizan técnicas bioquímicas para determinar la estructura biomolecular. ^[12] Este análisis se puede utilizar para definir los patrones que se pueden utilizar para inferir la estructura molecular, el análisis experimental de la estructura y la función molecular y una mayor comprensión del desarrollo de moléculas más pequeñas para futuras investigaciones biológicas. ^[13] El análisis de sondeo de estructura se puede realizar a través de muchos métodos diferentes, que incluyen el sondeo químico, el sondeo de radicales hidroxilo, el mapeo de interferencia de análogos de nucleótidos (NAIM) y el sondeo en línea. ^[12]

Las estructuras de proteínas y ácidos nucleicos se pueden determinar utilizando espectroscopia de resonancia magnética nuclear ( RMN ) o cristalografía de rayos X o criomicroscopía electrónica de partícula única ( cryoEM ). Los primeros informes publicados para ADN (por Rosalind Franklin y Raymond Gosling en 1953) de patrones de difracción de rayos X de A-ADN —y también B-ADN— utilizaron análisis basados en transformadas de funciones de Patterson que proporcionaron solo una cantidad limitada de información estructural para fibras orientadas de ADN aisladas de timo de ternera . ^[14]^[15] Luego, Wilkins et al. propusieron un análisis alternativo en 1953 para la difracción de rayos X de B-ADN y los patrones de dispersión de fibras de ADN hidratadas y orientadas a bacterias y cabezas de esperma de trucha en términos de cuadrados de funciones de Bessel . ^[16] Aunque la forma B-ADN es la más común en las condiciones que se encuentran en las células, ^[17] no es una conformación bien definida sino una familia o un conjunto difuso de conformaciones de ADN que ocurren en los altos niveles de hidratación presentes en una amplia variedad de células vivas. ^[18] Sus patrones de difracción y dispersión de rayos X correspondientes son característicos de los paracristales moleculares con un grado significativo de desorden (más del 20%), ^[19]^[20] y la estructura no es manejable utilizando solo el análisis estándar.

Por el contrario, el análisis estándar, que involucra solo transformadas de Fourier de funciones de Bessel ^[21] y modelos moleculares de ADN , todavía se utiliza rutinariamente para analizar patrones de difracción de rayos X de A-ADN y Z-ADN. ^[22]

Predicción de estructura

La predicción de la estructura biomolecular es la predicción de la estructura tridimensional de una proteína a partir de su secuencia de aminoácidos , o de un ácido nucleico a partir de su secuencia de nucleobases (bases). En otras palabras, es la predicción de la estructura secundaria y terciaria a partir de su estructura primaria. La predicción de la estructura es la inversa del diseño biomolecular, como en el diseño racional , el diseño de proteínas , el diseño de ácidos nucleicos y la ingeniería biomolecular .

La predicción de la estructura de las proteínas es uno de los objetivos más importantes que persiguen la bioinformática y la química teórica . La predicción de la estructura de las proteínas es de gran importancia en medicina (por ejemplo, en el diseño de fármacos ) y biotecnología (por ejemplo, en el diseño de nuevas enzimas ). Cada dos años, el rendimiento de los métodos actuales se evalúa en el experimento de Evaluación crítica de la predicción de la estructura de las proteínas ( CASP ).

También se ha realizado una cantidad significativa de investigación bioinformática dirigida al problema de la predicción de la estructura del ARN. Un problema común para los investigadores que trabajan con ARN es determinar la estructura tridimensional de la molécula dada solo la secuencia de ácido nucleico. Sin embargo, en el caso del ARN, gran parte de la estructura final está determinada por la estructura secundaria o las interacciones de apareamiento de bases intramoleculares de la molécula. Esto se demuestra por la alta conservación de los apareamientos de bases en diversas especies.

La estructura secundaria de las moléculas pequeñas de ácidos nucleicos está determinada en gran medida por interacciones locales fuertes, como los enlaces de hidrógeno y el apilamiento de bases . La suma de la energía libre para dichas interacciones, generalmente utilizando un método del vecino más cercano , proporciona una aproximación de la estabilidad de la estructura dada. ^[23] La forma más directa de encontrar la estructura de energía libre más baja sería generar todas las estructuras posibles y calcular la energía libre para ellas, pero el número de estructuras posibles para una secuencia aumenta exponencialmente con la longitud de la molécula. ^[24] Para moléculas más largas, el número de estructuras secundarias posibles es enorme. ^[23]

Los métodos de covariación de secuencias se basan en la existencia de un conjunto de datos compuesto por múltiples secuencias de ARN homólogas con secuencias relacionadas pero diferentes. Estos métodos analizan la covariación de los sitios de bases individuales en la evolución ; el mantenimiento en dos sitios ampliamente separados de un par de nucleótidos de apareamiento de bases indica la presencia de un enlace de hidrógeno estructuralmente requerido entre esas posiciones. Se ha demostrado que el problema general de la predicción de pseudonudos es NP-completo . ^[25]

Diseño

El diseño biomolecular puede considerarse lo inverso de la predicción de la estructura. En la predicción de la estructura, la estructura se determina a partir de una secuencia conocida, mientras que en el diseño de proteínas o ácidos nucleicos se genera una secuencia que formará una estructura deseada.

Otras biomoléculas

Otras biomoléculas, como los polisacáridos , los polifenoles y los lípidos , también pueden tener una estructura de orden superior de consecuencia biológica.

Véase también

Notas

^ Aquí cuaternario significa " estructura de cuarto nivel ", no " interacción de cuatro vías ". Etimológicamente, cuaternario es correcto: cuaternario se deriva del latín números distributivos y sigue a binario y ternario ; mientras que cuaternario se deriva del latín números ordinales y sigue a secundario y terciario . Sin embargo, cuaternario es estándar en biología.

Referencias

^ Samarsky DA, Fournier MJ, Singer RH, Bertrand E (julio de 1998). "El motivo de la caja C/D del ARNsno dirige la orientación nucleolar y también acopla la síntesis y localización del ARNsno". The EMBO Journal . 17 (13): 3747–57. doi :10.1093/emboj/17.13.3747. PMC 1170710 . PMID 9649444.
^ Ganot P, Caizergues-Ferrer M, Kiss T (abril de 1997). "La familia de ARN nucleolares pequeños de caja ACA se define por una estructura secundaria conservada evolutivamente y elementos de secuencia ubicuos esenciales para la acumulación de ARN". Genes & Development . 11 (7): 941–56. doi : 10.1101/gad.11.7.941 . PMID 9106664.
^ Shine J , Dalgarno L (marzo de 1975). "Determinante de la especificidad del cistrón en los ribosomas bacterianos". Nature . 254 (5495): 34–38. Bibcode :1975Natur.254...34S. doi :10.1038/254034a0. PMID 803646. S2CID 4162567.
^ Kozak M (octubre de 1987). "Análisis de secuencias no codificantes 5' de 699 ARN mensajeros de vertebrados". Nucleic Acids Research . 15 (20): 8125–48. doi :10.1093/nar/15.20.8125. PMC 306349 . PMID 3313277.
^ Bogenhagen DF, Brown DD (abril de 1981). "Secuencias de nucleótidos en el ADN 5S de Xenopus necesarias para la terminación de la transcripción". Cell . 24 (1): 261–70. doi :10.1016/0092-8674(81)90522-5. PMID 6263489. S2CID 9982829.
^ IUPAC , Compendio de terminología química , 2.ª edición (el "Libro de oro") (1997). Versión corregida en línea: (2006–) "estructura terciaria". doi :10.1351/goldbook.T06282
^ Sipski ML, Wagner TE (marzo de 1977). "Sondeo del ordenamiento cuaternario del ADN con espectroscopia de dicroísmo circular: estudios de fibras cromosómicas de esperma equino". Biopolímeros . 16 (3): 573–82. doi :10.1002/bip.1977.360160308. PMID 843604. S2CID 35930758.
^ Noller HF (1984). "Estructura del ARN ribosómico". Revista Anual de Bioquímica . 53 : 119–62. doi :10.1146/annurev.bi.53.070184.001003. PMID 6206780.
^ Nissen P, Ippolito JA, Ban N, Moore PB, Steitz TA (abril de 2001). "Interacciones terciarias del ARN en la subunidad ribosomal grande: el motivo A-minor". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 98 (9): 4899–903. Bibcode :2001PNAS...98.4899N. doi : 10.1073/pnas.081082398 . PMC 33135 . PMID 11296253.
^ Leiman PG, Kanamaru S, Mesyanzhinov VV, Arisaka F, Rossmann MG (noviembre de 2003). "Estructura y morfogénesis del bacteriófago T4". Cell Mol Life Sci . 60 (11): 2356–70. doi :10.1007/s00018-003-3072-1. PMC 11138918 . PMID 14625682.
^ abc Floor E (febrero de 1970). "Interacción de los genes morfogenéticos del bacteriófago T4". J Mol Biol . 47 (3): 293–306. doi :10.1016/0022-2836(70)90303-7. PMID 4907266.
^ ab Teunissen, A. W. M. (1979). RNA Structure Probing: Análisis de la estructura bioquímica de moléculas de ARN relacionadas con enfermedades autoinmunes . pp. 1–27. ISBN 978-90-901323-4-1.
^ Pace NR, Thomas BC, Woese CR (1999). Análisis comparativo de la estructura, función e historia del ARN . Cold Spring Harbor Laboratory Press. págs. 113-17. ISBN 978-0-87969-589-7.
^ Franklin RE , Gosling RG (6 de marzo de 1953). "La estructura de las fibras timonucleadas de sodio (I. La influencia del contenido de agua y II. La función de Patterson cilíndricamente simétrica)" (PDF) . Acta Crystallogr . 6 (8): 673–78. doi : 10.1107/s0365110x53001939 .
^ Franklin RE, Gosling RG (abril de 1953). "Configuración molecular en el timonucleato de sodio". Nature . 171 (4356): 740–41. Bibcode :1953Natur.171..740F. doi :10.1038/171740a0. PMID 13054694. S2CID 4268222.
^ Wilkins MH, Stokes AR, Wilson HR (abril de 1953). "Estructura molecular de los ácidos nucleicos desoxipentosos". Nature . 171 (4356): 738–40. Bibcode :1953Natur.171..738W. doi :10.1038/171738a0. PMID 13054693. S2CID 4280080.
^ Leslie AG, Arnott S, Chandrasekaran R, Ratliff RL (octubre de 1980). "Polimorfismo de las dobles hélices del ADN". Journal of Molecular Biology . 143 (1): 49–72. doi :10.1016/0022-2836(80)90124-2. PMID 7441761.
^ Baianu, I. C. (1980). "Orden estructural y desorden parcial en sistemas biológicos". Bull. Math. Biol . 42 (1): 137–41. doi :10.1007/BF02462372. S2CID 189888972.
^ Hosemann R, Bagchi RN (1962). Análisis directo de la difracción por materia . Ámsterdam/Nueva York: Holanda Septentrional.
^ Baianu IC (1978). "Dispersión de rayos X por sistemas de membrana parcialmente desordenados". Acta Crystallogr. A . 34 (5): 751–53. Código Bibliográfico :1978AcCrA..34..751B. doi :10.1107/s0567739478001540.
^ "Funciones de Bessel y difracción por estructuras helicoidales". planetphysics.org .^{[ enlace muerto permanente ]}
^ "Patrones de difracción de rayos X de cristales de ácido desoxirribonucleico (ADN) de doble hélice". planetphysics.org . Archivado desde el original el 24 de julio de 2009.
^ ab Mathews DH (junio de 2006). "Revoluciones en la predicción de la estructura secundaria del ARN". Journal of Molecular Biology . 359 (3): 526–32. doi :10.1016/j.jmb.2006.01.067. PMID 16500677.
^ Zuker M, Sankoff D (1984). "Estructuras secundarias del ARN y su predicción". Bull. Math. Biol . 46 (4): 591–621. doi :10.1007/BF02459506. S2CID 189885784.
^ Lyngsø RB, Pedersen CN (2000). "Predicción de pseudonudos de ARN en modelos basados en energía". Revista de biología computacional . 7 (3–4): 409–27. CiteSeerX 10.1.1.34.4044 . doi :10.1089/106652700750050862. PMID 11108471.