En biología molecular , el término doble hélice [1] se refiere a la estructura formada por moléculas de doble cadena de ácidos nucleicos como el ADN . La estructura de doble hélice de un complejo de ácido nucleico surge como consecuencia de su estructura secundaria , y es un componente fundamental para determinar su estructura terciaria . La estructura fue descubierta por Maurice Wilkins , Rosalind Franklin , su alumno Raymond Gosling , James Watson y Francis Crick , [2] mientras que el término "doble hélice" entró en la cultura popular con la publicación en 1968 de The Double Helix: A Personal Account of the Discovery of the Structure of DNA de Watson .
El biopolímero de doble hélice de ADN del ácido nucleico se mantiene unido por nucleótidos que se aparean entre sí. [3] En el ADN-B , la estructura de doble hélice más común que se encuentra en la naturaleza, la doble hélice es dextrógira con alrededor de 10–10,5 pares de bases por vuelta. [4] La estructura de doble hélice del ADN contiene un surco mayor y un surco menor . En el ADN-B, el surco mayor es más ancho que el surco menor. [3] Dada la diferencia en los anchos del surco mayor y el surco menor, muchas proteínas que se unen al ADN-B lo hacen a través del surco mayor más ancho. [5]
El modelo de doble hélice de la estructura del ADN fue publicado por primera vez en la revista Nature por James Watson y Francis Crick en 1953, [6] (las coordenadas X, Y, Z en 1954 [7] ) basándose en el trabajo de Rosalind Franklin y su estudiante Raymond Gosling , quienes tomaron la crucial imagen de difracción de rayos X del ADN etiquetada como " Foto 51 ", [8] [9] y Maurice Wilkins , Alexander Stokes y Herbert Wilson , [10] y la información química y bioquímica de apareamiento de bases de Erwin Chargaff . [11] [12] [13] [14] [15] [16] Antes de esto, Linus Pauling —quien ya había caracterizado con precisión la conformación de los motivos de estructura secundaria de las proteínas— y su colaborador Robert Corey habían postulado, erróneamente, que el ADN adoptaría una conformación de triple cadena . [17]
El descubrimiento de que la estructura del ADN es la de una doble hélice permitió esclarecer el mecanismo de apareamiento de bases mediante el cual se almacena y copia la información genética en los organismos vivos, y se considera ampliamente uno de los descubrimientos científicos más importantes del siglo XX. Crick, Wilkins y Watson recibieron cada uno un tercio del Premio Nobel de Fisiología o Medicina de 1962 por sus contribuciones al descubrimiento. [18]
La hibridación es el proceso de unión de pares de bases complementarios para formar una doble hélice. La fusión es el proceso por el cual se rompen las interacciones entre las hebras de la doble hélice, separando las dos hebras de ácido nucleico. Estos enlaces son débiles, se separan fácilmente mediante un calentamiento suave, enzimas o fuerza mecánica. La fusión ocurre preferentemente en ciertos puntos del ácido nucleico. [19] Las regiones ricas en T y A se funden más fácilmente que las regiones ricas en C y G. Algunos pasos de bases (pares) también son susceptibles a la fusión del ADN, como TA y TG . [20] Estas características mecánicas se reflejan en el uso de secuencias como TATA al comienzo de muchos genes para ayudar a la ARN polimerasa a fundir el ADN para la transcripción.
La separación de las hebras mediante un calentamiento suave, como se utiliza en la reacción en cadena de la polimerasa (PCR), es sencilla, siempre que las moléculas tengan menos de unos 10.000 pares de bases (10 kilopares de bases o 10 kbp). El entrelazamiento de las hebras de ADN hace que los segmentos largos sean difíciles de separar. [21] La célula evita este problema permitiendo que sus enzimas de fusión del ADN ( helicasas ) trabajen simultáneamente con las topoisomerasas , que pueden escindir químicamente la cadena principal de fosfato de una de las hebras para que pueda girar alrededor de la otra. [22] Las helicasas desenrollan las hebras para facilitar el avance de las enzimas de lectura de secuencias, como la ADN polimerasa . [23]
La geometría de un paso de base o de un par de bases se puede caracterizar mediante seis coordenadas: desplazamiento, deslizamiento, elevación, inclinación, giro y torsión. Estos valores definen con precisión la ubicación y la orientación en el espacio de cada base o par de bases en una molécula de ácido nucleico en relación con su predecesor a lo largo del eje de la hélice. Juntos, caracterizan la estructura helicoidal de la molécula. En las regiones de ADN o ARN donde se altera la estructura normal , el cambio en estos valores se puede utilizar para describir dicha alteración.
Para cada par de bases, considerado en relación con su predecesor, existen las siguientes geometrías de pares de bases a tener en cuenta: [24] [25] [26]
La elevación y la torsión determinan la lateralidad y el paso de la hélice. Las otras coordenadas, por el contrario, pueden ser cero. El deslizamiento y el desplazamiento son típicamente pequeños en el ADN-B, pero son sustanciales en el ADN-A y Z. El giro y la inclinación hacen que los pares de bases sucesivos sean menos paralelos y son típicamente pequeños.
En la literatura científica, el término "inclinación" se ha utilizado a menudo de forma diferente, haciendo referencia a la desviación del primer eje de pares de bases entre hebras con respecto a la perpendicularidad con respecto al eje de la hélice. Esto corresponde a un deslizamiento entre una sucesión de pares de bases y, en coordenadas basadas en hélices, se denomina correctamente "inclinación".
Se cree que en la naturaleza se encuentran al menos tres conformaciones de ADN: ADN-A , ADN-B y ADN-Z . Se cree que la forma B descrita por James Watson y Francis Crick predomina en las células. [27] Tiene 23,7 Å de ancho y se extiende 34 Å por cada 10 pb de secuencia. La doble hélice realiza una vuelta completa sobre su eje cada 10,4–10,5 pares de bases en solución. Esta frecuencia de torsión (denominada paso helicoidal ) depende en gran medida de las fuerzas de apilamiento que cada base ejerce sobre sus vecinas en la cadena. La configuración absoluta de las bases determina la dirección de la curva helicoidal para una conformación dada.
El ADN-A y el ADN-Z difieren significativamente en su geometría y dimensiones del ADN-B, aunque aún forman estructuras helicoidales. Durante mucho tiempo se pensó que la forma A solo se presenta en muestras deshidratadas de ADN en el laboratorio, como las que se usan en experimentos cristalográficos , y en apareamientos híbridos de cadenas de ADN y ARN , pero la deshidratación del ADN ocurre in vivo , y ahora se sabe que el ADN-A tiene funciones biológicas . Los segmentos de ADN que las células han metilado con fines reguladores pueden adoptar la geometría Z, en la que las cadenas giran alrededor del eje helicoidal en sentido opuesto al ADN-A y al ADN-B. También hay evidencia de complejos proteína-ADN que forman estructuras de ADN-Z.
Son posibles otras conformaciones; hasta ahora se han descrito A-ADN, B-ADN, C-ADN , E-ADN, [28] L -ADN (la forma enantiomérica de D -ADN), [29] P-ADN, [30] S-ADN, Z-ADN, etc. [31] De hecho, ahora solo están disponibles las letras F, Q, U, V e Y [actualizar]para describir cualquier nueva estructura de ADN que pueda aparecer en el futuro. [32] [33] Sin embargo, la mayoría de estas formas se han creado sintéticamente y no se han observado en sistemas biológicos naturales. [ cita requerida ] También hay formas de ADN de triple cadena y formas cuádruplex como el G-quadruplex y el i-motif .
Las hebras helicoidales gemelas forman la estructura principal del ADN. Se puede encontrar otra doble hélice rastreando los espacios, o surcos, entre las hebras. Estos huecos son adyacentes a los pares de bases y pueden proporcionar un sitio de unión . [37] Como las hebras no están directamente opuestas entre sí, los surcos tienen un tamaño desigual. Un surco, el surco mayor, tiene 22 Å de ancho y el otro, el surco menor, tiene 12 Å de ancho. [38] La estrechez del surco menor significa que los bordes de las bases son más accesibles en el surco mayor. Como resultado, las proteínas como los factores de transcripción que pueden unirse a secuencias específicas en el ADN bicatenario generalmente hacen contacto con los lados de las bases expuestas en el surco mayor. [5] Esta situación varía en conformaciones inusuales del ADN dentro de la célula (ver más abajo) , pero los surcos mayor y menor siempre se nombran para reflejar las diferencias de tamaño que se verían si el ADN se retuerce de nuevo a la forma B ordinaria. [39]
A finales de los años 1970 se consideraron brevemente modelos alternativos no helicoidales como una posible solución a los problemas de replicación del ADN en plásmidos y cromatina . Sin embargo, los modelos se dejaron de lado en favor del modelo de doble hélice debido a los avances experimentales posteriores, como la cristalografía de rayos X de los dúplex de ADN y más tarde la partícula central del nucleosoma , y el descubrimiento de las topoisomerasas . Además, los modelos no de doble hélice no son aceptados actualmente por la comunidad científica convencional. [40] [41]
El ADN es un polímero relativamente rígido, que se modela típicamente como una cadena con forma de gusano . Tiene tres grados de libertad importantes: flexión, torsión y compresión, cada uno de los cuales impone ciertos límites a lo que es posible con el ADN dentro de una célula. La rigidez de torsión es importante para la circularización del ADN y la orientación de las proteínas unidas al ADN entre sí, y la rigidez axial de flexión es importante para la envoltura y circularización del ADN y las interacciones proteicas. La compresión-extensión es relativamente poco importante en ausencia de alta tensión.
El ADN en solución no adopta una estructura rígida, sino que cambia continuamente de conformación debido a la vibración térmica y a las colisiones con las moléculas de agua, lo que hace imposible aplicar las medidas clásicas de rigidez. Por lo tanto, la rigidez a la flexión del ADN se mide mediante la longitud de persistencia, definida como:
La flexibilidad de flexión de un polímero se cuantifica convencionalmente en términos de su longitud de persistencia, Lp, una escala de longitud por debajo de la cual el polímero se comporta más o menos como una varilla rígida. Específicamente, Lp se define como la longitud del segmento de polímero sobre el cual la orientación promediada en el tiempo del polímero deja de estar correlacionada... [42]
Este valor se puede medir directamente utilizando un microscopio de fuerza atómica para obtener imágenes directas de moléculas de ADN de varias longitudes. En una solución acuosa, se ha descubierto que la longitud de persistencia promedio es de alrededor de 50 nm (o 150 pares de bases). [43] En términos más generales, se ha observado que es de entre 45 y 60 nm [44] o 132-176 pares de bases (el diámetro del ADN es de 2 nm) [45]. Esto puede variar significativamente debido a las variaciones de temperatura, las condiciones de la solución acuosa y la longitud del ADN. [44] Esto hace que el ADN sea una molécula moderadamente rígida. [43]
La duración de persistencia de una sección de ADN depende en cierta medida de su secuencia, y esto puede causar una variación significativa. La variación se debe en gran medida a las energías de apilamiento de bases y a los residuos que se extienden hacia los surcos mayor y menor .
En escalas de longitud mayores que la longitud de persistencia , la flexibilidad entrópica del ADN es notablemente consistente con los modelos estándar de física de polímeros , como el modelo de cadena similar a un gusano de Kratky-Porod . [47] En consonancia con el modelo de cadena similar a un gusano está la observación de que la curvatura del ADN también se describe mediante la ley de Hooke a fuerzas muy pequeñas (sub- piconewton ). Para segmentos de ADN menores que la longitud de persistencia, la fuerza de curvatura es aproximadamente constante y el comportamiento se desvía de las predicciones de la cadena similar a un gusano.
Este efecto da como resultado una facilidad inusual para circularizar pequeñas moléculas de ADN y una mayor probabilidad de encontrar secciones de ADN muy dobladas. [48]
Las moléculas de ADN suelen tener una dirección preferida para doblarse, es decir, una curvatura anisotrópica . Esto se debe, nuevamente, a las propiedades de las bases que componen la secuencia de ADN: una secuencia aleatoria no tendrá una dirección preferida para doblarse, es decir, una curvatura isotrópica.
La dirección preferida de curvatura del ADN está determinada por la estabilidad del apilamiento de cada base sobre la siguiente. Si siempre se encuentran pasos de apilamiento de bases inestables en un lado de la hélice del ADN, entonces el ADN se curvará preferentemente en dirección opuesta a esa dirección. A medida que aumenta el ángulo de curvatura, los impedimentos estéricos y la capacidad de hacer rodar los residuos entre sí también juegan un papel, especialmente en el surco menor. Los residuos A y T se encontrarán preferentemente en los surcos menores en el interior de las curvaturas. Este efecto se observa particularmente en la unión de ADN y proteína donde se induce una curvatura fuerte del ADN, como en las partículas de nucleosomas . Vea las distorsiones de los pasos de base más arriba.
Las moléculas de ADN con una preferencia excepcional por la curvatura pueden llegar a ser intrínsecamente curvas. Esto se observó por primera vez en el ADN del cinetoplasto de los tripanosomátidos . Las secuencias típicas que provocan esto contienen tramos de 4 a 6 residuos T y A separados por secciones ricas en G y C que mantienen los residuos A y T en fase con el surco menor en un lado de la molécula. Por ejemplo:
La estructura intrínsecamente curvada se induce por la "torsión de hélice" de los pares de bases entre sí, lo que permite la formación de enlaces de hidrógeno bifurcados inusuales entre los escalones de las bases. A temperaturas más altas, esta estructura se desnaturaliza y, por lo tanto, se pierde la curvatura intrínseca.
Todo ADN que se dobla de manera anisotrópica tiene, en promedio, una mayor duración de persistencia y una mayor rigidez axial. Esta mayor rigidez es necesaria para evitar una flexión aleatoria que haría que la molécula actúe de manera isotrópica.
La circularización del ADN depende tanto de la rigidez axial (de flexión) como de la rigidez torsional (rotacional) de la molécula. Para que una molécula de ADN se circularice con éxito, debe ser lo suficientemente larga como para doblarse fácilmente en el círculo completo y debe tener el número correcto de bases para que los extremos estén en la rotación correcta para permitir que se produzca la unión. La longitud óptima para la circularización del ADN es de alrededor de 400 pares de bases (136 nm) [ cita requerida ] , con un número entero de vueltas de la hélice de ADN, es decir, múltiplos de 10,4 pares de bases. Tener un número no entero de vueltas presenta una barrera energética significativa para la circularización, por ejemplo, una molécula de 10,4 x 30 = 312 pares de bases se circularizará cientos de veces más rápido que una molécula de 10,4 x 30,5 ≈ 317 pares de bases. [49]
La curvatura de los segmentos cortos de ADN circularizados no es uniforme. En cambio, en el caso de los segmentos de ADN circularizados de longitud inferior a la de persistencia, la curvatura del ADN se localiza en 1 o 2 pliegues que se forman preferentemente en los segmentos ricos en AT. Si hay una muesca , la curvatura se localizará en el sitio de la muesca. [48]
Los tramos más largos de ADN son entrópicamente elásticos bajo tensión. Cuando el ADN está en solución, sufre variaciones estructurales continuas debido a la energía disponible en el baño térmico del disolvente. Esto se debe a la vibración térmica de la molécula combinada con colisiones continuas con moléculas de agua. Por razones entrópicas , los estados relajados más compactos son térmicamente accesibles que los estados estirados, y por eso las moléculas de ADN se encuentran casi universalmente en disposiciones relajadas enredadas. Por esta razón, una molécula de ADN se estirará bajo una fuerza, enderezándola. Utilizando pinzas ópticas , se ha estudiado y analizado el comportamiento de estiramiento entrópico del ADN desde una perspectiva de física de polímeros , y se ha descubierto que el ADN se comporta en gran medida como el modelo de cadena similar a un gusano de Kratky-Porod en escalas de energía fisiológicamente accesibles.
Se cree que, bajo una tensión suficiente y un par positivo, el ADN experimenta una transición de fase en la que las bases se expanden hacia afuera y los fosfatos se desplazan hacia el centro. Esta estructura propuesta para el ADN sobreestirado se ha denominado ADN en forma P , en honor a Linus Pauling, quien la presentó originalmente como una posible estructura del ADN. [30]
La evidencia del estiramiento mecánico del ADN en ausencia de un torque impuesto apunta a una transición o transiciones que conducen a estructuras adicionales que generalmente se conocen como ADN en forma S. Estas estructuras aún no se han caracterizado definitivamente debido a la dificultad de realizar imágenes de resolución atómica en solución mientras se aplica fuerza, aunque se han realizado muchos estudios de simulación por computadora (por ejemplo, [50] [51] ).
Las estructuras de S-ADN propuestas incluyen aquellas que preservan el apilamiento de pares de bases y los enlaces de hidrógeno (ricas en GC), mientras liberan la extensión por inclinación, así como estructuras en las que tiene lugar una fusión parcial del apilamiento de bases, mientras que la asociación base-base se conserva en general (ricas en AT).
Se ha propuesto la fractura periódica de la pila de pares de bases con una ruptura que ocurre una vez cada tres pb (por lo tanto, uno de cada tres pasos pb-pb) como una estructura regular que preserva la planaridad de la pila de bases y libera la cantidad apropiada de extensión, [52] con el término "Σ-ADN" introducido como un mnemónico, con los tres puntos orientados hacia la derecha del carácter Sigma sirviendo como recordatorio de los tres pares de bases agrupados. Se ha demostrado que la forma Σ tiene una preferencia de secuencia por los motivos GNC que se cree que, según la hipótesis GNC, son de importancia evolutiva. [53]
La forma B de la hélice de ADN gira 360° cada 10,4-10,5 pb en ausencia de tensión torsional. Pero muchos procesos biológicos moleculares pueden inducir tensión torsional. Un segmento de ADN con torsión helicoidal excesiva o insuficiente se denomina, respectivamente, superenrollado positiva o negativamente . El ADN in vivo suele estar superenrollado negativamente, lo que facilita el desenrollado (fusión) de la doble hélice necesaria para la transcripción del ARN .
Dentro de la célula, la mayor parte del ADN está restringido topológicamente. El ADN se encuentra típicamente en bucles cerrados (como los plásmidos en los procariotas) que son topológicamente cerrados, o como moléculas muy largas cuyos coeficientes de difusión producen dominios topológicamente cerrados de manera efectiva. Las secciones lineales de ADN también suelen estar unidas a proteínas o estructuras físicas (como las membranas) para formar bucles topológicos cerrados.
Francis Crick fue uno de los primeros en proponer la importancia de los números de enlace al considerar las superenrollaciones del ADN. En un artículo publicado en 1976, Crick describió el problema de la siguiente manera:
Al considerar las superenrollaciones formadas por moléculas de ADN bicatenarias cerradas, se necesitan ciertos conceptos matemáticos, como el número de enlace y el giro. Se explica el significado de estos para una cinta cerrada y también el del número de sinuosidad de una curva cerrada. Se dan algunos ejemplos simples, algunos de los cuales pueden ser relevantes para la estructura de la cromatina. [54]
El análisis de la topología del ADN utiliza tres valores:
Cualquier cambio de T en un dominio topológico cerrado debe ser compensado por un cambio de W, y viceversa. Esto da como resultado una estructura de orden superior del ADN. Una molécula de ADN circular con una torsión de 0 será circular. Si la torsión de esta molécula se incrementa o disminuye posteriormente mediante superenrollamiento, la torsión se alterará apropiadamente, haciendo que la molécula experimente un enrollamiento superhelicoidal plectonémico o toroidal.
Cuando los extremos de un fragmento de ADN helicoidal de doble cadena se unen de forma que forman un círculo, las hebras están anudadas topológicamente . Esto significa que las hebras simples no se pueden separar mediante ningún proceso que no implique romper una hebra (como el calentamiento). La tarea de desanudar las hebras de ADN unidas topológicamente recae en enzimas denominadas topoisomerasas . Estas enzimas se dedican a desanudar el ADN circular cortando una o ambas hebras para que pueda pasar otro segmento de cadena simple o doble. Este desanudamiento es necesario para la replicación del ADN circular y varios tipos de recombinación en el ADN lineal que tienen restricciones topológicas similares.
Durante muchos años, el origen del superenrollamiento residual en los genomas eucariotas permaneció incierto. Algunos se refirieron a este rompecabezas topológico como la "paradoja del número de enlace". [55] Sin embargo, cuando las estructuras determinadas experimentalmente del nucleosoma mostraron una envoltura de ADN levógira sobretorcida alrededor del octámero de histonas , [56] [57] la comunidad científica consideró que esta paradoja estaba resuelta.
Sin embargo, el descubrimiento de las topoisomerasas eliminó "el aguijón" de la objeción topológica a la doble hélice plectonémica. La solución más reciente de la estructura de rayos X del monocristal de la partícula central del nucleosoma mostró casi 150 pares de bases del ADN (es decir, alrededor de 15 vueltas completas), con una estructura que es en todos los aspectos esenciales la misma que el modelo de Watson-Crick. Esto asestó un golpe mortal a la idea de que otras formas de ADN, en particular el ADN de doble hélice, existen como algo más que estructuras locales o transitorias.[ enlace muerto permanente ]