Un par de bases de Hoogsteen es una variación del emparejamiento de bases en ácidos nucleicos como el par A•T. De esta manera, dos nucleobases , una en cada hebra, pueden mantenerse unidas mediante enlaces de hidrógeno en el surco principal. Un par de bases de Hoogsteen aplica la posición N7 de la base purina (como aceptor de enlaces de hidrógeno ) y el grupo amino C6 (como donante), que se unen a la cara Watson-Crick (N3-C4) de la base pirimidina .
Diez años después de que James Watson y Francis Crick publicaran su modelo de la doble hélice del ADN, [2] Karst Hoogsteen informó [3] sobre la estructura cristalina de un complejo en el que los análogos de A y T formaban un par de bases que tenía una geometría diferente a la del ADN. descrito por Watson y Crick. De manera similar, puede ocurrir una geometría de pares de bases alternativa para pares G•C. Hoogsteen señaló que si los patrones alternativos de enlaces de hidrógeno estuvieran presentes en el ADN, entonces la doble hélice tendría que asumir una forma bastante diferente. Los pares de bases de Hoogsteen se observan en estructuras alternativas, como las estructuras cuádruplex G de cuatro cadenas que se forman en el ADN y el ARN.
Los pares de Hoogsteen tienen propiedades bastante diferentes a las de los pares de bases de Watson-Crick . El ángulo entre los dos enlaces glicosídicos (aprox. 80° en el par A• T) es mayor y la distancia C1 ′ –C1 ′ (aprox. 860 pm o 8,6 Å) es menor que en la geometría regular. En algunos casos, llamados pares de bases de Hoogsteen invertidos , una base gira 180° con respecto a la otra.
En algunas secuencias de ADN, especialmente los dinucleótidos CA y TA, los pares de bases de Hoogsteen existen como entidades transitorias que están presentes en equilibrio térmico con los pares de bases estándar de Watson-Crick. La detección de especies transitorias requirió el uso de espectroscopía de dispersión de relajación por RMN aplicada a macromoléculas. [1]
Se han observado pares de bases de Hoogsteen en complejos proteína-ADN. [4] Algunas proteínas han evolucionado para reconocer solo un tipo de par de bases y utilizan interacciones intermoleculares para cambiar el equilibrio entre las dos geometrías.
El ADN tiene muchas características que permiten su reconocimiento de secuencia específica por parte de las proteínas. Originalmente se pensó que este reconocimiento implicaba principalmente interacciones específicas de enlaces de hidrógeno entre las cadenas laterales y las bases de los aminoácidos. Pero pronto quedó claro que no había ninguna correspondencia uno a uno identificable, es decir, que no había un código simple para leer. Parte del problema es que el ADN puede sufrir cambios conformacionales que distorsionan la doble hélice clásica. Las variaciones resultantes alteran la presentación de las bases del ADN a las moléculas de proteínas y, por tanto, afectan el mecanismo de reconocimiento.
Como las distorsiones en la doble hélice dependen en sí mismas de la secuencia de bases, las proteínas pueden reconocer el ADN de una manera similar a como reconocen otras proteínas y pequeñas moléculas de ligando, es decir, mediante forma geométrica (en lugar de la secuencia específica). Por ejemplo, los tramos de bases A y T pueden conducir al estrechamiento del surco menor del ADN (el más estrecho de los dos surcos en la doble hélice), lo que resulta en potenciales electrostáticos negativos locales mejorados que a su vez crean sitios de unión para arginina amino-arginina con carga positiva. residuos ácidos en la proteína.
Este par de bases que no es de Watson-Crick permite que las terceras hebras se enrollen alrededor de los dúplex, que se ensamblan en el patrón Watson-Crick , y formen hélices de triple hebra como (poli(dA)•2poly(dT)) y ( poli(rG)·2poli(rC)). [5] También se puede observar en estructuras tridimensionales de ARN de transferencia , como T54•A58 y U8•A14. [6] [7]
Los pares de bases Watson-Crick se indican mediante "•", "-" o "." (ejemplo: A•T, o poli(rC)•2poli(rC)).
Los pares de bases de ADN de triple cadena de Hoogsteen se indican con un "*" o un ":" (ejemplo: C•G*C+, T•A*T, C•G*G o T•A*A).
Los pares de Hoogsteen también permiten la formación de estructuras secundarias de ADN monocatenario y ARN rico en G llamadas G-quadruplex (G4-DNA y G4-RNA). Existe evidencia de la formación de G4 tanto in vitro como in vivo. Se ha sugerido que los G4 genómicos regulan la transcripción de genes y, a nivel de ARN, inhiben la síntesis de proteínas mediante la inhibición estérica de la función de los ribosomas. Necesita cuatro tripletes de G, separados por espaciadores cortos. Esto permite el ensamblaje de cuartetos planos que se componen de asociaciones apiladas de moléculas de guanina unidas por Hoogsteen. [8]