Un par de bases Hoogsteen es una variación del apareamiento de bases en los ácidos nucleicos, como el par A•T. De esta manera, dos nucleobases , una en cada cadena, pueden mantenerse unidas mediante enlaces de hidrógeno en el surco mayor. Un par de bases Hoogsteen aplica la posición N7 de la base de purina (como aceptor de enlaces de hidrógeno ) y el grupo amino C6 (como donante), que unen la cara Watson-Crick (N3-C4) de la base de pirimidina .
Diez años después de que James Watson y Francis Crick publicaran su modelo de la doble hélice del ADN, [2] Karst Hoogsteen describió [3] una estructura cristalina de un complejo en el que los análogos de A y T formaban un par de bases que tenía una geometría diferente a la descrita por Watson y Crick. De manera similar, puede darse una geometría de apareamiento de bases alternativa para los pares G•C. Hoogsteen señaló que si los patrones alternativos de enlaces de hidrógeno estuvieran presentes en el ADN, entonces la doble hélice tendría que asumir una forma bastante diferente. Los pares de bases de Hoogsteen se observan en estructuras alternativas como las estructuras G-quadruplex de cuatro cadenas que se forman en el ADN y el ARN.
Los pares de bases Hoogsteen tienen propiedades bastante diferentes a las de los pares de bases Watson-Crick . El ángulo entre los dos enlaces glucosídicos (aproximadamente 80° en el par A• T) es mayor y la distancia C1 ′ –C1 ′ (aproximadamente 860 pm o 8,6 Å) es menor que en la geometría regular. En algunos casos, llamados pares de bases Hoogsteen invertidos , una base está rotada 180° con respecto a la otra.
En algunas secuencias de ADN, especialmente en los dinucleótidos CA y TA, los pares de bases de Hoogsteen existen como entidades transitorias que están presentes en equilibrio térmico con los pares de bases Watson-Crick estándar. La detección de las especies transitorias requirió el uso de espectroscopia de dispersión por relajación de RMN aplicada a macromoléculas. [1]
Se han observado pares de bases de Hoogsteen en complejos proteína-ADN. [4] Algunas proteínas han evolucionado para reconocer solo un tipo de par de bases y utilizan interacciones intermoleculares para cambiar el equilibrio entre las dos geometrías.
El ADN tiene muchas características que permiten que las proteínas lo reconozcan en función de su secuencia. En un principio, se pensaba que este reconocimiento se debía principalmente a interacciones específicas de enlaces de hidrógeno entre las cadenas laterales de los aminoácidos y las bases. Pero pronto se hizo evidente que no existía una correspondencia uno a uno identificable, es decir, no había un código simple que pudiera leerse. Parte del problema es que el ADN puede sufrir cambios conformacionales que distorsionan la doble hélice clásica. Las variaciones resultantes alteran la presentación de las bases del ADN a las moléculas de proteínas y, por lo tanto, afectan al mecanismo de reconocimiento.
Como las distorsiones en la doble hélice dependen de la secuencia de bases, las proteínas pueden reconocer el ADN de una manera similar a la que reconocen otras proteínas y pequeñas moléculas de ligando, es decir, a través de la forma geométrica (en lugar de la secuencia específica). Por ejemplo, los estiramientos de las bases A y T pueden provocar el estrechamiento del surco menor del ADN (el más estrecho de los dos surcos de la doble hélice), lo que da como resultado potenciales electrostáticos negativos locales mejorados que, a su vez, crean sitios de unión para residuos de aminoácidos arginina con carga positiva en la proteína.
Este apareamiento de bases no Watson-Crick permite que las terceras hebras se enrollen alrededor de los dúplex, que se ensamblan en el patrón Watson-Crick , y forman hélices de triple cadena como (poli(dA)•2poli(dT)) y (poli(rG)•2poli(rC)). [5] También se puede ver en estructuras tridimensionales del ARN de transferencia , como T54•A58 y U8•A14. [6] [7]
Los pares de bases Watson-Crick se indican con un "•", un "-" o un "." (ejemplo: A•T o poly(rC)•2poly(rC)).
Los pares de bases de ADN de triple cadena de Hoogsteen se indican con un "*" o un ":" (ejemplo: C•G*C+, T•A*T, C•G*G o T•A*A).
Los pares de Hoogsteen también permiten la formación de estructuras secundarias de ADN monocatenario y ARN rico en G, llamadas G-quadruplexes (G4-ADN y G4-ARN). Existe evidencia de la formación de G4 tanto in vitro como in vivo. Se ha sugerido que los G4 genómicos regulan la transcripción génica y, a nivel de ARN, inhiben la síntesis de proteínas a través de la inhibición estérica de la función de los ribosomas. Necesita cuatro tripletes de G, separados por espaciadores cortos. Esto permite el ensamblaje de cuartetos planos que están compuestos de asociaciones apiladas de moléculas de guanina unidas por Hoogsteen. [8]