Los intrones del grupo II son una gran clase de ribozimas autocatalíticas y elementos genéticos móviles que se encuentran dentro de los genes de los tres dominios de la vida . La actividad de las ribozimas (p. ej., autoempalme ) puede ocurrir en condiciones de alto contenido de sal in vitro . Sin embargo, se requiere la ayuda de proteínas para el empalme in vivo . [1] A diferencia de los intrones del grupo I , la escisión de intrones se produce en ausencia de GTP e implica la formación de un lazo , con un punto de ramificación del residuo A muy parecido al que se encuentra en los lazos formados durante el empalme del pre-ARNm nuclear. Se plantea la hipótesis de que el empalme del pre-ARNm (ver espliceosoma ) puede haber evolucionado a partir de intrones del grupo II, debido al mecanismo catalítico similar, así como a la similitud estructural de la subestructura del Dominio V del Grupo II con el snRNA extendido U6/U2 . [2] [3] Finalmente, su capacidad para insertarse de manera específica en sitios de ADN se ha explotado como herramienta para la biotecnología . [4] Por ejemplo, los intrones del grupo II pueden modificarse para realizar inserciones genómicas específicas de un sitio y entregar ADN de carga, como genes informadores o sitios lox [5]
La estructura secundaria de los intrones del grupo II se caracteriza por seis estructuras típicas de tallo-bucle, también llamadas dominios I a VI (DI a DVI o D1 a D6). Los dominios irradian desde un núcleo central que acerca las uniones de empalme 5' y 3'. Las estructuras de hélice proximal de los seis dominios están conectadas por unos pocos nucleótidos en la región central (secuencias enlazadoras o de unión). Debido a su enorme tamaño, el dominio I se dividió en subdominios a, b, cy d. Se identificaron diferencias de secuencia de los intrones del grupo II que condujeron a una división adicional en los subgrupos IIA, IIB y IIC, junto con la distancia variable de la adenosina abultada en el dominio VI (el posible punto de ramificación que forma el lazo) desde el sitio de empalme 3', y la inclusión u omisión de elementos estructurales como un bucle de coordinación en el dominio I, que está presente en los intrones IIB y IIC pero no en IIA. [1] Los intrones del grupo II también forman una estructura terciaria de ARN muy complicada .
Los intrones del grupo II poseen sólo unos pocos nucleótidos conservados y los nucleótidos importantes para la función catalítica están repartidos por toda la estructura del intrón. Las pocas secuencias primarias estrictamente conservadas son el consenso en el sitio de empalme 5' y 3' (...↓GUGYG&... y ...AY↓..., con la Y representando una pirimidina ), algunos de los nucleótidos de el núcleo central (secuencias de unión), un número relativamente alto de nucleótidos de DV y algunos tramos de secuencia corta de DI. La adenosina desapareada en DVI (marcada por un asterisco en la figura y ubicada a 7 u 8 nt del sitio de empalme 3') también se conserva y desempeña un papel central en el proceso de empalme. El hidroxilo 2' de la adenosina abultada ataca el sitio de empalme 5', seguido del ataque nucleofílico en el sitio de empalme 3' por el OH 3' del exón aguas arriba . Esto da como resultado un lazo de intrón ramificado conectado por un enlace fosfodiéster 2' en la adenosina DVI.
Se requiere maquinaria proteica para el empalme in vivo , y las interacciones intrón-intrón e intrón-exón de largo alcance son importantes para el posicionamiento del sitio de empalme, así como una serie de contactos terciarios entre motivos, incluidas las interacciones de bucle de beso y receptor de tetrabucle. En 2005, A. De Lencastre et al. descubrió que durante el empalme de los intrones del Grupo II, todos los reactivos están preorganizados antes del inicio del empalme. El sitio de ramificación, ambos exones, las regiones catalíticamente esenciales de DV y J2/3, y ε−ε' están muy cerca antes de que ocurra el primer paso de empalme. Además de las regiones abombadas y de la tríada AGC de DV, la región conectora J2/3, los nucleótidos ε-ε' y el bucle de coordinación en DI son cruciales para la arquitectura y función del sitio activo. [6]
La primera estructura cristalina de un intrón del grupo II se resolvió en 2008 para el intrón catalítico del grupo IIC de Oceanobacillus iheyensis , y en 2014 se le unió el intrón del grupo IIB de Pylaiella littoralis (P.li.LSUI2). estructura de otros intrones del grupo II, como el intrón ai5γ del grupo IIB, utilizando una combinación de programas para mapeo de homología en estructuras conocidas y modelado de novo de regiones previamente no resueltas. [7] El grupo IIC se caracteriza por una tríada catalítica formada por CGC, mientras que el grupo IIA y el grupo IIB están formados por una tríada catalítica AGC, que es más similar a la tríada catalítica del espliceosoma. Se cree que los del Grupo IIC también son más pequeños, más reactivos y más antiguos. El primer paso del empalme en el intrón del Grupo IIC se realiza con agua y forma una estructura lineal en lugar de un lazo. [8]
Los intrones del grupo II se encuentran en ARNr , ARNt y ARNm de orgánulos (cloroplastos y mitocondrias) en hongos , plantas y protistas , y también en ARNm de bacterias . El primer intrón identificado como distinto del grupo I fue el intrón ai5γ del grupo IIB, que se aisló en 1986 de una transcripción pre-ARNm del gen mitocondrial oxi 3 de Saccharomyces cerevisiae . [9]
"Un subconjunto de intrones del grupo II codifica proteínas de empalme esenciales, conocidas como proteínas codificadas por intrones o IEP, en ORF intrónicos ". Por tanto, la longitud de estos intrones puede alcanzar hasta 3 kb. El empalme ocurre de manera casi idéntica al empalme del pre-ARNm nuclear con dos pasos de transesterificación, y ambos también usan iones de magnesio para estabilizar el grupo saliente en cada paso, lo que ha llevado a algunos a teorizar un vínculo filogenético entre los intrones del grupo II y el espliceosoma nuclear. Otras pruebas de este vínculo incluyen la similitud estructural entre la unión U2/U6 del ARN espliceosómico y el dominio V de los intrones del grupo II, que contiene la tríada catalítica AGC y gran parte del corazón del sitio activo, así como la paridad entre 5' y 5' conservados. Secuencias finales 3'. [10]
Muchos de estos IEP, incluido LtrA , comparten un dominio de transcriptasa inversa y un "Dominio X". [11] La Maturasa K (MatK) es una proteína algo similar a las proteínas codificadas por intrones que se encuentran en los cloroplastos de las plantas. Es necesario para el empalme in vivo de intrones del grupo II y se puede encontrar en intrones cloroplásticos o en el genoma nuclear. Su dominio RT está roto. [11]
Los IEP del grupo II comparten un dominio conservado relacionado, conocido como "Dominio X" en los orgánulos o "GIIM" en las bacterias, que no se encuentra en otros retroelementos. [12] [13] El dominio X es esencial para el empalme en las mitocondrias de levadura. [14] Este dominio puede ser responsable de reconocer y unirse al intrón de ARN [13] o ADN. [15]