Los intrones del grupo II son una gran clase de ribozimas autocatalíticos y elementos genéticos móviles que se encuentran dentro de los genes de los tres dominios de la vida . La actividad de las ribozimas (por ejemplo, el autoempalme ) puede ocurrir en condiciones de alta salinidad in vitro . Sin embargo, se requiere la asistencia de proteínas para el empalme in vivo . [1] A diferencia de los intrones del grupo I , la escisión del intrón ocurre en ausencia de GTP e implica la formación de un lazo , con un punto de ramificación de residuo A muy parecido al que se encuentra en los lazos formados durante el empalme del pre-ARNm nuclear. Se plantea la hipótesis de que el empalme del pre-ARNm (ver espliceosoma ) puede haber evolucionado a partir de los intrones del grupo II, debido al mecanismo catalítico similar, así como a la similitud estructural de la subestructura del Dominio V del Grupo II con el ARNmn extendido U6/U2 . [2] [3] Finalmente, su capacidad para insertarse en sitios específicos de ADN se ha explotado como una herramienta para la biotecnología . [4] Por ejemplo, los intrones del grupo II se pueden modificar para realizar inserciones genómicas específicas del sitio y entregar ADN de carga como genes reporteros o sitios lox [5]
La estructura secundaria de los intrones del grupo II se caracteriza por seis estructuras típicas de tallo-bucle, también llamadas dominios I a VI (DI a DVI, o D1 a D6). Los dominios irradian desde un núcleo central que acerca las uniones de empalme 5' y 3'. Las estructuras de hélice proximal de los seis dominios están conectadas por unos pocos nucleótidos en la región central (secuencias de enlace o unión). Debido a su enorme tamaño, el dominio I se dividió en los subdominios a, b, c y d. Se identificaron diferencias de secuencia de los intrones del grupo II que llevaron a una división adicional en los subgrupos IIA, IIB y IIC, junto con la distancia variable de la adenosina abultada en el dominio VI (el punto de ramificación prospectivo que forma el lazo) desde el sitio de empalme 3', y la inclusión u omisión de elementos estructurales como un bucle de coordinación en el dominio I, que está presente en los intrones IIB e IIC pero no en el IIA. [1] Los intrones del grupo II también forman una estructura terciaria del ARN muy complicada .
Los intrones del grupo II poseen sólo unos pocos nucleótidos conservados, y los nucleótidos importantes para la función catalítica están repartidos por toda la estructura del intrón. Las pocas secuencias primarias estrictamente conservadas son el consenso en el sitio de empalme 5' y 3' (...↓GUGYG&... y ...AY↓..., donde la Y representa una pirimidina ), algunos de los nucleótidos del núcleo central (secuencias de unión), un número relativamente alto de nucleótidos de DV y algunos tramos de secuencia corta de DI. La adenosina desapareada en DVI (marcada con un asterisco en la figura y ubicada a 7 u 8 nt del sitio de empalme 3') también está conservada y desempeña un papel central en el proceso de empalme. El hidroxilo 2' de la adenosina abultada ataca el sitio de empalme 5', seguido de un ataque nucleofílico en el sitio de empalme 3' por el OH 3' del exón corriente arriba . Esto da como resultado un lazo de intrones ramificado conectado por un enlace fosfodiéster 2' en la adenosina DVI.
La maquinaria proteica es necesaria para el empalme in vivo , y las interacciones intrón-intrón e intrón-exón de largo alcance son importantes para el posicionamiento del sitio de empalme, así como una serie de contactos terciarios entre motivos, incluidas las interacciones de beso de bucle y tetraloop-receptor. En 2005, A. De Lencastre et al. descubrieron que durante el empalme de los intrones del Grupo II, todos los reactivos están preorganizados antes del inicio del empalme. El sitio de ramificación, ambos exones, las regiones catalíticamente esenciales de DV y J2/3, y ε−ε' están muy cerca antes de que ocurra el primer paso del empalme. Además de las regiones de protuberancia y tríada AGC de DV, la región de enlace J2/3, los nucleótidos ε−ε' y el bucle de coordinación en DI son cruciales para la arquitectura y función del sitio activo. [6]
La primera estructura cristalina de un intrón del grupo II se resolvió en 2008 para el intrón catalítico del grupo IIC de Oceanobacillus iheyensis , al que se unió el intrón del grupo IIB de Pylaiella littoralis (P.li.LSUI2) en 2014. Se han hecho intentos de modelar la estructura terciaria de otros intrones del grupo II, como el intrón del grupo IIB ai5γ, utilizando una combinación de programas para el mapeo de homología en estructuras conocidas y el modelado de novo de regiones no resueltas previamente. [7] El grupo IIC se caracteriza por una tríada catalítica formada por CGC, mientras que el grupo IIA y el grupo IIB están formados por la tríada catalítica AGC, que es más similar a la tríada catalítica del espliceosoma. Se cree que el grupo IIC también es más pequeño, más reactivo y más antiguo. El primer paso del empalme en el intrón del grupo IIC lo realiza el agua y forma una estructura lineal en lugar de un lazo. [8]
Los intrones del grupo II se encuentran en el ARNr , ARNt y ARNm de los orgánulos (cloroplastos y mitocondrias) en hongos , plantas y protistas , y también en el ARNm de las bacterias . El primer intrón que se identificó como distinto del grupo I fue el intrón del grupo IIB ai5γ, que se aisló en 1986 a partir de una transcripción de pre-ARNm del gen mitocondrial oxi 3 de Saccharomyces cerevisiae . [9]
Un subconjunto de intrones del grupo II codifica proteínas esenciales de empalme, conocidas como proteínas codificadas por intrones o IEP, en ORFs intrónicos . La longitud de estos intrones puede, como resultado, ser de hasta 3 kb. El empalme ocurre de manera casi idéntica al empalme nuclear del pre-ARNm con dos pasos de transesterificación, y ambos también utilizan iones de magnesio para estabilizar el grupo saliente en cada paso, lo que ha llevado a algunos a teorizar un vínculo filogenético entre los intrones del grupo II y el espliceosoma nuclear. Otra evidencia de este vínculo incluye la similitud estructural entre la unión U2/U6 del ARN espliceosómico y el dominio V de los intrones del grupo II, que contiene la tríada catalítica AGC y gran parte del corazón del sitio activo, así como la paridad entre las secuencias conservadas de los extremos 5' y 3'. [10]
Muchos de estos IEP, incluido LtrA , comparten un dominio de transcriptasa inversa y un "Dominio X". [11] La madurasa K (MatK) es una proteína algo similar a las proteínas codificadas por intrones, que se encuentra en los cloroplastos de las plantas. Es necesaria para el empalme in vivo de los intrones del Grupo II y se puede encontrar en los intrones cloroplásticos o en el genoma nuclear. Su dominio RT está roto. [11]
Los IEP del grupo II comparten un dominio conservado relacionado, conocido como "Dominio X" en los orgánulos o "GIIM" en las bacterias, que no se encuentra en otros retroelementos. [12] [13] El dominio X es esencial para el empalme en las mitocondrias de la levadura. [14] Este dominio puede ser responsable del reconocimiento y la unión al ARN intrón [13] o al ADN. [15]