El factor de especificidad de escisión y poliadenilación ( CPSF ) participa en la escisión de la región de señalización 3' de una molécula de ARN premensajero (pre-ARNm) recién sintetizada en el proceso de transcripción genética . En los eucariotas, los precursores del ARN mensajero (pre-ARNm) se transcriben en el núcleo a partir del ADN mediante la enzima ARN polimerasa II. El pre-ARNm debe sufrir modificaciones postranscripcionales, formando ARN maduro (ARNm), antes de que pueda ser transportado al citoplasma para su traducción en proteínas. Las modificaciones postranscripcionales son: la adición de una tapa m7G en 5', empalme de secuencias intrónicas y escisión y poliadenilación en 3'. [1]
Según Schönemann et al., "CPSF reconoce la señal de poliadenilación (PAS), proporcionando especificidad de secuencia en la escisión y poliadenilación del pre-ARNm, y cataliza la escisión del pre-ARNm". [2] Es necesario inducir la pausa de la ARN polimerasa una vez que reconoce un PAS funcional. [3] Es la primera proteína que se une a la región de señalización cerca del sitio de escisión del pre-ARNm, al que se agregará la cola poli(A) mediante el polinucleótido adenililtransferasa . La región de señalización de 10 a 30 nucleótidos aguas arriba del sitio de escisión, señal de poliadenilación (PAS), tiene la secuencia de nucleótidos canónica AAUAAA, que está altamente conservada en la gran mayoría de los pre-ARNm. La región AAUAAA suele estar definida por un dinucleótido de citosina/adenina (CA), que es la secuencia preferida, es decir, en 5' con respecto al sitio de escisión endonucleolítica. [2] [4] Una segunda región de señalización aguas abajo, ubicada aproximadamente a 40 nucleótidos aguas abajo del sitio de escisión en la porción del pre-ARNm que se escinde antes de la poliadenilación, consiste en una región rica en U/GU necesaria para un procesamiento eficiente. Este fragmento aguas abajo está degradado. El ARN maduro se transporta al citoplasma, donde se traduce en proteínas. [4] [5]
En los mamíferos, CPSF es un complejo proteico que consta de seis subunidades: CPSF-160 (CPSF1), CPSF-100 (CPSF2), CPSF-73 (CPSF3) y CPSF-30 (CPSF4) subunidades kDa, WDR33 y Fip1 (FIP1L1). ).
Las subunidades forman dos componentes: factores de especificidad de poliadenilación de mamíferos (mPSF) y factor de escisión de mamíferos (mCF). El mPSF se compone de CPSF-160, WDR33, CPSF-30 y Fip1. Es necesario para el reconocimiento y poliadenilación de PAS. El mCF está formado por CPSF-73, CPSF-100 y symplekin. Cataliza la reacción de escisión reconociendo el sitio de procesamiento 3' del ARNm de histonas. [4] [5]
CPSF-73 es una hidrolasa dependiente de zinc que escinde el precursor de ARNm entre un dinucleótido CA justo aguas abajo de la secuencia señal de poliadenilación AAUAAA. [6] [7]
CPSF-100 contribuye a la actividad endonucleasa de CPSF-73. [2]
CPSF-160 (160 kDa) es la subunidad más grande de CPSF y se une directamente a la señal de poliadenilación AAUAAA. [8] 160 kDa tiene tres dominios de hélice β y un dominio C-terminal.
CPSF-30 (30 kDa) tiene cinco motivos de dedos de zinc Cys-Cys-Cys-His (CCCH) cerca del extremo N y un nudillo de zinc CCCH en el extremo C. Existen dos isoformas de CPSF-30 y se pueden encontrar en los complejos de CPSF. La actividad de unión al ARN de CPSF-30 está mediada por sus dedos de zinc 2 y 3. El dominio repetido WD 33 (146 kDa) tiene un dominio WD40 cerca del extremo N. El dominio WD40 interactúa con el ARN. WDR33 y CPSF-30 reconocen la señal de poliadenilación (PAS) en el pre-ARNm, lo que ayuda a definir la posición de escisión del ARN. CPSF-30 reconoce la región hexámera rica en AU mediante un mecanismo de unión cooperativo dependiente del metal. [4] [5] [9] [10]
Aunque CPSF-160 es la subunidad más grande de CPSF, un estudio realizado por Schönemann et al. debate que WDR33 es el responsable de reconocer el PAS y no CPSF-160 como se creía anteriormente. El estudio concluyó que la razón por la que se creía que CPSF-160 era responsable del reconocimiento del PAS se debía al hecho de que la subunidad WDR33 no se había descubierto en el momento del reclamo. [2]
Fip1 se une a los ARN ricos en U mediante su extremo C rico en arginina. Se une a secuencias de ARN aguas arriba de la región del hexámero AAUAAA in vitro. Fip1 y CPSF-160 reclutan poli(A) polimerasa (PAP) en el sitio de procesamiento 3'. [4] La PAP es estimulada por la proteína nuclear de unión poli(A) para agregar la cola poli(A), un residuo de adenosina sin plantilla, en el sitio de escisión. [3] [7]
Sólo CPSF-160, CPSF-30, Fip1 y WDR33 son necesarios y suficientes para formar un subcomplejo CPSF activo en la poliadenilación dependiente de AAUAAA. CPSF-73 y CPSF-100 son desechables. [2]
CPSF recluta proteínas en la región 3'. Las proteínas identificadas que están coordinadas por la actividad del CPSF incluyen: el factor estimulador de escisión y los dos factores de escisión poco conocidos . La unión del polinucleótido adenililtransferasa responsable de sintetizar realmente la cola es un requisito previo necesario para la escisión, lo que garantiza que la escisión y la poliadenilación sean procesos estrechamente acoplados.
La poliadenilación alternativa (APA) es un mecanismo regulador que forma múltiples extremos 3' en el ARNm. [7]
Las isoformas APA del mismo gen pueden codificar diferentes proteínas y/o contener diferentes regiones 3' no traducidas (UTR). La desregulación de los APA se ha asociado con una serie de enfermedades humanas. Dado que las UTR más largas tienen más sitios de unión para microARN y/o proteínas de unión a ARN en comparación con las UTR más cortas, los APA requieren diferente estabilidad, eficiencia de traducción y/o localización intracelular. [4]
Los PAS de mamíferos tienen una serie de elementos cis clave .
Las secuencias PAS son variables y muchos PAS carecen de uno o más elementos cis . El reconocimiento de PAS se logra mediante interacciones proteína-ARN.
CPSF se une sinérgicamente al hexámero AAUAAA y CstF se une sinérgicamente al elemento aguas abajo (DSE). El complejo CFI se une a los motivos UGUA. CPSF, CstF y CFI se unen directamente al ARN. También reclutan otras proteínas como CFII, symplekin y la poli(A) polimerasa (PAP) para ensamblar el complejo de procesamiento 3' del ARNm, también conocido como complejo de escisión y poliadenilación. El ensamblaje de estos factores se ve facilitado por el dominio C-terminal (CTD) de la subunidad grande de la ARN polimerasa II (RNAP II). El CTD proporciona una plataforma de aterrizaje para los factores de procesamiento de ARNm. [4] [11]
Symlekin (SYMPK) es una proteína de andamio que media en la interacción entre CPSF y CstF. [2]
En CPSF de mamíferos, tanto el factor de escisión I (CFI m ) como el factor de especificidad de escisión y poliadenilación (CPSF) son necesarios para la escisión y la poliadenilación, mientras que el factor de estimulación de escisión (CstF) solo es esencial para el paso de escisión. [12] CPSF y CstF viajan junto con la ARN polimerasa II (RNAP II) durante la transcripción del gen naciente en busca del PAS. [3]
El factor de escisión I (CFI m ) está formado por proteínas de 25 ( CPSF5 ), 59 (CPSF7) y 68 (CPSF6) kDa. El factor de escisión II (CFII m ) está formado por Pcf11, Clp1 y el factor de estimulación de escisión (CstF). CFII m se une al dominio C-terminal de RNAP II y a otros factores CpA. [3] [13]
El factor de estimulación de escisión (CstF) tiene tres subunidades: CstF77 (CstF3), CstF50 (CstF1) y CstF64 (CstF2 y CstF2T). CstF reconoce el PAS que se encuentra 20 nucleótidos aguas abajo de la región de señalización del sitio de escisión, que es un motivo de secuencia rico en GU seguido de secuencias ricas en U. CstF contribuye a la selección del sitio de escisión, así como a la poliadenilación alternativa. [4] [5] [13]
El acoplamiento de la transcripción de la ARN polimerasa II (pol II) puede influir en las reacciones de procesamiento de tres maneras. [11]