Las proteínas SR son una familia conservada de proteínas involucradas en el empalme del ARN . Las proteínas SR se denominan así porque contienen un dominio proteico con repeticiones largas de residuos de aminoácidos serina y arginina , cuyas abreviaturas estándar son "S" y "R" respectivamente. Las proteínas SR tienen una longitud de ~200-600 aminoácidos y están compuestas por dos dominios, la región del motivo de reconocimiento de ARN (RRM) y el dominio RS. [1] Las proteínas SR se encuentran más comúnmente en el núcleo que en el citoplasma, pero se sabe que varias proteínas SR se desplazan entre el núcleo y el citoplasma.
Las proteínas SR se descubrieron en los años 90 en Irlanda del Norte, Belfast, en ovocitos de anfibios y, más tarde, en seres humanos. En general, los metazoos parecen tener proteínas SR y los organismos unicelulares carecen de ellas.
Las proteínas SR son importantes en el empalme constitutivo y alternativo del pre-ARNm, la exportación del ARNm, la estabilización del genoma, la descomposición mediada por sinsentidos y la traducción. Las proteínas SR empalman alternativamente el pre-ARNm seleccionando preferentemente diferentes sitios de empalme en las cadenas de pre-ARNm para crear múltiples transcripciones de ARNm a partir de una transcripción de pre-ARNm. Una vez que se completa el empalme, la proteína SR puede o no permanecer unida para ayudar a sacar la cadena de ARNm del núcleo. Mientras la ARN polimerasa II transcribe el ADN en ARN, las proteínas SR se unen al pre-ARNm recién formado para evitar que este se una a la cadena de ADN codificante y así aumentar la estabilización del genoma. La topoisomerasa I y las proteínas SR también interactúan para aumentar la estabilización del genoma. Las proteínas SR pueden controlar las concentraciones de ARNm específico que se traduce con éxito en proteína seleccionando codones de descomposición mediada por sinsentidos durante el empalme alternativo. Las proteínas SR pueden unir alternativamente codones NMD en su propia transcripción de ARNm para autorregular la concentración de proteínas SR. A través de la vía mTOR y las interacciones con polirribosomas, las proteínas SR pueden aumentar la traducción del ARNm.
La ataxia telangiectasia , la neurofibromatosis tipo 1, varios tipos de cáncer, el VIH-1 y la atrofia muscular espinal se han relacionado con el empalme alternativo de las proteínas SR.
Las proteínas SR se descubrieron de forma independiente mediante el uso de dos anticuerpos monoclonales diferentes . El primer anticuerpo , mAb104, encontró proteínas SR en el núcleo de ovocitos de anfibios. El anticuerpo mAb104 se une a un fosfoepítopo en el dominio C-terminal de las proteínas SR. mAb104 también se une a sitios activos de transcripción de la ARN polimerasa II. [2] Este anticuerpo permitió la identificación de cuatro proteínas SR ( SRp20 , SRp40 , SRp55 y SRp75 ) y demostró su conservación entre vertebrados e invertebrados. [1] El segundo anticuerpo, B52, se utilizó en Drosophila . B52 está estrechamente relacionado con el factor de empalme SF2/ASF y se une tanto al ARN como al ADN en Drosophila . El descubrimiento de proteínas SR en Drosophila reveló tres proteínas SR, SWAP (supresor del albaricoque blanco), Tra y Tra-2 (transformador y transformador-2 respectivamente). [3] [4] [5]
La siguiente es una lista de 14 genes humanos que codifican proteínas SR involucradas en el empalme:
[6]
Las proteínas SR se caracterizan por un dominio RS y al menos un motivo de reconocimiento de ARN (RRM). El RRM se encuentra típicamente cerca del extremo N-terminal . El dominio RS se encuentra cerca del extremo C-terminal de una proteína SR. Los dominios RS regulan las interacciones proteína-proteína de las proteínas SR. Con base en el análisis de secuencias, se sospecha que las proteínas SR son proteínas intrínsecamente desordenadas que resultan en un dominio RS no estructurado. Ocho repeticiones no fosforiladas de arginina y serina en el dominio RS toman una forma helicoidal con la arginina en el exterior para reducir la carga y en un estado fosforilado, las ocho repeticiones de arginina y serina forman una forma de "garra". [1] [7] [8]
Las proteínas SR pueden tener más de un dominio RRM. El segundo dominio RRM se denomina homólogo del motivo de reconocimiento de ARN (RRMH). Los dominios RRM se encuentran cerca del extremo N-terminal de las proteínas SR. El dominio RRM media las interacciones de ARN de las proteínas SR uniéndose a secuencias potenciadoras del empalme de exones. El RRMH suele tener interacciones más débiles con el ARN en comparación con el dominio RRM. A partir de RMN , el dominio RRM de SRSF1, una proteína SR, tiene una estructura de pliegue de unión de ARN. El dominio RRM también puede proteger el dominio RS fosforilado, lo que sugiere que el dominio RS encaja en el dominio RRM. [3] [7] [9]
Las proteínas SR se pueden encontrar tanto en el citosol como en las motas nucleares del núcleo . Las proteínas SR se encuentran principalmente en el núcleo. La localización depende de la fosforilación del dominio RS de la proteína SR. La fosforilación del dominio RS hace que las proteínas SR entren y permanezcan en el núcleo. La desfosforilación parcial del dominio RS hace que las proteínas SR abandonen el núcleo y las proteínas SR con dominios RS no fosforilados se encuentran en el citosol. [10] [11] [12]
Las proteínas SR se encuentran en dos tipos diferentes de motas nucleares, los cúmulos de gránulos intercromatínicos y las fibrillas de pericromatina . Los cúmulos de gránulos intercromatínicos sirven para el almacenamiento y reensamblaje de las proteínas de empalme pre-ARNm. Las fibrillas de pericromatina son áreas de transcripción génica y donde las proteínas SR se asocian con la ARN polimerasa II para el empalme cotranscripcional. [1] [12]
Se cree que dos proteínas quinasas desempeñan un papel en la localización de las proteínas SR en el núcleo. La proteína quinasa SR 1 (SRPK1) se une a 10-12 residuos de serina en la porción N-terminal del dominio RS de las proteínas SR ubicadas en el citosol y los fosforila. Las proteínas SR pueden translocarse al núcleo después de que las serinas se fosforilan. La proteína SR fosforilada se mueve hacia el núcleo y se reubica en una mancha nuclear. La segunda proteína quinasa, CLK1, fosforila luego las serinas restantes en el dominio RS de la proteína SR, lo que hace que se transloque fuera de la mancha nuclear y se asocie con la ARN polimerasa II para el empalme cotranscripcional del ARN. [3] [7]
El movimiento de las proteínas SR fuera del núcleo está controlado por un mecanismo diferente. Las proteínas SR que no abandonan el núcleo se denominan proteínas SR no transportadoras y las que lo hacen se denominan proteínas SR transportadoras. SRp20 ( SFRS3 ) y 9G8 ( SFRS7 ) son dos ejemplos de proteínas SR transportadoras de mamíferos. Ambas reconocen y se unen al ARN poli-A para transportar el ARN. La mayoría de las proteínas SR que no se transportan fuera del núcleo con una transcripción de ARN tienen señales de retención nuclear. Las proteínas SR transportadoras se asocian con el factor de exportación nuclear TAP para exportar fuera del núcleo. La metilación de los residuos de arginina en el RRM también puede contribuir a la exportación de proteínas SR fuera del núcleo. [9] [11]
Se ha demostrado que las proteínas SR tienen funciones en el empalme alternativo y constitutivo que resultan en la expresión genética diferencial y también juegan un papel en la exportación de ARNm, la estabilización del genoma, la descomposición mediada por sin sentido y la traducción . [1] [2]
El primer paso para que las proteínas SR inicien el splicing alternativo de un transcrito de ARN es que las proteínas SR se unan al dominio carboxilo-terminal (CTD) de la subunidad más grande de la ARN polimerasa II. El CTD está formado por la secuencia heptapeptídica repetida conservada YSPTSPS. Los diferentes pasos de la transcripción tienen diferentes niveles de fosforilación del CTD de la ARN polimerasa II. Antes del inicio de la transcripción, el CTD tiene niveles bajos de fosforilación, pero posteriormente se hiperfosforila durante el inicio y la elongación. El dominio RS de las proteínas SR interactúa con el CTD hiperfosforilado durante la elongación de la transcripción. [2] [12]
La ARN polimerasa II pasa de la etapa de iniciación a la de elongación una vez que la cinasa P-TEFb fosforila Ser5 y Ser2 en la ARN polimerasa II . Las proteínas SR interactúan con CDK9 , el componente cinasa de P-TEFb que conduce a la fosforilación de Ser2. Las proteínas SR se unen a la Ser2 fosforilada en el CTD. La posición de las proteínas SR en la ARN polimerasa II permite que las proteínas SR "vean" primero la nueva transcripción de ARN. Las proteínas SR luego pasan de la ARN polimerasa II a la transcripción de pre-ARNm. [1] [2]
Una vez en la nueva transcripción de ARN, las proteínas SR pueden estimular la formación del espliceosoma . Las proteínas SR promueven la unión de U1 snRNP y U2AF snRNP a la nueva transcripción de ARN para comenzar la formación del espliceosoma. Las proteínas SR también ayudan a U2 a reconocer y unirse al sitio de ramificación del intrón que se va a escindir. Más adelante en la formación del espliceosoma, las proteínas SR ayudan a reclutar snRNP U4 / U6 y U5 . [8] [12]
Las proteínas SR son importantes para seleccionar sitios de empalme para el empalme alternativo. Las proteínas SR reconocen potenciadores y silenciadores de intrones y exones. Las proteínas SR se combinan con proteínas similares a SR para seleccionar potenciadores de empalme de exones en las transcripciones de ARN, lo que hace que el U2 snRNP se una al sitio de ramificación adyacente aguas arriba, lo que provoca el ensamblaje del espliceosoma en el sitio 3' específico seleccionado por las proteínas SR. [12] [13]
Las actividades de promoción del empalme alternativo de las proteínas SR contrastan con las de las hnRNP . Las hnRNP se unen a los silenciadores del empalme de exones , ESS, e inhiben la inclusión de exones, por lo que las hnRNP son represores del empalme. Las proteínas SR y las hnRNP compiten por la unión a las secuencias de ESE y ESS en los exones. La unión se basa en las concentraciones de proteínas SR y hnRNP en las células. Si la célula tiene una alta concentración de proteínas SR, es más probable que las proteínas SR se unan a ESE en comparación con la unión de las hnRNP a ESS. Si la célula tiene una alta concentración de hnRNP, entonces las hnRNP pueden competir con las proteínas SR por los ESS en comparación con los ESE. [14] [15]
Las proteínas SR pueden funcionar de manera antagónica, compitiendo entre sí para unirse a los potenciadores del empalme exónico . Algunas evidencias sugieren que la selección de la variante de empalme del ARNm depende de las proporciones relativas de las proteínas SR. Las proteínas SR parecen ser redundantes. Los experimentos han demostrado que la eliminación de proteínas SR con RNAi no muestra un fenotipo detectable en C. elegans . Después de eliminar una proteína SR específica, otra proteína SR diferente puede compensar la función perdida de la proteína SR que fue eliminada. Las actividades de proteínas SR específicas son importantes para tejidos específicos y etapas de desarrollo. [13] [16]
Las proteínas SR seleccionan sitios de empalme 3' alternativos aguas arriba reclutando U2AF 35 y U2AF 65 a secuencias de pirimidina ESE específicas en el exón de la transcripción de pre-ARNm. [8] [17]
Las proteínas SR también pueden seleccionar alternativamente diferentes sitios de empalme 5' aguas abajo uniéndose al ESE aguas arriba del sitio de empalme. El mecanismo sospechoso es que los sitios de empalme 5' alternativos se eligen cuando las proteínas SR se unen al ESE aguas arriba e interactúan con U1-70K y juntas reclutan a U1 al sitio de empalme 5'. [8] [17]
En el empalme constitutivo, las proteínas SR se unen a U2AF y U1-70K para unir los dos componentes del espliceosoma y marcar los sitios de empalme 3' y 5'. Los exones empalmados constitutivamente tienen muchas secuencias de unión a proteínas SR diferentes que actúan como potenciadores del empalme constitutivo. La diferencia entre el empalme alternativo y el constitutivo es que durante el empalme alternativo se regula la elección del sitio de empalme. [8] [17]
Las funciones independientes del exón de las proteínas SR se denominan independientes del exón porque no se sabe si las proteínas SR deben unirse a los exones para que puedan realizar actividades independientes del exón. Las proteínas SR pueden unirse a U1 y U2AF mientras están unidas a los sitios de empalme 3' y 5' al mismo tiempo sin unirse a la transcripción del pre-ARNm. La proteína SR crea así un puente a través del intrón en lo que se denomina una interacción entre intrones. Las proteínas SR también reclutan la molécula tri-snRNP U4/U6·U5 al complejo del espliceosoma en maduración al interactuar con los dominios RS en el tri-snRNP. Las proteínas SR podrían ser capaces de unirse directamente al sitio de empalme 5' y reclutar el complejo U1 del espliceosoma. [8] [17]
Las proteínas SR pueden ser proteínas SR transportadoras o proteínas SR no transportadoras. Algunas proteínas SR se asocian con el factor de exportación de ARN TAP, un factor de exportación nuclear, para transportar el ARN fuera del núcleo. La propiedad de transporte de la proteína SR está determinada por el estado de fosforilación del dominio RS. Cuando están hiperfosforiladas, las proteínas SR se unen a las transcripciones de pre-ARNm, pero las proteínas SR se desfosforilan parcialmente durante la transcripción, lo que les permite interactuar con NXF1 . Por lo tanto, la fosforilación del dominio RS determina si las proteínas SR permanecen con la transcripción de ARN después del empalme de co-transcripción y mientras el mRNP madura. Si el dominio RS permanece fosforilado, entonces la proteína SR no se transportará desde el núcleo al citosol. La proteína SR fosforilada se separará de la transcripción de ARNm, lo que evitará aún más el transporte de las proteínas SR fosforiladas. Si el dominio RS se desfosforila parcialmente, entonces la proteína SR se transportará desde el núcleo al citosol. La metilación y carga de los residuos de arginina en el dominio RRM también contribuye a la exportación de proteínas SR asociadas con el ARNm. [9] [10] [11]
Las proteínas SR pueden aumentar la estabilidad del genoma al prevenir la formación de bucles R en la cadena de ADN que se está transcribiendo activamente durante la transcripción. La proteína SR SC35 tiene la capacidad de unirse a la subunidad más grande de la ARN polimerasa II en el dominio C-terminal fosforilado . Una vez que la ARN polimerasa II comienza a producir la nueva cadena de ARN, las proteínas SR se mueven desde el dominio C-terminal de la ARN polimerasa II a la nueva cadena de ARN. El movimiento de las proteínas SR desde la ARN polimerasa II a la nueva cadena de ARN evita que la nueva cadena de ARN, que es complementaria a la cadena de ADN molde, se una a la cadena de ADN molde, evitando así los bucles R. [2] [11]
Las proteínas SR también pueden estabilizar el ADN durante la transcripción a través de una interacción con la topoisomerasa I. Cuando la topoisomerasa I, Topo I, reduce el superenrollamiento causado por la transcripción cuando está unida al ADN. Cuando Topo I no está unida al ADN, puede fosforilar la proteína SR SF2/ASF. Topo I y SF2/ASF interactúan cuando SF2/ASF está hipofosforilada durante la elongación de la transcripción. Las proteínas SR pueden hipofosforilarse durante la elongación, lo que disminuye su afinidad por la ARN polimerasa II, lo que hace que las proteínas SR se muevan hacia Topo I. Cuando Topo I forma complejos con SF2/ASF, ya no puede deshacer el superenrollamiento del ADN, lo que hace que la elongación se detenga. Topo I fosforila S2F/ASF, lo que aumenta la afinidad de las proteínas SR por el ARN poli II, lo que mueve S2F/ASF desde Topo I de nuevo al ARN poli II, lo que permite que la elongación continúe. [2]
Las proteínas SR pueden empalmar alternativamente las transcripciones de pre-ARNm para incluir codones de desintegración mediada por sinsentido (NMD) en el ARNm. El método más común de una respuesta NMD en las células es el empalme alternativo. Si una transcripción de pre-ARNm tiene un sitio de empalme 5' duplicado y las proteínas SR se sobreexpresan, entonces la NMD puede ser regulada positivamente. La variante de empalme con el codón NMD se elige con mayor frecuencia durante el empalme y la célula es más sensible a la NMD más adelante durante la traducción. Se estima que cerca del 30% del ARNm empalmado alternativamente se degrada por NMD. Las concentraciones de proteína SR en las células pueden ser autorreguladas por codones NMD en las proteínas SR pre-ARNm. Por ejemplo, la proteína SR SC35 puede empalmar alternativamente un pre-ARNm SC35 para incluir un codón NMD en el ARNm. La ubicación de la unión de la proteína SR en una cadena de pre-ARNm y qué proteínas SR se unen determinan la actividad NMD de una célula. [9] [18]
Las proteínas SR pueden influir indirecta y directamente en la traducción. Las proteínas SR SF2/ASF empalman alternativamente la transcripción de MNK2. MNK2 es una quinasa que inicia la traducción. Los niveles altos de SF2/ASF producen una isoforma de MNK2 que aumenta la traducción dependiente de cap al promover la fosforilación de eIF4E independiente de MAPK . SF2/ASF recluta componentes de la vía mTOR , específicamente S6K1 . SF2/ASF crea una forma oncogénica de S6K1 para aumentar la prevalencia de la traducción dependiente de cap. SF2/ASF también puede interactuar con polirribosomas para influir directamente en la traducción de ARNm en proteína al reclutar componentes de la vía mTOR . SF2/ASF aumenta la fosforilación de rpS6 y eIF4B por S6K1. 9G8 aumenta la traducción de ARNm no empalmado con una secuencia de transporte constitutiva. [1] [3]
La diversidad genética aumenta por las actividades de empalme alternativo de las proteínas SR, pero el empalme también puede dar lugar a mutaciones en las cadenas de ARNm. Las mutaciones en el pre-ARNm pueden afectar la selección correcta del sitio de empalme para las proteínas SR. [1] Las mutaciones en el ARNm, debido al empalme alterado asociado con el sinsentido por las proteínas SR, se han relacionado con la ataxia telangiectasia , la neurofibromatosis tipo 1 , varios tipos de cáncer , el VIH -1 y la atrofia muscular espinal .
Varias proteínas SR han sido implicadas en el cáncer. Los niveles elevados de SF2/ASF, SC35 y SRp20 se han asociado con el desarrollo de cáncer de mama y ovario. [1] SF2/ASF también está sobreexpresado en tumores de pulmón, riñón y hígado. SFRS1, el gen que codifica SF2/ASF, es un protooncogén conocido . Las mutaciones en la secuencia ESE de BRCA1 se han vinculado con la omisión irregular de exones porque SF2/ASF no puede reconocer el ESE. [8]
Se han implicado tres proteínas SR en el VIH-1 : SRp75, SF2/ASF y SRp40. [1] Las tres proteínas SR son importantes para el empalme alternativo del pre-ARNm viral. El VIH también puede cambiar las concentraciones de proteínas SR específicas en la célula. Los nuevos tratamientos farmacológicos para las infecciones por VIH buscan dirigirse a proteínas SR específicas para evitar que el virus se replique en las células. Un tratamiento funciona al bloquear las proteínas SR para que no seleccionen sitios de empalme 3' para una importante proteína reguladora del VIH-1.
La atrofia muscular espinal es causada por una transición de citosina a timina . La mutación de transición da como resultado que se omita el exón 7 durante el empalme. El exón podría omitirse por dos razones. La primera es que la mutación impide que SF2/ASF reconozca el ESE correcto. La segunda es que la mutación crea un ESS para que un hnRNP se una y bloquee el empalme del exón. [1]