Las proteínas de unión al ARN (a menudo abreviadas como RBP ) son proteínas que se unen al ARN bicatenario o monocatenario [1] en las células y participan en la formación de complejos de ribonucleoproteínas . Las RBP contienen varios motivos estructurales , como el motivo de reconocimiento de ARN (RRM), el dominio de unión de dsRNA, el dedo de zinc y otros. [2] [3] Son proteínas citoplasmáticas y nucleares . Sin embargo, dado que la mayor parte del ARN maduro se exporta desde el núcleo con relativa rapidez, la mayoría de las RBP en el núcleo existen como complejos de proteína y pre-ARNm llamados partículas de ribonucleoproteína heterogéneas (hnRNP). Las RBP tienen papeles cruciales en varios procesos celulares como: función celular, transporte y localización. Especialmente juegan un papel importante en el control postranscripcional de los ARN, como: empalme , poliadenilación , estabilización del ARNm , localización y traducción del ARNm . Las células eucariotas expresan diversas RBP con una actividad de unión al ARN única y una interacción proteína-proteína . Según la base de datos de RBP eucariotas (EuRBPDB), hay 2961 genes que codifican RBP en humanos . Durante la evolución , la diversidad de RBP aumentó en gran medida con el aumento del número de intrones . La diversidad permitió a las células eucariotas utilizar exones de ARN en diversas disposiciones, dando lugar a una RNP (ribonucleoproteína) única para cada ARN. Aunque las RBP tienen un papel crucial en la regulación postranscripcional en la expresión génica, se han estudiado relativamente pocas RBP de forma sistemática. Ahora ha quedado claro que las interacciones ARN-RBP desempeñan papeles importantes en muchos procesos biológicos entre los organismos. [4] [5] [6]
Muchas RBP tienen estructuras modulares y están compuestas de múltiples repeticiones de sólo unos pocos dominios básicos específicos que a menudo tienen secuencias limitadas. Diferentes RBP contienen estas secuencias dispuestas en combinaciones variables. El reconocimiento de una proteína específica de un ARN específico ha evolucionado a través de la reorganización de estos pocos dominios básicos. Cada dominio básico reconoce el ARN, pero muchas de estas proteínas requieren múltiples copias de uno de los muchos dominios comunes para funcionar. [2]
A medida que el ARN nuclear emerge de la ARN polimerasa , las transcripciones de ARN se cubren inmediatamente con proteínas de unión al ARN que regulan cada aspecto del metabolismo y la función del ARN, incluida la biogénesis, la maduración, el transporte, la localización celular y la estabilidad del ARN. Todas las RBP se unen al ARN, sin embargo, lo hacen con diferentes especificidades y afinidades de secuencia de ARN, lo que permite que las RBP sean tan diversas como sus objetivos y funciones. [5] Estos objetivos incluyen ARNm , que codifica proteínas, así como una serie de ARN no codificantes funcionales . Los NcRNA casi siempre funcionan como complejos de ribonucleoproteína y no como ARN desnudos. Estos ARN no codificantes incluyen microARN , pequeños ARN interferentes (siRNA), así como pequeños ARN nucleares espliceosómicos (snRNA). [7]
El splicing alternativo es un mecanismo por el cual se generan diferentes formas de ARNm maduros (ARN mensajeros) a partir del mismo gen . Es un mecanismo regulador por el cual las variaciones en la incorporación de los exones al ARNm conducen a la producción de más de una proteína relacionada, expandiendo así los posibles resultados genómicos. Las RBP funcionan ampliamente en la regulación de este proceso. Algunas proteínas de unión, como las proteínas de unión al ARN específicas neuronales, a saber, NOVA1 , controlan el splicing alternativo de un subconjunto de hnRNA al reconocer y unirse a una secuencia específica en el ARN (YCAY donde Y indica pirimidina, U o C). [5] Estas proteínas luego reclutan proteínas del splicingoma a este sitio objetivo. Las proteínas SR también son bien conocidas por su papel en el splicing alternativo a través del reclutamiento de snRNP que forman el splicingsome , a saber, U1 snRNP y U2AF snRNP. Sin embargo, las RBP también son parte del propio splicingsome. El esplicesoma es un complejo de subunidades de ARNm y proteínas y actúa como agente mecánico que elimina intrones y liga los exones flanqueantes. [7] Además del complejo de esplicesoma central, las RBP también se unen a los sitios de elementos de ARN que actúan en cis que influyen en la inclusión o exclusión de exones durante el esplicesoma. Estos sitios se conocen como potenciadores del esplicesoma exónico (ESEs), silenciadores del esplicesoma exónico (ESS), potenciadores del esplicesoma intrónico (ISE) y silenciadores del esplicesoma intrónico (ISS) y, según su ubicación de unión, las RBP funcionan como silenciadores o potenciadores del esplicesoma. [8]
La forma más estudiada de edición de ARN involucra a la proteína ADAR . Esta proteína funciona a través de la modificación postranscripcional de las transcripciones de ARNm al cambiar el contenido de nucleótidos del ARN. Esto se hace a través de la conversión de adenosina a inosina en una reacción enzimática catalizada por ADAR. Este proceso cambia efectivamente la secuencia de ARN de la codificada por el genoma y extiende la diversidad de los productos génicos. La mayoría de la edición de ARN ocurre en regiones no codificantes del ARN; sin embargo, se ha demostrado que algunas transcripciones de ARN que codifican proteínas están sujetas a edición que resulta en una diferencia en la secuencia de aminoácidos de su proteína. Un ejemplo de esto es el ARNm del receptor de glutamato, donde la glutamina se convierte en arginina, lo que lleva a un cambio en la funcionalidad de la proteína. [5]
La poliadenilación es la adición de una "cola" de residuos de adenilato a una transcripción de ARN aproximadamente 20 bases aguas abajo de la secuencia AAUAAA dentro de la región no traducida de tres bases principales . La poliadenilación del ARNm tiene un fuerte efecto en su transporte nuclear , eficiencia de traducción y estabilidad. Todos estos, así como el proceso de poliadenilación, dependen de la unión de RBP específicas. Todos los ARNm eucariotas, con pocas excepciones, se procesan para recibir colas poli (A) 3' de aproximadamente 200 nucleótidos. Uno de los complejos proteicos necesarios en este proceso es CPSF . CPSF se une a la secuencia de la cola 3' (AAUAAA) y junto con otra proteína llamada proteína de unión a poli (A) , recluta y estimula la actividad de la poli (A) polimerasa . La poli (A) polimerasa es inactiva por sí sola y requiere la unión de estas otras proteínas para funcionar correctamente. [5]
Una vez finalizado el procesamiento, el ARNm debe transportarse desde el núcleo celular hasta el citoplasma . Este es un proceso de tres pasos que implica la generación de un complejo de carga-transportador en el núcleo, seguido de la translocación del complejo a través del complejo de poros nucleares y, finalmente, la liberación de la carga al citoplasma. Luego, el transportador se recicla. Se cree que el heterodímero TAP/NXF1:p15 es el actor clave en la exportación de ARNm. La sobreexpresión de TAP en las ranas Xenopus laevis aumenta la exportación de transcripciones que de otro modo se exportarían de manera ineficiente. Sin embargo, TAP necesita proteínas adaptadoras porque no puede interactuar directamente con el ARNm. La proteína Aly/REF interactúa y se une al ARNm reclutando TAP. [5]
La localización del ARNm es fundamental para la regulación de la expresión génica, ya que permite la producción de proteínas regulada espacialmente. A través de la localización del ARNm, las proteínas se traducen en su sitio diana previsto de la célula. Esto es especialmente importante durante el desarrollo temprano, cuando las escisiones celulares rápidas dan a las diferentes células varias combinaciones de ARNm que luego pueden conducir a destinos celulares drásticamente diferentes. Las RBP son fundamentales en la localización de este ARNm que garantiza que las proteínas solo se traduzcan en sus regiones previstas. Una de estas proteínas es ZBP1 . ZBP1 se une al ARNm de beta-actina en el sitio de transcripción y se mueve con el ARNm hacia el citoplasma. Luego localiza este ARNm en la región de la lámina de varios tipos de células asimétricas, donde luego puede traducirse. [5] En 2008, se propuso que FMRP estaba involucrado en la localización inducida por estímulos de varios ARNm dendríticos en las dendritas neuronales de neuronas hipocampales cultivadas. [9] Estudios más recientes de ARN unidos a FMRP presentes en dendritas microdisecadas de neuronas hipocampales CA1 no revelaron cambios en la localización en cerebros de ratones de tipo salvaje versus cerebros de ratones sin FMRP. [10]
La regulación de la traducción proporciona un mecanismo rápido para controlar la expresión génica. En lugar de controlar la expresión génica a nivel transcripcional, el ARNm ya se transcribe, pero se controla el reclutamiento de ribosomas. Esto permite la generación rápida de proteínas cuando una señal activa la traducción. ZBP1, además de su papel en la localización del ARNm de beta-actina, también participa en la represión de la traducción del ARNm de beta-actina al bloquear la iniciación de la traducción. ZBP1 debe eliminarse del ARNm para permitir que el ribosoma se una correctamente y comience la traducción. [5]
Las proteínas de unión al ARN muestran un reconocimiento altamente específico de sus objetivos de ARN al reconocer sus secuencias, estructuras, motivos y modificaciones del ARN. [11] La unión específica de las proteínas de unión al ARN les permite distinguir sus objetivos y regular una variedad de funciones celulares a través del control de la generación, maduración y vida útil de la transcripción del ARN. Esta interacción comienza durante la transcripción ya que algunas RBP permanecen unidas al ARN hasta la degradación, mientras que otras solo se unen transitoriamente al ARN para regular el empalme , procesamiento, transporte y localización del ARN. [12] Los métodos de inmunoprecipitación de reticulación (CLIP) se utilizan para identificar de manera estricta los sitios de unión directa al ARN de las proteínas de unión al ARN en una variedad de tejidos y organismos. En esta sección, se discutirán tres clases de los dominios de unión al ARN más ampliamente estudiados (motivo de reconocimiento de ARN, motivo de unión al ARN bicatenario, motivo de dedo de zinc).
El motivo de reconocimiento de ARN , que es el motivo de unión de ARN más común, es un pequeño dominio proteico de 75 a 85 aminoácidos que forma una lámina β de cuatro cadenas contra las dos hélices α. Este motivo de reconocimiento ejerce su papel en numerosas funciones celulares, especialmente en el procesamiento de ARNm/ARNr, el empalme, la regulación de la traducción, la exportación de ARN y la estabilidad del ARN. Se han identificado diez estructuras de un RRM mediante espectroscopia de RMN y cristalografía de rayos X. Estas estructuras ilustran la complejidad del reconocimiento proteína-ARN de RRM, ya que implica interacciones ARN-ARN y proteína-proteína además de interacciones proteína-ARN. A pesar de su complejidad, las diez estructuras tienen algunas características comunes. Se encontró que la lámina β de cuatro cadenas de las superficies proteicas principales de todos los RRM interactúa con el ARN, que generalmente contacta dos o tres nucleótidos de una manera específica. Además, la fuerte afinidad de unión del ARN y la especificidad hacia la variación se logran a través de una interacción entre el enlazador interdominio y el ARN y entre los propios RRM. Esta plasticidad del RRM explica por qué el RRM es el dominio más abundante y por qué desempeña un papel importante en varias funciones biológicas. [12]
El motivo de unión al ARN bicatenario (dsRM, dsRBD), un dominio de 70 a 75 aminoácidos, desempeña un papel fundamental en el procesamiento del ARN , la localización del ARN , la interferencia del ARN , la edición del ARN y la represión de la traducción. Las tres estructuras del dominio resueltas a partir de 2005 poseen características unificadoras que explican cómo los dsRM solo se unen al dsRNA en lugar del dsDNA. Se descubrió que los dsRM interactúan a lo largo del dúplex de ARN a través de hélices α y bucle β1-β2. Además, las tres estructuras dsRBM hacen contacto con la cadena principal de azúcar-fosfato del surco mayor y de un surco menor, que está mediado por el bucle β1-β2 junto con la región N-terminal de la hélice alfa 2. Esta interacción es una adaptación única para la forma de una doble hélice de ARN, ya que involucra 2'-hidroxilos y oxígeno fosfato. A pesar de las características estructurales comunes entre los dsRBM, estos exhiben marcos químicos distintos, lo que permite especificidad para una variedad de estructuras de ARN, incluidos bucles de tallo, bucles internos, protuberancias o hélices que contienen desajustes. [12]
Los dominios de dedos de zinc de tipo CCHH son el dominio de unión al ADN más común dentro del genoma eucariota . Para lograr un alto reconocimiento específico de la secuencia del ADN, se utilizan varios dedos de zinc de manera modular. Los dedos de zinc presentan un pliegue proteico ββα en el que una horquilla β y una hélice α se unen a través de una Zn2+
ion. Además, la interacción entre las cadenas laterales de proteínas de la hélice α con las bases de ADN en el surco mayor permite el reconocimiento específico de la secuencia de ADN. A pesar de su amplio reconocimiento del ADN, ha habido descubrimientos recientes de que los dedos de zinc también tienen la capacidad de reconocer ARN. Además de los dedos de zinc CCHH, recientemente se descubrió que los dedos de zinc CCCH emplean el reconocimiento específico de secuencia de ARN monocatenario a través de una interacción entre enlaces de hidrógeno intermoleculares y bordes Watson-Crick de las bases de ARN. Los dedos de zinc de tipo CCHH emplean dos métodos de unión de ARN. Primero, los dedos de zinc ejercen una interacción no específica con la estructura principal de una doble hélice , mientras que el segundo modo permite que los dedos de zinc reconozcan específicamente las bases individuales que sobresalen. A diferencia del tipo CCHH, el dedo de zinc de tipo CCCH muestra otro modo de unión de ARN, en el que el ARN monocatenario se identifica de una manera específica de la secuencia. En general, los dedos de zinc pueden reconocer directamente el ADN a través de la unión a la secuencia de dsADN y el ARN a través de la unión a la secuencia de ssARN. [12]
La regulación transcripcional y postranscripcional del ARN por parte de las proteínas de unión al ARN desempeña un papel en la regulación de los patrones de expresión génica durante el desarrollo. [13] Una amplia investigación sobre el nematodo C. elegans ha identificado a las proteínas de unión al ARN como factores esenciales durante la línea germinal y el desarrollo embrionario temprano. Su función específica implica el desarrollo de tejidos somáticos ( neuronas , hipodermis , músculos y células excretoras), además de proporcionar señales de tiempo para los eventos de desarrollo. Sin embargo, es excepcionalmente difícil descubrir el mecanismo detrás de la función de las RBP en el desarrollo debido a la dificultad de identificar sus dianas de ARN. Esto se debe a que la mayoría de las RBP suelen tener múltiples dianas de ARN. [14] Sin embargo, es indiscutible que las RBP ejercen un control crítico en la regulación de las vías de desarrollo de manera concertada.
En Drosophila melanogaster , Elav, Sxl y tra-2 son genes codificadores de proteínas de unión a ARN que son críticos en la determinación temprana del sexo y el mantenimiento del estado sexual somático. [15] Estos genes imponen efectos en el nivel postranscripcional al regular el empalme específico del sexo en Drosophila . Sxl ejerce una regulación positiva del gen feminizante tra para producir un ARNm tra funcional en hembras. En C. elegans , las proteínas de unión a ARN que incluyen FOG-1, MOG-1/-4/-5 y RNP-4 regulan la determinación del sexo somático y de la línea germinal. Además, varias RBP como GLD-1, GLD-3, DAZ-1, PGL-1 y OMA-1/-2 ejercen sus funciones reguladoras durante la progresión de la profase meiótica , la gametogénesis y la maduración de los ovocitos . [14]
Además de las funciones de las RBP en el desarrollo de la línea germinal, el control postranscripcional también desempeña un papel importante en el desarrollo somático. A diferencia de las RBP que participan en el desarrollo de la línea germinal y del embrión temprano, las RBP que funcionan en el desarrollo somático regulan el empalme alternativo específico de tejido de los objetivos del ARNm. Por ejemplo, MEC-8 y UNC-75 que contienen dominios RRM se localizan en regiones de la hipodermis y el sistema nervioso, respectivamente. [14] Además, se ha revelado que otra RBP que contiene RRM, EXC-7, se localiza en las células del canal excretor embrionario y en todo el sistema nervioso durante el desarrollo somático.
Se ha demostrado que ZBP1 regula la dendritogénesis ( formación de dendritas ) en las neuronas del hipocampo. [16] Otras proteínas de unión al ARN implicadas en la formación de dendritas son Pumilio y Nanos, [17] FMRP , CPEB y Staufen 1 [18]
Las RBP están surgiendo para desempeñar un papel crucial en el desarrollo de tumores. [19] Cientos de RBP están notablemente desregulados en cánceres humanos y mostraron una regulación negativa predominante en tumores relacionados con tejidos normales. [19] Muchas RBP se expresan de manera diferencial en diferentes tipos de cáncer, por ejemplo, KHDRBS1 (Sam68), [20] [21] ELAVL1 (HuR), [22] [23] FXR1 [24] y UHMK1 . [25] Para algunas RBP, el cambio en la expresión está relacionado con variaciones en el número de copias (CNV), por ejemplo, ganancias de CNV de BYSL en células de cáncer colorrectal [19] y ESRP1, CELF3 en cáncer de mama, RBM24 en cáncer de hígado, IGF2BP2, IGF2BP3 en cáncer de pulmón o pérdidas de CNV de KHDRBS2 en cáncer de pulmón. [26] Algunos cambios de expresión son causados por mutaciones que afectan a las proteínas en estas RBP, por ejemplo, NSUN6, ZC3H13, ELAC1, RBMS3 y ZGPAT, SF3B1, SRSF2, RBM10, U2AF1, SF3B1, PPRC1, RBMXL1, HNRNPCL1, etc. [19] [26] [27] [28] [29] Varios estudios han relacionado este cambio en la expresión de las RBP con el empalme alternativo aberrante en el cáncer. [26] [30] [31]
Como las proteínas de unión al ARN ejercen un control significativo sobre numerosas funciones celulares, han sido un área de investigación popular para muchos investigadores. Debido a su importancia en el campo biológico, recientemente se han revelado numerosos descubrimientos sobre el potencial de las proteínas de unión al ARN. [12] El desarrollo reciente en la identificación experimental de proteínas de unión al ARN ha ampliado significativamente el número de proteínas de unión al ARN [32] [33] [34]
La proteína de unión al ARN Sam68 controla la compartimentación espacial y temporal del metabolismo del ARN para lograr una función sináptica adecuada en las dendritas . La pérdida de Sam68 da como resultado una regulación postranscripcional anormal y, en última instancia, conduce a trastornos neurológicos como el síndrome de temblor/ataxia asociado al cromosoma X frágil . Se descubrió que Sam68 interactúa con el ARNm que codifica la β-actina , que regula la formación sináptica de las espinas dendríticas con sus componentes citoesqueléticos . Por lo tanto, Sam68 desempeña un papel fundamental en la regulación del número de sinapsis a través del control del metabolismo postsináptico del ARNm de la β-actina. [35]
La proteína de unión a ARN de la familia CELF específica de neuronas UNC-75 se une específicamente al tramo de ARNm UUGUUGUGUUGU a través de sus tres motivos de reconocimiento de ARN para la selección del exón 7a en las células neuronales de C. elegans . Como el exón 7a se omite debido a sus sitios de empalme débiles en células no neuronales, se descubrió que UNC-75 activa específicamente el empalme entre el exón 7a y el exón 8 solo en las células neuronales. [36]
La proteína de unión al ARN inducible por frío CIRBP desempeña un papel en el control de la respuesta celular al enfrentarse a una variedad de estreses celulares, incluida la luz ultravioleta de longitud de onda corta , la hipoxia y la hipotermia . Esta investigación arrojó posibles implicaciones para la asociación de estados patológicos con la inflamación. [37]
Se ha descubierto que la proteína de unión a ARN Slr1 de la familia serina-arginina ejerce un control sobre el crecimiento polarizado en Candida albicans . Las mutaciones de Slr1 en ratones dan como resultado una disminución de la filamentación y reducen el daño a las células epiteliales y endoteliales , lo que conduce a una mayor tasa de supervivencia en comparación con las cepas de tipo salvaje Slr1. Por lo tanto, esta investigación revela que la proteína similar a SR Slr1 desempeña un papel en la instigación de la formación de hifas y la virulencia en C. albicans . [38]
{{cite book}}
: |journal=
ignorado ( ayuda )