Los elementos nucleares intercalados cortos ( SINE ) son elementos transponibles (TE) no autónomos y no codificantes que tienen entre 100 y 700 pares de bases de longitud. [1] Son una clase de retrotransposones , elementos de ADN que se amplifican a través de los genomas eucariotas , a menudo a través de intermediarios de ARN . Los SINE componen aproximadamente el 13% del genoma de los mamíferos . [2]
Las regiones internas de los SINE se originan a partir de ARNt y permanecen altamente conservadas, lo que sugiere una presión positiva para preservar la estructura y función de los SINE. [3] Si bien los SINE están presentes en muchas especies de vertebrados e invertebrados, los SINE a menudo son específicos de linaje, lo que los convierte en marcadores útiles de evolución divergente entre especies. La variación del número de copias y las mutaciones en la secuencia SINE permiten construir filogenias basadas en diferencias en SINE entre especies. Los SINE también están implicados en ciertos tipos de enfermedades genéticas en humanos y otros eucariotas .
En esencia, los elementos nucleares cortos intercalados son parásitos genéticos que han evolucionado muy temprano en la historia de los eucariotas para utilizar maquinaria proteica dentro del organismo, así como para cooptar la maquinaria de elementos genómicos igualmente parásitos. La simplicidad de estos elementos los hace notablemente exitosos a la hora de persistir y amplificarse (mediante retrotransposición) dentro de los genomas de eucariotas. Estos "parásitos" que se han vuelto omnipresentes en los genomas pueden ser muy perjudiciales para los organismos, como se analiza más adelante. Sin embargo, los eucariotas han podido integrar elementos nucleares intercalados brevemente en diferentes vías de señalización, metabólicas y reguladoras, y los SINE se han convertido en una gran fuente de variabilidad genética. Parecen desempeñar un papel particularmente importante en la regulación de la expresión genética y la creación de genes de ARN . Esta regulación se extiende a la reorganización de la cromatina y la regulación de la arquitectura genómica. Los diferentes linajes, mutaciones y actividades entre eucariotas hacen que los elementos nucleares intercalados brevemente sean una herramienta útil en el análisis filogenético.
Los SINE se clasifican como retrotransposones no LTR porque no contienen repeticiones terminales largas (LTR) . [4] Hay tres tipos de SINE comunes a vertebrados e invertebrados: CORE-SINE, V-SINE y AmnSINE. [3] Los SINE tienen regiones internas de 50 a 500 pares de bases que contienen un segmento derivado de ARNt con cajas A y B que sirven como promotor interno para la ARN polimerasa III . [5] [3]
Los SINE se caracterizan por sus diferentes módulos, que son esencialmente una sección de su secuencia. Los SINE pueden poseer, aunque no necesariamente, una cabeza, un cuerpo y una cola. La cabeza, se encuentra en el extremo 5 ' de elementos nucleares intercalados cortos y deriva evolutivamente de un ARN sintetizado por la ARN polimerasa III, como los ARN ribosómicos y los ARNt; la cabeza 5 'es indicativa de qué elemento endógeno se derivó SINE y fue capaz de utilizar de forma parásita su maquinaria transcripcional. [1] Por ejemplo, el 5' del seno Alu se deriva del ARN 7SL , una secuencia transcrita por la ARN polimerasa III que codifica el elemento ARN de SRP, una ribonucleoproteína abundante. [6] El cuerpo de los SINE posee un origen desconocido, pero a menudo comparte mucha homología con un LINE correspondiente , lo que permite a los SINE cooptar parasitariamente endonucleasas codificadas por LINE (que reconocen ciertos motivos de secuencia). Por último, la cola 3 ′ de los SINE se compone de repeticiones breves y simples de diferentes longitudes; estas repeticiones simples son sitios donde dos (o más) elementos nucleares intercalados brevemente pueden combinarse para formar un SINO dimérico. [7] Los elementos nucleares intercalados brevemente que solo poseen una cabeza y una cola se denominan SINE simples, mientras que los elementos nucleares intercalados brevemente que también poseen un cuerpo o son una combinación de dos o más SINE son SINE complejos. [1]
Los elementos nucleares intercalados brevemente son transcritos por la ARN polimerasa III , que se sabe que transcribe el ARN ribosómico y el ARNt , dos tipos de ARN vitales para el ensamblaje ribosómico y la traducción del ARNm . [8] Los SINE, como los ARNt y muchos ARN nucleares pequeños, poseen un promotor interno y, por lo tanto, se transcriben de manera diferente a la mayoría de los genes codificadores de proteínas. [1] En otras palabras, los elementos nucleares intercalados brevemente tienen sus elementos promotores clave dentro de la propia región transcrita. Aunque son transcritos por la ARN polimerasa III, los SINE y otros genes que poseen promotores internos, reclutan maquinaria y factores transcripcionales diferentes a los de los genes que poseen promotores ascendentes. [9]
Los cambios en la estructura cromosómica influyen en la expresión genética principalmente al afectar la accesibilidad de los genes a la maquinaria transcripcional. El cromosoma tiene un sistema muy complejo y jerárquico de organización del genoma. Este sistema de organización, que incluye histonas , grupos metilo , grupos acetilo y una variedad de proteínas y ARN, permite que diferentes dominios dentro de un cromosoma sean accesibles a las polimerasas, factores de transcripción y otras proteínas asociadas en diferentes grados. [10] Además, la forma y densidad de ciertas áreas de un cromosoma pueden afectar la forma y densidad de regiones vecinas (o incluso distantes) en el cromosoma a través de la interacción facilitada por diferentes proteínas y elementos. Los ARN no codificantes, como los elementos nucleares intercalados cortos, que se sabe que se asocian y contribuyen a la estructura de la cromatina, pueden desempeñar un papel muy importante en la regulación de la expresión genética. [11] Los elementos nucleares intercalados brevemente pueden participar de manera similar en la regulación genética modificando la arquitectura genómica.
De hecho, Usmanova et al. 2008 sugirió que los elementos nucleares intercalados brevemente pueden servir como señales directas en el reordenamiento y la estructura de la cromatina . El artículo examinó la distribución global de SINE en cromosomas humanos y de ratón y determinó que esta distribución era muy similar a la distribución genómica de genes y motivos CpG . [12] La distribución de los SINE a los genes fue significativamente más similar que la de otros elementos genéticos no codificantes e incluso difirió significativamente de la distribución de elementos nucleares intercalados durante mucho tiempo. [12] Esto sugirió que la distribución SINE no fue un mero accidente causado por la retrotransposición mediada por LINE, sino que los SINE poseían un papel en la regulación genética. Además, los SINE contienen frecuentemente motivos para proteínas policomb YY1 . [12] YY1 es una proteína con dedos de zinc que actúa como represor transcripcional para una amplia variedad de genes esenciales para el desarrollo y la señalización. [13] Se cree que la proteína Polycomb YY1 media la actividad de las histonas desacetilasas y las histonas acetiltransferasas para facilitar la reorganización de la cromatina; Esto suele ser para facilitar la formación de heterocromatina (estado de silenciamiento de genes). [14] Por lo tanto, el análisis sugiere que los elementos nucleares intercalados brevemente pueden funcionar como un "refuerzo de señal" en el silenciamiento de conjuntos de genes dependiente de policomb a través de la reorganización de la cromatina. [12] En esencia, es el efecto acumulativo de muchos tipos de interacciones lo que conduce a la diferencia entre la eucromatina , que no está muy compacta y generalmente es más accesible a la maquinaria transcripcional, y la heterocromatina , que está muy compacta y generalmente no es accesible a la maquinaria transcripcional. maquinaria; Los SINE parecen desempeñar un papel evolutivo en este proceso.
Además de afectar directamente la estructura de la cromatina, existen varias formas en las que los SINE pueden regular potencialmente la expresión genética. Por ejemplo, los ARN largos no codificantes pueden interactuar directamente con represores y activadores transcripcionales, atenuando o modificando su función. [15] Este tipo de regulación puede ocurrir de diferentes maneras: la transcripción de ARN puede unirse directamente al factor de transcripción como co-regulador; Además, el ARN puede regular y modificar la capacidad de los correguladores para asociarse con el factor de transcripción. [15] Por ejemplo, se sabe que Evf-2, un cierto ARN largo no codificante, funciona como coactivador de ciertos factores de transcripción homeobox que son críticos para el desarrollo y la organización del sistema nervioso. [16] Además, las transcripciones de ARN pueden interferir con la funcionalidad del complejo transcripcional al interactuar o asociarse con ARN polimerasas durante los procesos de transcripción o carga. [15] Además, los ARN no codificantes como los SINE pueden unirse o interactuar directamente con el dúplex de ADN que codifica el gen y así prevenir su transcripción. [15]
Además, muchos ARN no codificantes se distribuyen cerca de genes codificadores de proteínas, a menudo en dirección inversa. Esto es especialmente cierto para elementos nucleares intercalados de corta duración, como se ve en Usmanova et al. Estos ARN no codificantes, que se encuentran adyacentes o se superponen a conjuntos de genes, proporcionan un mecanismo mediante el cual se pueden reclutar factores y maquinaria de transcripción para aumentar o reprimir la transcripción de genes locales. El ejemplo particular de los SINE que potencialmente reclutan el represor transcripcional policomb YY1 se analiza anteriormente. [12] Alternativamente, también proporciona un mecanismo mediante el cual la expresión genética local puede reducirse y regularse porque los complejos transcripcionales pueden obstaculizar o evitar que se transcriban genes cercanos. Hay investigaciones que sugieren que este fenómeno se observa particularmente en la regulación genética de las células pluripotentes. [17]
En conclusión, los ARN no codificantes como los SINE son capaces de afectar la expresión genética en multitud de niveles diferentes y de diferentes maneras. Se cree que los elementos nucleares intercalados brevemente están profundamente integrados en una red reguladora compleja capaz de ajustar la expresión genética en todo el genoma eucariota.
El ARN codificado por el elemento nuclear intercalado brevemente no codifica ningún producto proteico pero, no obstante, se transcribe de forma inversa y se inserta nuevamente en una región alternativa del genoma. Por esta razón, se cree que los elementos nucleares intercalados cortos han coevolucionado con los elementos nucleares intercalados largos (LINE), ya que los LINE de hecho codifican productos proteicos que les permiten transcripción inversa e integración nuevamente en el genoma. [4] Se cree que los SINE han cooptado las proteínas codificadas por LINE que están contenidas en 2 marcos de lectura. El marco de lectura abierto 1 (ORF 1) codifica una proteína que se une al ARN y actúa como acompañante para facilitar y mantener la estructura del complejo proteína-ARN LINE. [18] El marco de lectura abierto 2 (ORF 2) codifica una proteína que posee actividades tanto de endonucleasa como de transcriptasa inversa. [19] Esto permite que el ARNm de LINE se transcriba de forma inversa en ADN y se integre en el genoma basándose en los motivos de secuencia reconocidos por el dominio de endonucleasa de la proteína.
LINE-1 (L1) se transcribe y retrotranspone con mayor frecuencia en la línea germinal y durante el desarrollo temprano; como resultado, los SINE se mueven más por el genoma durante estos períodos. La transcripción SINE está regulada negativamente por factores de transcripción en las células somáticas después del desarrollo temprano, aunque el estrés puede causar una regulación positiva de los SINE normalmente silenciosos. [20] Los SINE se pueden transferir entre individuos o especies mediante transferencia horizontal a través de un vector viral . [21]
Se sabe que los SINE comparten homología de secuencia con LINES, lo que proporciona una base mediante la cual la maquinaria LINE puede realizar transcripción inversa e integrar transcripciones SINE. [22] Alternativamente, se cree que algunos SINE utilizan un sistema mucho más complejo de integración nuevamente en el genoma; este sistema implica el uso de roturas aleatorias de ADN de doble cadena (en lugar de la endonucleasa codificada por elementos nucleares relacionados intercalados durante mucho tiempo que crean un sitio de inserción). [22] Estas roturas del ADN se utilizan para preparar la transcriptasa inversa y, en última instancia, integrar la transcripción SINE nuevamente en el genoma. [22] No obstante, los SINE dependen de enzimas codificadas por otros elementos del ADN y, por lo tanto, se los conoce como retrotransposones no autónomos, ya que dependen de la maquinaria de los LINE, que se conocen como retrotransposones autónomos. < [23]
La teoría de que los elementos nucleares intercalados de forma corta han evolucionado para utilizar la maquinaria de retrotransposones de elementos nucleares intercalados de forma larga está respaldada por estudios que examinan la presencia y distribución de LINE y SINE en taxones de diferentes especies. [24] Por ejemplo, LINE y SINE en roedores y primates muestran una homología muy fuerte en el motivo del sitio de inserción. [24] Dicha evidencia es una base para el mecanismo propuesto en el cual la integración de la transcripción SINE puede ser cooptada con productos proteicos codificados por LINE. Esto se demuestra específicamente mediante un análisis detallado de más de 20 especies de roedores perfiladas LINE y SINE, principalmente L1 y B1 respectivamente; Estas son familias de LINE y SINE que se encuentran con alta frecuencia en roedores junto con otros mamíferos. [24] El estudio buscó proporcionar claridad filogenética dentro del contexto de la actividad LINE y SINE.
El estudio llegó a un taxón candidato que se cree que es el primer caso de extinción de L1 LINE; Como era de esperar, descubrió que no había evidencia que sugiriera que la actividad B1 SINE ocurriera en especies que no tenían actividad L1 LINE. [24] Además, el estudio sugirió que el silenciamiento del elemento nuclear intercalado brevemente B1 de hecho ocurrió antes de la extinción del elemento nuclear intercalado largo L1; esto se debe al hecho de que los B1 SINE están silenciados en el género más estrechamente relacionado con el género que no contiene L1 LINE activos (aunque el género con B1 SINE silenciado todavía contiene L1 LINE activos). [24] También se encontró otro género que contenía de manera similar elementos nucleares activos L1 intercalados largamente pero no contenía elementos nucleares B1 intercalados cortamente; No se encontró el escenario opuesto, en el que los SINE B1 activos estaban presentes en un género que no poseía LINE L1 activos. [24] Este resultado era esperado y respalda firmemente la teoría de que los SINE han evolucionado para cooptar las proteínas de unión a ARN, las endonucleasas y las transcriptasas inversas codificadas por los LINE. En los taxones que no transcriben ni traducen activamente productos proteicos de elementos nucleares intercalados durante mucho tiempo, los SINE no tienen la base teórica para retrotransponer dentro del genoma. Los resultados obtenidos en Rinehart et al. Por lo tanto, apoyan mucho el modelo actual de retrotransposición SINE.
La inserción de un SINE aguas arriba de una región codificante puede provocar una mezcla de exones o cambios en la región reguladora del gen. La inserción de un SINE en la secuencia codificante de un gen puede tener efectos nocivos y la transposición no regulada puede causar enfermedades genéticas . Se cree que la transposición y recombinación de SINE y otros elementos nucleares activos es una de las principales contribuciones de la diversidad genética entre linajes durante la especiación. [21]
Se cree que los elementos nucleares intercalados brevemente tienen orígenes parásitos en genomas eucariotas. Estos SINE han mutado y replicado una gran cantidad de veces en una escala de tiempo evolutiva y, por lo tanto, forman muchos linajes diferentes. Su origen evolutivo temprano ha hecho que sean ubicuos en muchos linajes eucariotas.
Los elementos Alu , elementos nucleares intercalados brevemente de aproximadamente 300 nucleótidos, son los SINE más comunes en humanos, con >1.000.000 de copias en todo el genoma, lo que representa más del 10 por ciento del genoma total; esto no es infrecuente entre otras especies. [25] Las diferencias en el número de copias del elemento Alu se pueden utilizar para distinguir y construir filogenias de especies de primates. [21] Los caninos se diferencian principalmente en su abundancia de repeticiones SINEC_Cf en todo el genoma, en lugar de otras mutaciones a nivel de genes o alelos. Estos SINE específicos para perros pueden codificar un sitio aceptor de empalme, alterando las secuencias que aparecen como exones o intrones en cada especie. [26]
Aparte de los mamíferos, los SINE pueden alcanzar un elevado número de copias en una variedad de especies, incluidos vertebrados no óseos (tiburón elefante) y algunas especies de peces (celacantos). [27] En las plantas, los SINE a menudo están restringidos a especies estrechamente relacionadas y han surgido, descompuesto y desaparecido con frecuencia durante la evolución. [28] Sin embargo, algunas familias SINE, como Au-SINE [29] y Angio-SINE [30], están inusualmente extendidas en muchas especies de plantas a menudo no relacionadas.
Hay más de 50 enfermedades humanas asociadas con los SINE. [20] Cuando se insertan cerca o dentro del exón, los SINE pueden causar un empalme inadecuado, convertirse en regiones codificantes o cambiar el marco de lectura , lo que a menudo conduce a fenotipos de enfermedades en humanos y otros animales. [26] La inserción de elementos Alu en el genoma humano está asociada con cáncer de mama , cáncer de colon , leucemia , hemofilia , enfermedad de Dent , fibrosis quística , neurofibromatosis y muchos otros. [4]
Múltiples estudios han respaldado el papel de los elementos nucleares intercalados brevemente en la regulación genética dentro de las células. Uno de esos estudios examinó la correlación entre una determinada familia de SINE con microARN (en el pez cebra ). [31] La familia específica de SINE que se estaba examinando fue Anamnia V-SINE; Esta familia de elementos nucleares cortos intercalados se encuentra a menudo en la región no traducida del extremo 3' de muchos genes y está presente en genomas de vertebrados. [31] El estudio implicó un análisis computacional en el que se examinó la distribución genómica y la actividad de Anamnia V-SINE en el pez cebra Danio rerio ; Además, se analizó el potencial de estos V-SINE para generar nuevos loci de microARN. [31] Se descubrió que los genes que se predijo que poseían V-SINE fueron atacados por microARN con valores E de hibridación significativamente más altos (en relación con otras áreas del genoma). [31] Los genes que tenían valores E de hibridación altos eran genes particularmente involucrados en las vías metabólicas y de señalización. [31] Se ha identificado (en mamíferos) que casi todos los miARN que tienen una fuerte capacidad de hibridarse con supuestos motivos de secuencia V-SINE en genes tienen funciones reguladoras. [31] Estos resultados que establecen una correlación entre elementos nucleares intercalados cortos y diferentes microARN reguladores sugieren fuertemente que los V-SINE tienen un papel importante en la atenuación de las respuestas a diferentes señales y estímulos relacionados con el metabolismo, la proliferación y la diferenciación. Se deben realizar muchos otros estudios para establecer la validez y el alcance del papel de los retrotransposones de elementos nucleares intercalados brevemente en las redes reguladoras de expresión genética. En conclusión, aunque no se sabe mucho sobre el papel y el mecanismo por el cual los SINE generan loci de genes de miARN, generalmente se entiende que los SINE han desempeñado un papel evolutivo significativo en la creación de "genes de ARN", esto también se menciona anteriormente en SINE. y pseudogenes.
Con tal evidencia que sugiere que los elementos nucleares intercalados brevemente han sido fuentes evolutivas para la generación de loci de microARN, es importante discutir más a fondo las posibles relaciones entre los dos, así como el mecanismo por el cual el microARN regula la degradación del ARN y, más ampliamente, la expresión genética. Un microARN es un ARN no codificante que generalmente tiene una longitud de 22 nucleótidos. [32] Este oligonucleótido no codificante de proteínas está codificado por una secuencia de ADN nuclear más larga generalmente transcrita por la ARN polimerasa II, que también es responsable de la transcripción de la mayoría de los ARNm y ARNsn en eucariotas. [33] Sin embargo, algunas investigaciones sugieren que algunos microARN que poseen elementos nucleares intercalados cortos aguas arriba son transcritos por la ARN polimerasa III, que está ampliamente implicada en el ARN ribosomal y el ARNt, dos transcripciones vitales para la traducción del ARNm. [34] Esto proporciona un mecanismo alternativo mediante el cual elementos nucleares intercalados brevemente podrían interactuar o mediar en redes reguladoras de genes que involucran microARN.
Las regiones que codifican miARN pueden ser genes de ARN independientes que a menudo son antisentido con respecto a genes codificadores de proteínas vecinos, o pueden encontrarse dentro de los intrones de genes codificadores de proteínas. [35] La co-localización de microARN y genes codificadores de proteínas proporciona una base mecanística mediante la cual el microARN regula la expresión genética. Además, Scarpato et al. revela (como se discutió anteriormente) que los genes que se predijo que poseerían elementos nucleares intercalados cortos (SINE) a través del análisis de secuencia fueron atacados e hibridados por microARN significativamente mayores que otros genes. [31] Esto proporciona un camino evolutivo mediante el cual los SINE parásitos fueron cooptados y utilizados para formar genes de ARN (como microARN) que han evolucionado para desempeñar un papel en redes complejas de regulación de genes.
Los microARN se transcriben como parte de cadenas de ARN más largas, generalmente de unos 80 nucleótidos, que mediante el emparejamiento de bases complementarias pueden formar estructuras en forma de horquilla [36]. Estas estructuras son reconocidas y procesadas en el núcleo por la proteína nuclear Región crítica del síndrome de DiGeorge 8 ( DGCR8) que recluta y se asocia con la proteína Drosha. [37] Este complejo es responsable de escindir algunas de las estructuras en horquilla del pre-microARN que se transporta al citoplasma. El pre-miARN es procesado por la proteína DICER en un nucleótido bicatenario de 22. [38] A partir de entonces, una de las cadenas se incorpora a un complejo de silenciamiento inducido por ARN multiproteico (RISC). [39] Entre estas proteínas se encuentran proteínas de la familia Argonaute que son fundamentales para la capacidad del complejo para interactuar y reprimir la traducción del ARNm objetivo. [40]
Comprender las diferentes formas en que el microARN regula la expresión genética, incluida la traducción y degradación del ARNm, es clave para comprender el papel evolutivo potencial de los SINE en la regulación genética y en la generación de loci de microARN. Esto, además del papel directo de los SINE en las redes regulatorias (como se analiza en los SINE como ARN largos no codificantes) es crucial para comenzar a comprender la relación entre los SINE y ciertas enfermedades. Múltiples estudios han sugerido que el aumento de la actividad SINE se correlaciona con ciertos perfiles de expresión genética y la regulación postranscripción de ciertos genes. [41] [42] [43] De hecho, Peterson et al. 2013 demostró que la alta expresión de ARN SINE se correlaciona con la regulación negativa postranscripcional de BRCA1 , un supresor de tumores implicado en múltiples formas de cáncer, concretamente el cáncer de mama. [43] Además, los estudios han establecido una fuerte correlación entre la movilización transcripcional de SINE y ciertos cánceres y afecciones como la hipoxia; Esto puede deberse a la inestabilidad genómica causada por la actividad SINE, así como a efectos más directos. [42] Los SINE también han sido implicados en muchas otras enfermedades. En esencia, los elementos nucleares intercalados brevemente se han integrado profundamente en innumerables vías reguladoras, metabólicas y de señalización y, por lo tanto, desempeñan un papel inevitable en la causa de enfermedades. Aún queda mucho por saber sobre estos parásitos genómicos, pero está claro que desempeñan un papel importante en los organismos eucariotas.
La actividad de los SINE, sin embargo, tiene vestigios genéticos que no parecen desempeñar un papel significativo, positivo o negativo, y se manifiestan en el genoma como pseudogenes . Sin embargo, los SINE no deben confundirse con pseudogenes de ARN. [1] En general, los pseudogenes se generan cuando los ARNm procesados de genes que codifican proteínas se transcriben de forma inversa y se incorporan nuevamente al genoma (los pseudogenes de ARN son genes de ARN con transcripción inversa). [44] Los pseudogenes generalmente no funcionan, ya que descienden de ARN procesados independientemente de su contexto evolutivo, que incluye intrones y diferentes elementos reguladores que permiten la transcripción y el procesamiento. Estos pseudogenes, aunque no funcionales, en algunos casos aún pueden poseer promotores, islas CpG y otras características que permiten la transcripción; por lo tanto, todavía pueden transcribirse y pueden desempeñar un papel en la regulación de la expresión genética (como los SINE y otros elementos no codificantes). [44] Por lo tanto, los pseudogenes se diferencian de los SINE en que se derivan de ARN funcional transcrito, mientras que los SINE son elementos de ADN que se retrotransponen mediante la cooptación de la maquinaria transcripcional de los genes de ARN. Sin embargo, hay estudios que sugieren que los elementos retrotransponibles, como los elementos nucleares intercalados brevemente, no sólo son capaces de copiarse a sí mismos en regiones alternativas del genoma, sino que también pueden hacerlo para genes aleatorios. [45] [46] Por lo tanto, los SINE pueden desempeñar un papel vital en la generación de pseudogenes, que a su vez se sabe que están involucrados en redes regulatorias. Este es quizás otro medio por el cual los SINE han podido influir y contribuir a la regulación genética.