Los helitrones son uno de los tres grupos de elementos transponibles (ET) eucariotas de clase 2 descritos hasta ahora. Son los elementos transponibles eucariotas de círculo rodante que se supone que se transponen mediante un mecanismo de replicación de círculo rodante a través de un intermediario de ADN monocatenario . [1] Se descubrieron por primera vez en plantas ( Arabidopsis thaliana y Oryza sativa ) y en el nematodo Caenorhabditis elegans , y ahora se han identificado en una amplia gama de especies, desde protistas hasta mamíferos . Los helitrones constituyen una fracción sustancial de muchos genomas donde los elementos no autónomos con frecuencia superan en número al supuesto socio autónomo. Los helitrones parecen tener un papel importante en la evolución de los genomas del huésped. Con frecuencia capturan diversos genes del huésped, algunos de los cuales pueden evolucionar en nuevos genes del huésped o volverse esenciales para la transposición de helitrones . [2]
Los helitrones fueron el primer grupo de TE que se descubrió mediante análisis computacional de secuencias de genoma completo. Los primeros helitrones descritos se llamaron Aie, AthE1, Atrep y Basho, que son helitrones no autónomos que se encuentran en el genoma de Arabidopsis thaliana , una pequeña planta con flores. [3] A pesar de estos descubrimientos, la clasificación de los helitrones era desconocida hasta 2001, cuando se descubrió que los elementos codificadores de proteínas eran los socios autónomos. Kapitonov y Jurka investigaron la capacidad de codificación de los helitrones en A. thaliana , Oryza sativa y Caenorhabditis elegans utilizando estudios in silico del ADN repetitivo de estos organismos, análisis computacional y simulación de Monte Carlo . Describieron la estructura y el potencial de codificación de los helitrones canónicos y propusieron el mecanismo de transposición de círculo rodante, así como la posibilidad de que algunos de los genes codificados capturados del huésped ahora se utilicen para la replicación. [4] Su estudio del genoma de estos organismos mostró que la actividad de Helitron podría contribuir a una fracción significativa (~ 2%) de los genomas de plantas e invertebrados donde se encontraron, pero el alcance de su distribución en otros lugares no estaba claro. [1]
En 2003, un grupo de investigadores estudió la estructura de las proteínas relacionadas con los helitrones y los diferentes dominios de codificación dentro de ellos buscando elementos similares a los helitrones en vertebrados, específicamente el pez cebra, Danio rerio y un pez globo, Sphoeroides nephelus . Se predijo que las proteínas Rep/Helicasa serían de 500 a 700 aminoácidos más largas debido a una fusión C-terminal de un dominio con homología con la endonucleasa apurínica-apirimidínica (AP). [5] Estudios filogenéticos previos mostraron que la endonucleasa AP está anidada dentro del clado Chicken Repeat 1 (CR1) de retrotransposones de repetición terminal no larga (no LTR). [6] Esta relación sugirió que la endonucleasa AP se originó a partir de una inserción de retrotransposón cerca o dentro de un helitrón. [5] Estos investigadores no pudieron identificar los extremos de la unidad Rep/Helicasa/Endonucleasa de los helitrones.
En los últimos años, se han identificado helitrones en todos los reinos eucariotas, pero el número de copias genómicas es muy variable, incluso entre especies estrechamente relacionadas. Representan entre el 1 y el 5 % del ADN genómico en diferentes moscas de la fruta, entre el 0 y el 3 % en los mamíferos y más del 0,5 % en la rana. [2] En la mayoría de los mamíferos, la presencia de helitrones es insignificante y se limita a restos de transposones antiguos, con la excepción de los genomas de los murciélagos, que están poblados por numerosos elementos jóvenes. [7] Sin embargo, muchos años después de la descripción de los helitrones autónomos, no se han publicado estudios mecanísticos y, por lo tanto, el mecanismo de transposición de círculo rodante sigue siendo una hipótesis bien sustentada, pero aún no probada. [1]
Los helitrones son estructuralmente asimétricos y son la única clase de transposones de ADN eucariotas que no generan duplicaciones de sitios diana durante la transposición. Los helitrones canónicos suelen comenzar con una T 5′ (C/T) y terminan con los nucleótidos CTRR (más frecuentemente CTAG, pero ocasionalmente se han observado variaciones), pero no contienen repeticiones terminales invertidas. Además, con frecuencia tienen una secuencia palindrómica corta (16 a 20 nucleótidos) en horquilla a unos 11 pb del extremo 3′. Se integran entre un dinucleótido huésped AT. [2] Algunas familias de helitrones también llevan repeticiones en tándem, como microsatélites y minisatélites que generalmente son secuencias altamente mutables. [1]
La mayoría de los helitrones son elementos no autónomos y comparten terminales comunes y otras características estructurales con los helitrones autónomos, pero no codifican ningún conjunto completo de proteínas codificadas por los elementos autónomos. [4] Las principales características enzimáticas de los helitrones son los dominios de iniciador de replicación de círculo rodante (Rep) y helicasa de ADN (Hel), que están presentes en una proteína que comprende 1000-3000 aminoácidos (aa) (Rep/Hel) codificados por todos los elementos autónomos de los helitrones. La proteína Rep/Helicasa incluye motivos de dedos de zinc, el dominio Rep (que es de ~100 aa y tiene actividad de endonucleasa HUH) y una helicasa de la familia PiF1 de ocho dominios (SuperFamily1) que se conservan universalmente en los helitrones. [2] Los motivos similares a dedos de zinc se han asociado con la unión al ADN. El dominio Hel de ~400 aa se clasifica como un ADN Hel de 5' a 3' que está involucrado en la ruptura y unión del ADN monocatenario y se caracteriza tanto por la presencia del motivo HUH (dos residuos de histidina separados por un residuo hidrofóbico) como por el motivo Y (uno o dos residuos de tirosina que están separados por varios aminoácidos). La familia de helicasas PiF1 (Hel) tiene una actividad de desenrollado de 5' a 3' que, para muchas entidades de círculo rodante, está codificada por el hospedador. [8] Los helitrones vegetales también codifican un marco de lectura abierto con homología con las proteínas de unión al ADN monocatenario (RPA). [7] Normalmente, las proteínas RPA en los helitrones tienen una longitud de 150 a 500 aa y están codificadas por varios exones. En todos los helitrones, el dominio Rep precede al dominio Hel. [2]
Recientemente se determinó mediante crioEM la estructura tridimensional de la transposasa de helitrón unida covalentemente al extremo izquierdo del transposón. [9]
Se propone que los helitrones se transponen mediante un mecanismo similar a la replicación en círculo rodante a través de un intermediario de ADN monocatenario. Se proponen dos modelos para el mecanismo de transposición: el concertado y el secuencial. En el modelo concertado, la escisión y la ligadura de la cadena donante ocurren simultáneamente, mientras que en el modelo secuencial ocurren de manera escalonada. El modelo concertado no requiere un intermediario circular, aunque podrían ocurrir si un paso falla o se omite durante la transposición. El modelo secuencial difiere en que un intermediario circular es un paso requerido de la transposición y debido a que, hasta hace muy poco, no se conocían intermediarios circulares para los helitrones, el modelo concertado se adaptó para explicar la transposición. [1]
En cualquier caso, al utilizar transposones Helraiser reconstituidos para estudiar la transposición de helitrones, se demostró que el sitio donante debe ser bicatenario y que los donantes monocatenarios no serán suficientes. [10]
El helitrón puede ser autónomo o no autónomo. Una molécula de transposasa corta en el sitio donante (por el primer residuo de tirosina (Y1) de la proteína Rep) y en el sitio diana (por el segundo residuo de tirosina (Y2)) y se une a los extremos 5' resultantes. El OH 3' libre en el ADN diana ataca el enlace ADN-Y1 y forma un enlace con la hebra donante, lo que da como resultado la transferencia de la hebra. [7] La replicación en el sitio donante cortado se inicia en el OH 3' libre, donde la hebra donante sirve como cebador para la síntesis de ADN por la ADN polimerasa del huésped y la replicación procede a desplazar una hebra del helitrón. Si el palíndromo y el extremo 3' del elemento se reconocen correctamente, la escisión se produce después de la secuencia CTRR y la hebra de helitrón se transfiere al sitio donante, donde la replicación de ADN resuelve el heterodúplex. [11]
En 2016 se publicó uno de los primeros estudios mecanísticos de la transposición de helitrones con el fin de arrojar luz sobre los diferentes pasos de la transposición. [12] Basándose en una secuencia de consenso, reconstruyó el probable ancestro de la familia de helitrones Helibat presente en el genoma del murciélago pardo pequeño ( Myotis Lucifugus ), el único grupo de mamíferos que posee un número importante de helitrones en su genoma . Este transposón activo se insertó en un plásmido que actuaba como donante del helitrón. Se incluyó un gen de resistencia a antibióticos entre las dos secuencias terminales del helitrón para permitir el aislamiento de las células donde se produjo la transposición.
Durante la transposición del helitrón se forma un intermediario circular que se aisló en las células transfectadas con el plásmido. Se forma mediante la unión de los extremos terminales y sugiere un modelo de transposición de círculo rodante durante el cual la escisión de las cadenas donante y diana no se produce al mismo tiempo, ya que primero se forma un ADN circular monocatenario con una de las cadenas del helitrón.
Este modelo se sustenta en el hecho de que la eliminación de una de las dos tirosinas (Y727) del dominio Rep que se cree que intervienen en la escisión de las cadenas [1] no afecta realmente a la eficacia de la transposición de helitrones. Solo se necesitaría una de las tirosinas [12] para garantizar un proceso de dos pasos: 1) la escisión del ADN donante y 2) la integración en el sitio diana.
La presencia de exones e intrones contiguos dentro del ADN del huésped transportado por los helitrones sugirió un mecanismo de adquisición basado en el ADN. Se propuso que la captura de genes de los helitrones se produce de forma gradual o secuencial, es decir, la captura de genes se produce durante una transposición y la captura de un segundo gen se produce durante un evento de transposición posterior. La captura gradual daría lugar a helitrones que contienen fragmentos de genes de diferentes ubicaciones. El modelo de captura secuencial puede explicar los helitrones que transportan múltiples fragmentos de genes observados en otros organismos. [1] Hay tres modelos principales propuestos para explicar el mecanismo de captura de genes a nivel del ADN en los helitrones.
También conocido como modelo 1 de "transducción" o "lectura continua" (RTM1). La transposición se inicia en el extremo 5' y la captura del gen ocurre si se omite la señal de terminación 3'. Un palíndromo críptico corriente abajo podría proporcionar un nuevo terminador si se pasara por alto el terminador normal y se capturaría toda la secuencia intermedia. En este sentido, los helitrones pueden considerarse como máquinas de barajar exones. [11] Como una secuencia aleatoria proporciona la nueva señal de terminación, este modelo no requiere una alta densidad de helitrones en el genoma.
De hecho, en las fusiones de un solo extremo, el fragmento insertado de ADN donante está flanqueado en un extremo (extremo constante) por IRR y en el otro extremo por la secuencia CTTG o GTTC presente en el donante (extremo variable) de una manera que generalmente da como resultado múltiples inserciones en tándem del plásmido donante o captura de la secuencia flanqueante en el sitio diana. [13] Esta falla en reconocer la señal de terminación para la transposición del helitrón puede dar como resultado que el ADN que flanquea el extremo 3' del helitrón también se transfiera junto con el helitrón al sitio donante (captura génica). Esta puede ser la forma en que los helitrones han adquirido secuencias codificantes adicionales. A pesar de esta hipótesis, son necesarios más experimentos para verificar el mecanismo de transposición.
También conocido como modelo 2 de "lectura continua" (RTM2). En este modelo, la transposición se inicia en el extremo 5' de un helitrón y, si falta el extremo 3' de ese helitrón, la transposición termina en el siguiente extremo 3' de un helitrón en la orientación correcta, y se produce la captura del gen. El resultado es que se captura toda la secuencia intermedia. [1]
En este modelo, porciones de genes o regiones no codificantes pueden servir accidentalmente como plantillas durante la reparación de roturas de doble cadena (DSB) que ocurren en los helitrones durante su transposición. La reparación de baja fidelidad de DSB mediante unión de extremos no homólogos es más frecuente en plantas y mamíferos que la reparación mediante recombinación homóloga, y a menudo está acompañada por inserciones de "ADN de relleno" de 100 a 4000 pb de longitud copiado de diversas regiones de ADN genómico o extracromosómico en DSB. Este modelo predice que existen regiones de microhomología de 2 a 8 pb entre las regiones que flanquean la DSB en el helitrón y las que flanquean la secuencia original del huésped capturada por el helitrón. [2]
También se han propuesto otros modelos de mecanismos de captura de genes para los helitrones: el modelo de recombinación específica del sitio, que se basa en las características compartidas entre los helitrones y los integrones ; la captura de elementos transponibles, que se basa en la integración de los elementos de transición a través de la transposición en otros elementos de transición, también denominada anidación de elementos de transición. [1] A pesar de todos estos modelos propuestos, faltan ejemplos para limitar el mecanismo de captura de genes a un único modelo. Se necesita más investigación para comprender el mecanismo molecular detrás de la captura de genes y cómo favorece la supervivencia de los helitrones.
La evidencia que apoya los modelos de "lectura continua" parece residir en la relativa falta de importancia del RTS 3' en comparación con el LTS 5': [10] [12] la eliminación del LTS conduce a una reducción severa en la eficiencia de la transposición del helitrón, mientras que la eliminación completa del RTS aún conduce a una transposición significativa a pesar de un número reducido de copias. [12] El RTS indica a la proteína Rep-Hel el final del helitrón y, por lo tanto, el final de la transposición. Toda esta información se encuentra en la estructura de horquilla formada por la secuencia palindrómica de ADN en el extremo 3'. Es probable que una estructura tan pequeña se modifique con el tiempo, lo que permite eludir el extremo del helitrón durante su transposición y capturar la secuencia del gen vecino.
Los helitrones, como todos los demás TE, son mutágenos de inserción potenciales . Pueden insertarse dentro de la región promotora de un gen que da como resultado la abolición de transcripciones mensurables y los fenotipos observados . En algunos casos se ha visto que una inserción de helitrones ha proporcionado motivos reguladores necesarios para el inicio de la transcripción. Los investigadores presentaron evidencia de que los helitrones han contribuido con promotores putativos, exones, sitios de empalme, sitios de poliadenilación y sitios de unión de microARN a transcripciones que de otro modo se conservan en mamíferos. [7] Los helitrones impulsan la expresión y proporcionan elementos reguladores de novo como CAAT-box, GCbox, motivo octamérico y sitios de caja TATA . Los helitrones también pueden alterar la longitud y la secuencia de los UTR 5' y 3' de las transcripciones codificantes. Otra forma en que los helitrones pueden controlar la expresión genética es contribuyendo a nuevas variantes de empalme promoviendo el empalme alternativo y proporcionando sitios de empalme crípticos. Se han reportado varias mutaciones espontáneas en plantas que son causadas por inserciones de helitrones intrónicos que resultan en la generación de especies de transcripción quimérica. [1]
La estructura atípica, la falta de modificación del sitio diana y la heterogeneidad de la secuencia de los helitrones han dificultado la identificación automatizada de los mismos. Para el análisis de todo el genoma se han aplicado dos enfoques para encontrar helitrones canónicos: enfoques de identificación de repeticiones de novo que se pueden utilizar para crear bibliotecas de consenso de todas las secuencias repetidas, pero los enfoques de búsqueda de repeticiones de novo solo identificarán los helitrones que estén presentes en múltiples copias relativamente homogéneas en el genoma. Por lo tanto, los helitrones de bajo número de copias y más antiguos tenderán a estar fragmentados y tener extremos mal definidos. Estos enfoques están limitados por la calidad del ensamblaje del genoma y la homogeneidad de las repeticiones. Otro enfoque se basa en la estructura, que se apoya en las características estructurales de los helitrones canónicos y utiliza programas como Helitronfinder, HelSearch, Helraizer y HelitronScanner. Como estos programas se entrenan con elementos de helitrones conocidos, es posible que no sean eficientes para identificar familias divergentes y generen muchos falsos positivos. Este enfoque no crea secuencias de consenso de los helitrones candidatos, lo que genera grandes conjuntos de datos. [1]
La sensibilidad del enfoque basado en la estructura (identificación correcta/(identificación correcta + falsos negativos)) es del 93%, y la especificidad (identificación correcta/(identificación correcta + falsos positivos)) es del 99%. Hay varias razones por las que todas las demás técnicas para el descubrimiento de helitrones han sido menos sensibles y/o más propensas a errores: una búsqueda basada en la proteína Rep/helicasa produce una gran cantidad de falsos negativos, porque la mayoría de los helitrones son elementos no autónomos. Una búsqueda basada en la similitud no identificará ninguna familia nueva y, por lo tanto, funcionará mal en genomas recientemente estudiados. Una búsqueda basada en repeticiones requiere una extensa curación manual para identificar familias de helitrones, una tarea abrumadora en genomas grandes con una repetición sustancial de ADN. Sobre la base de la sensibilidad y especificidad generales, el enfoque basado en la estructura para identificar elementos de helitrones es bastante exitoso y especialmente útil para identificar elementos de helitrones en un genoma recientemente caracterizado. Sin embargo, debido a que se necesitan al menos 2 copias para hacer una alineación, se perderán los helitrones de copia única. [14]
Herencia: Los análisis de todo el genoma mostraron que la mayor parte de los helitrones tienden a ser bastante recientes. La edad joven de las familias de helitrones está, por supuesto, sesgada por los genomas que se han examinado cuidadosamente, que son predominantemente plantas e insectos donde la vida media del ADN sin restricciones (la cantidad promedio de tiempo en que se pierde la mitad del ADN no conservado para la función) es bastante rápida. A diferencia de otros transposones de ADN, se ha informado que los helitrones de algunas especies exhiben actividad a largo plazo probablemente debido al mecanismo de transposición o la incapacidad del huésped para reconocer los helitrones debido a la heterogeneidad de la secuencia o la captura del gen del huésped. En contraste con la vida media del ADN sin restricciones relativamente más rápida (2,5-14 my) de los genomas de plantas e insectos, se estima que la vida media del ADN de los mamíferos es mucho más lenta (884 my) que junto con los requisitos mínimos de la transposición de helitrones y la baja tasa de descomposición en los mamíferos han causado este patrón de persistencia vertical. [15]
Transferencia horizontal: el impacto de la transferencia horizontal (HT) de elementos transponibles puede ser significativo debido a su potencial mutagénico, movilidad inherente y abundancia. Los investigadores encontraron evidencia de la HT repetida de cuatro familias diferentes de helitrones en una variedad sin precedentes de organismos, incluidos mamíferos, reptiles, peces, invertebrados y virus de insectos. Los helitrones presentes en estas especies tienen una distribución irregular y están estrechamente relacionados (80-98% de identidad de secuencia), a pesar de los tiempos de divergencia profundos entre los hospedadores. A diferencia de los genes, los helitrones que se han transferido horizontalmente a nuevos genomas hospedadores pueden amplificarse, en algunos casos alcanzando hasta varios cientos de copias y representando una fracción sustancial del genoma. Como se sabe que los helitrones capturan y amplifican con frecuencia fragmentos de genes, la HT de este grupo único de transposones de ADN podría conducir a la transferencia horizontal de genes e incurrir en cambios dramáticos en la trayectoria de la evolución del genoma. [1]
Dos escenarios diferentes describen el destino más probable de un gen del huésped capturado por los helitrones: 1. El gen capturado sería destruido por múltiples mutaciones si no proporcionara ninguna ventaja selectiva a los transposones. 2. Se mantendría como un gen relacionado con el gen original del huésped si su captura es beneficiosa para el transposón, que es tolerado por el huésped. Los helitrones, como la mayoría de los demás elementos móviles en los genomas de A. thaliana y C. elegans , están presentes en los genomas de múltiples familias altamente divergentes. Considerando la corta edad de estas familias y el grado de conservación de proteínas, es altamente improbable que la divergencia observada sea el resultado de mutaciones acumuladas por los transposones integrados en el genoma del huésped, lo que demuestra que los helitrones funcionan como una poderosa herramienta de evolución. Han reclutado genes del huésped, los han modificado hasta un punto que es inalcanzable por el proceso mendeliano y los han multiplicado en los genomas del huésped. [4]
Aunque se acepta generalmente que los helitrones son transposones RC y a través de numerosas investigaciones, se ha demostrado el papel de la transposición de helitrones en la duplicación de genes y la conformación de la arquitectura genética, no se entienden bien ni los diversos mecanismos por los que esto ocurre ni la frecuencia. En este punto, ni siquiera está claro si el extremo 3' en un transposón de helitrones inicia o termina la transposición replicativa de helitrones. Un paso importante hacia la investigación de este mecanismo sería el aislamiento de helitrones autónomos activos in vitro e in vivo . Esto se puede hacer mediante la identificación computacional de helitrones jóvenes completos. En un futuro cercano, los estudios detallados de secuencias asistidos por computadora permitirán a los investigadores comprender la historia evolutiva de los helitrones, junto con su mecanismo de captura de genes y su importancia general para la evolución genética. [2]