Retrotransposón

Los retrotransposones (también llamados elementos transponibles de clase I ) son elementos móviles que se mueven en el genoma del huésped convirtiendo su ARN transcrito en ADN a través de la transcripción inversa . ^[1] Por lo tanto, se diferencian de los elementos transponibles de clase II, o transposones de ADN, en que utilizan un intermediario de ARN para la transposición y dejan el sitio donante de transposición sin cambios. ^[2]

A través de la transcripción inversa, los retrotransposones se amplifican rápidamente y se vuelven abundantes en genomas eucariotas como el maíz (49-78%) ^[3] y los humanos (42%). ^[4] Solo están presentes en eucariotas pero comparten características con retrovirus como el VIH , por ejemplo, la recombinación extracromosómica mediada por transcriptasa inversa discontinua . ^[5]^[6]

Existen dos tipos principales de retrotransposones: los que tienen repeticiones terminales largas (LTR) y los que no tienen repeticiones terminales largas (non-LTR). Los retrotransposones se clasifican según la secuencia y el método de transposición. ^[7] La mayoría de los retrotransposones en el genoma del maíz son LTR, mientras que en los humanos son en su mayoría non-LTR.

Retrotransposones LTR

Los retrotransposones LTR se caracterizan por sus repeticiones terminales largas (LTR), que están presentes tanto en los extremos 5' como 3' de sus secuencias. Estas LTR contienen los promotores de estos elementos transponibles (TE), son esenciales para la integración de TE y pueden variar en longitud desde poco más de 100 pares de bases (pb) hasta más de 1000 pb. En promedio, los retrotransposones LTR abarcan varios miles de pares de bases, y los ejemplos más grandes conocidos alcanzan hasta 30 kilobases (kb).

Los LTR son secuencias altamente funcionales y, por esa razón, los retrotransposones LTR y no LTR difieren en gran medida en sus mecanismos de transcripción inversa e integración. Los retrotransposones no LTR utilizan un proceso de transcripción inversa con cebado por diana (TPRT), que requiere que el ARN del TE sea llevado al sitio de escisión de la integrasa del retrotransposón, donde se transcribe de forma inversa. Por el contrario, los retrotransposones LTR experimentan una transcripción inversa en el citoplasma, utilizando dos rondas de cambio de plantilla y una formación de un complejo de preintegración (PIC) compuesto de ADN bicatenario y un dímero de integrasa unido a los LTR. Luego, este complejo se desplaza hacia el núcleo para su integración en una nueva ubicación genómica.

Los retrotransposones LTR suelen codificar las proteínas gag y pol , que pueden combinarse en un único marco de lectura abierto (ORF) o separarse en ORFs distintos. De forma similar a los retrovirus, la proteína gag es esencial para el ensamblaje de la cápside y el empaquetamiento del ARN del TE y las proteínas asociadas. La proteína pol es necesaria para la transcripción inversa e incluye estos dominios cruciales: PR (proteasa), RT (transcriptasa inversa), RH ( RNasa H ) e INT (integrasa). Además, algunos retrotransposones LTR tienen un ORF para una proteína de envoltura ( env ) que se incorpora a la cápside ensamblada, lo que facilita la unión a las superficies celulares.

Retrovirus endógeno

Un retrovirus endógeno es un retrovirus sin efectos patógenos virales que se ha integrado en el genoma del huésped insertando su información genética heredable en las células que puede transmitirse a la siguiente generación como un retrotransposón. ^[8] Debido a esto, comparten características con los retrovirus y los retrotransposones. Cuando el ADN retroviral se integra en el genoma del huésped, evolucionan hacia retrovirus endógenos que influyen en los genomas eucariotas. Tantos retrovirus endógenos se han insertado en genomas eucariotas que permiten comprender la biología entre las interacciones virus-huésped y el papel de los retrotransposones en la evolución y la enfermedad. Muchos retrotransposones comparten características con los retrovirus endógenos, la propiedad de reconocer y fusionarse con el genoma del huésped. Sin embargo, existe una diferencia clave entre los retrovirus y los retrotransposones, que está indicada por el gen env. Aunque es similar al gen que realiza la misma función en los retrovirus, el gen env se utiliza para determinar si el gen es retroviral o retrotransposón. Si el gen es retroviral, puede evolucionar de un retrotransposón a un retrovirus. Se diferencian por el orden de secuencias en los genes pol. Los genes Env se encuentran en los tipos de retrotransposones LTR Ty1-copia ( Pseudoviridae ), Ty3-gypsy ( Metaviridae ) y BEL/Pao. ^[9]^[8] Codifican glicoproteínas en la envoltura del retrovirus necesarias para la entrada en la célula huésped. Los retrovirus pueden moverse entre células, mientras que los retrotransposones LTR solo pueden moverse ellos mismos dentro del genoma de la misma célula. ^[10] Muchos genes de vertebrados se formaron a partir de retrovirus y retrotransposones LTR. Un retrovirus endógeno o retrotransposón LTR tiene la misma función y ubicaciones genómicas en diferentes especies, lo que sugiere su papel en la evolución. ^[11]

Retrotransposones no LTR

Al igual que los retrotransposones LTR, los retrotransposones no LTR contienen genes para la transcriptasa inversa, la proteína de unión al ARN, la nucleasa y, a veces, el dominio H de la ribonucleasa ^[12], pero carecen de las repeticiones terminales largas. Las proteínas de unión al ARN se unen al intermediario de transposición del ARN y las nucleasas son enzimas que rompen los enlaces fosfodiéster entre los nucleótidos en los ácidos nucleicos. En lugar de LTR, los retrotransposones no LTR tienen repeticiones cortas que pueden tener un orden invertido de bases una al lado de la otra, además de las repeticiones directas que se encuentran en los retrotransposones LTR, que son solo una secuencia de bases que se repite a sí misma.

Aunque son retrotransposones, no pueden llevar a cabo la transcripción inversa utilizando un intermediario de transposición de ARN de la misma manera que los retrotransposones LTR. Esos dos componentes clave del retrotransposón siguen siendo necesarios, pero la forma en que se incorporan a las reacciones químicas es diferente. Esto se debe a que, a diferencia de los retrotransposones LTR, los retrotransposones no LTR no contienen secuencias que se unan al ARNt.

En su mayoría, se dividen en dos tipos: LINE (elementos nucleares intercalados largos) y SINE (elementos nucleares intercalados cortos). Los elementos SVA son la excepción entre los dos, ya que comparten similitudes con los LINE y los SINE, ya que contienen elementos Alu y diferentes cantidades de la misma repetición. Los SVA son más cortos que los LINE pero más largos que los SINE.

Aunque históricamente se los ha considerado como "ADN basura", las investigaciones sugieren que, en algunos casos, tanto los LINE como los SINE se incorporaron a genes nuevos para formar nuevas funciones. ^[13]

Pauta

Cuando se transcribe un LINE, el transcrito contiene un promotor de la ARN polimerasa II que garantiza que los LINE se puedan copiar en cualquier lugar en el que se inserten. La ARN polimerasa II es la enzima que transcribe los genes en transcripciones de ARNm. Los extremos de las transcripciones de LINE son ricos en múltiples adeninas, ^[14] las bases que se agregan al final de la transcripción para que las transcripciones de LINE no se degraden. Esta transcripción es el intermediario de transposición del ARN.

El intermediario de transposición de ARN se desplaza desde el núcleo hacia el citoplasma para su traducción. Esto genera las dos regiones codificantes de un LINE que, a su vez, se une al ARN del que se transcribe. El ARN del LINE se desplaza luego hacia el núcleo para insertarse en el genoma eucariota.

Los LINE se insertan en regiones del genoma eucariota ricas en bases AT. En las regiones AT, LINE utiliza su nucleasa para cortar una hebra del ADN bicatenario eucariota. La secuencia rica en adenina en la transcripción de LINE se empareja con la hebra cortada para señalar dónde se insertará LINE con grupos hidroxilo. La transcriptasa inversa reconoce estos grupos hidroxilo para sintetizar el retrotransposón LINE donde se corta el ADN. Al igual que con los retrotransposones LTR, este nuevo LINE insertado contiene información del genoma eucariota, por lo que se puede copiar y pegar en otras regiones genómicas fácilmente. Las secuencias de información son más largas y más variables que las de los retrotransposones LTR.

La mayoría de las copias de LINE tienen una longitud variable al principio porque la transcripción inversa suele detenerse antes de que se complete la síntesis de ADN. En algunos casos, esto hace que se pierda el promotor de la ARN polimerasa II, por lo que las LINE no pueden seguir transponiéndose. ^[15]

L1 humana

Los retrotransposones LINE-1 (L1) constituyen una parte importante del genoma humano, con un estimado de 500.000 copias por genoma. Los genes que codifican para LINE1 humano suelen tener su transcripción inhibida por la unión de grupos metilo a su ADN llevada a cabo por proteínas PIWI y enzimas ADN metiltransferasas. La retrotransposición de L1 puede alterar la naturaleza de los genes transcritos al pegarse dentro o cerca de los genes, lo que a su vez podría conducir a una enfermedad humana. Los LINE1 solo pueden retrotransponerse en algunos casos para formar diferentes estructuras cromosómicas que contribuyen a las diferencias en la genética entre individuos. ^[17] Hay un estimado de 80-100 L1 activos en el genoma de referencia del Proyecto Genoma Humano, y un número aún menor de L1 dentro de esos L1 activos se retrotransponen con frecuencia. Las inserciones de L1 se han asociado con la tumorigénesis al activar genes relacionados con el cáncer (oncogenes) y disminuir los genes supresores de tumores.

Cada LINE1 humano contiene dos regiones desde las cuales se pueden codificar productos génicos. La primera región codificante contiene una proteína de cremallera de leucina involucrada en interacciones proteína-proteína y una proteína que se une al extremo terminal de los ácidos nucleicos. La segunda región codificante tiene una nucleasa de purina/pirimidina, transcriptasa inversa y proteína rica en aminoácidos cisteínas e histidinas. El extremo del LINE1 humano, al igual que con otros retrotransposones, es rico en adenina. ^[18]^[19]^[20]

La L1 humana se retrotranspone activamente en el genoma humano. Un estudio reciente identificó 1.708 eventos de retrotransposición somática de L1, especialmente en células epiteliales colorrectales. Estos eventos ocurren desde la embriogénesis temprana y la tasa de retrotransposición aumenta sustancialmente durante la tumorigénesis colorrectal. ^[21]

SENOS

Los SINE son mucho más cortos (300 pb) que los LINE. ^[22] Comparten similitudes con los genes transcritos por la ARN polimerasa II, la enzima que transcribe los genes en transcripciones de ARNm, y la secuencia de iniciación de la ARN polimerasa III, la enzima que transcribe los genes en ARN ribosómico, ARNt y otras moléculas pequeñas de ARN. ^[23] Los SINE, como los elementos MIR de mamíferos, tienen un gen de ARNt al inicio y son ricos en adenina al final como en los LINE.

Los SINE no codifican una proteína transcriptasa inversa funcional y dependen de otros transposones móviles, especialmente LINE . ^[24] Los SINE explotan los componentes de transposición de LINE a pesar de que las proteínas de unión a LINE prefieren unirse al ARN LINE. Los SINE no pueden transponerse por sí mismos porque no pueden codificar transcripciones de SINE. Por lo general, consisten en partes derivadas de ARNt y LINE. La porción de ARNt contiene un promotor de ARN polimerasa III que es el mismo tipo de enzima que la ARN polimerasa II. Esto asegura que las copias de LINE se transcriban en ARN para una mayor transposición. El componente LINE permanece para que las proteínas de unión a LINE puedan reconocer la parte LINE del SINE.

Elementos de aluminio

Los Alu son los SINE más comunes en los primates. Tienen aproximadamente 350 pares de bases de longitud, no codifican proteínas y pueden ser reconocidos por la enzima de restricción AluI (de ahí el nombre). Su distribución puede ser importante en algunas enfermedades genéticas y cánceres. Copiar y pegar ARN Alu requiere que el extremo rico en adenina de Alu y el resto de la secuencia estén unidos a una señal. El Alu unido a la señal puede entonces asociarse con los ribosomas. El ARN LINE se asocia en los mismos ribosomas que el Alu. La unión al mismo ribosoma permite que los Alus de los SINE interactúen con LINE. Esta traducción simultánea del elemento Alu y LINE permite copiar y pegar SINE.

Elementos del SVA

Los elementos SVA están presentes en niveles más bajos que los SINES y LINE en humanos. Los inicios de los elementos SVA y Alu son similares, seguidos de repeticiones y un final similar al retrovirus endógeno. Los LINE se unen a los sitios que flanquean los elementos SVA para transponerlos. Los SVA son uno de los transposones más jóvenes en el genoma de los grandes simios y uno de los más activos y polimórficos en la población humana. Los SVA se crearon mediante una fusión entre un elemento Alu, un VNTR (repetición en tándem de número variable) y un fragmento LTR. ^[25]

Papel en las enfermedades humanas

Los retrotransposones garantizan que no se pierdan por casualidad al aparecer solo en la genética celular que puede transmitirse de una generación a la siguiente a partir de los gametos parentales. Sin embargo, los LINE pueden transponerse a las células del embrión humano que eventualmente se desarrollan en el sistema nervioso, lo que plantea la pregunta de si esta retrotransposición de LINE afecta la función cerebral. La retrotransposición de LINE también es una característica de varios cánceres, pero no está claro si la retrotransposición en sí causa cáncer en lugar de solo un síntoma. La retrotransposición no controlada es mala tanto para el organismo huésped como para los propios retrotransposones, por lo que deben regularse. Los retrotransposones están regulados por la interferencia de ARN . La interferencia de ARN la lleva a cabo un grupo de ARN no codificantes cortos . El ARN no codificante corto interactúa con la proteína Argonaute para degradar las transcripciones de los retrotransposones y cambiar su estructura de histonas de ADN para reducir su transcripción.

Papel en la evolución

Los retrotransposones LTR surgieron más tarde que los retrotransposones no LTR, posiblemente a partir de un retrotransposón no LTR ancestral que adquirió una integrasa de un transposón de ADN. Los retrovirus adquirieron propiedades adicionales para sus envolturas virales al tomar los genes relevantes de otros virus utilizando el poder del retrotransposón LTR.

Debido a su mecanismo de retrotransposición, los retrotransposones se amplifican en número rápidamente y componen el 40% del genoma humano. Las tasas de inserción de los elementos LINE1, Alu y SVA son 1/200 – 1/20, 1/20 y 1/900 respectivamente. Las tasas de inserción de LINE1 han variado mucho durante los últimos 35 millones de años, por lo que indican puntos en la evolución del genoma.

Cabe destacar que una gran cantidad de 100 kilobases en el genoma del maíz muestran variedad debido a la presencia o ausencia de retrotransposones. Sin embargo, dado que el maíz es genéticamente inusual en comparación con otras plantas, no se puede utilizar para predecir la retrotransposición en otras plantas.

Las mutaciones causadas por retrotransposones incluyen:

Inactivación genética
Modificación de la regulación genética
Cambios en los productos genéticos
Actúan como sitios de reparación del ADN

Papel en la biotecnología

Véase también

Variación del número de copias
Organización genómica
Secuencias de inserción
Repetición intercalada
Paleogenética
Paleovirología
RetractorOryza
Marcadores de retrotransposones , un método poderoso para reconstruir filogenias.
Transposón Tn3
Transposón
Retron

Referencias

^ Dombroski BA, Feng Q, Mathias SL, Sassaman DM, Scott AF, Kazazian HH, Boeke JD (julio de 1994). "Un ensayo in vivo para la transcriptasa inversa del retrotransposón L1 humano en Saccharomyces cerevisiae". Biología molecular y celular . 14 (7): 4485–92. doi :10.1128/mcb.14.7.4485. PMC 358820 . PMID 7516468.
^ Craig, Nancy Lynn (2015). ADN móvil III . Washington (DC): ASM Press. ISBN 9781555819200.
^ SanMiguel P, Bennetzen JL (1998). "Evidencia de que un aumento reciente en el tamaño del genoma del maíz fue causado por la amplificación masiva de retrotranposones intergenes". Anales de Botánica . 82 (Supl A): 37–44. Bibcode :1998AnBot..82...37S. doi : 10.1006/anbo.1998.0746 .
^ Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, et al. (febrero de 2001). "Secuenciación inicial y análisis del genoma humano". Nature . 409 (6822): 860–921. Bibcode :2001Natur.409..860L. doi : 10.1038/35057062 . hdl : 2027.42/62798 . PMID 11237011.
^ Sanchez DH, Gaubert H, Drost HG, Zabet NR, Paszkowski J (noviembre de 2017). "Recombinación de alta frecuencia entre miembros de una familia de retrotransposones LTR durante ráfagas de transposición". Nature Communications . 8 (1): 1283. Bibcode :2017NatCo...8.1283S. doi :10.1038/s41467-017-01374-x. PMC 5668417 . PMID 29097664.
^ Drost HG, Sanchez DH (diciembre de 2019). "Convertirse en un clan egoísta: recombinación asociada a la transcripción inversa en retrotransposones LTR". Genome Biology and Evolution . 11 (12): 3382–3392. doi :10.1093/gbe/evz255. PMC 6894440 . PMID 31755923.
^ Xiong Y, Eickbush TH (octubre de 1990). "Origen y evolución de los retroelementos basados en sus secuencias de transcriptasa inversa". The EMBO Journal . 9 (10): 3353–62. doi :10.1002/j.1460-2075.1990.tb07536.x. PMC 552073 . PMID 1698615.
^ ab Wicker T, Sabot F, Hua-Van A, Bennetzen JL, Capy P, Chalhoub B, Flavell A, Leroy P, Morgante M, Panaud O, Paux E, SanMiguel P, Schulman AH (diciembre de 2007). "Un sistema de clasificación unificado para elementos transponibles eucariotas". Reseñas de la naturaleza. Genética . 8 (12): 973–82. doi :10.1038/nrg2165. PMID 17984973. S2CID 32132898.
^ Copeland CS, Mann VH, Morales ME, Kalinna BH, Brindley PJ (febrero de 2005). "El retrotransposón Sinbad del genoma de la duela sanguínea humana, Schistosoma mansoni, y la distribución de elementos similares a Pao relacionados". BMC Evolutionary Biology . 5 (1): 20. doi : 10.1186/1471-2148-5-20 . PMC 554778 . PMID 15725362.
^ Havecker ER, Gao X, Voytas DF (18 de mayo de 2004). "La diversidad de retrotransposones LTR". Genome Biology . 5 (225): 225. doi : 10.1186/gb-2004-5-6-225 . PMC 463057 . PMID 15186483.
^ Naville M, Warren IA, Haftek-Terreau Z, Chalopin D, Brunet F, Levin P, Galiana D, Volff JN (17 de febrero de 2016). "No es tan malo después de todo: retrovirus y retrotransposones de repetición terminal larga como fuente de nuevos genes en vertebrados". Microbiología clínica e infección . 22 (4): 312–323. doi : 10.1016/j.cmi.2016.02.001 . PMID 26899828.
^ Yadav VP, Mandal PK, Rao DN, Bhattacharya S (diciembre de 2009). "Caracterización de la endonucleasa similar a una enzima de restricción codificada por el retrotransposón de repetición terminal no larga EhLINE1 de Entamoeba histolytica". The FEBS Journal . 276 (23): 7070–82. doi :10.1111/j.1742-4658.2009.07419.x. PMID 19878305. S2CID 30791213.
^ Santangelo AM, de Souza FS, Franchini LF, Bumaschny VF, Low MJ, Rubinstein M (octubre de 2007). "Exaptación antigua de un retroposón CORE-SINE en un potenciador neuronal altamente conservado del gen de la proopiomelanocortina en mamíferos". PLOS Genetics . 3 (10): 1813–26. doi : 10.1371/journal.pgen.0030166 . PMC 2000970 . PMID 17922573.
^ Liang KH, Yeh CT (mayo de 2013). "Una red de restricción de la expresión génica mediada por secuencias Alu con sentido y antisentido ubicadas en ARN mensajeros codificadores de proteínas". BMC Genomics . 14 : 325. doi : 10.1186/1471-2164-14-325 . PMC 3655826 . PMID 23663499.
^ Singer MF (marzo de 1982). "SINEs y LINEs: secuencias intercaladas cortas y largas altamente repetidas en genomas de mamíferos". Cell . 28 (3): 433–4. doi :10.1016/0092-8674(82)90194-5. PMID 6280868. S2CID 22129236.
^ Walter M (2015). "Regulación de transposones tras pérdida dinámica de metilación del ADN (Descarga en PDF disponible)". ResearchGate . doi :10.13140/rg.2.2.18747.21286.
^ Chueh AC, Northrop EL, Brettingham-Moore KH, Choo KH, Wong LH (enero de 2009). Bickmore WA (ed.). "El ARN del retrotransposón LINE es un componente epigenético estructural y funcional esencial de una cromatina neocentromérica central". PLOS Genetics . 5 (1): e1000354. doi : 10.1371/journal.pgen.1000354 . PMC 2625447 . PMID 19180186.
^ Doucet AJ, Hulme AE, Sahinovic E, Kulpa DA, Moldovan JB, Kopera HC, Athanikar JN, Hasnaoui M, Bucheton A, Moran JV, Gilbert N (octubre de 2010). "Caracterización de partículas de ribonucleoproteína LINE-1". PLOS Genética . 6 (10): e1001150. doi : 10.1371/journal.pgen.1001150 . PMC 2951350 . PMID 20949108.
^ Denli AM, Narvaiza I, Kerman BE, Pena M, Benner C, Marchetto MC, Diedrich JK, Aslanian A, Ma J, Moresco JJ, Moore L, Hunter T, Saghatelian A, Gage FH (octubre de 2015). "ORF0 específico de primates contribuye a la diversidad mediada por retrotransposones". Cell . 163 (3): 583–93. doi : 10.1016/j.cell.2015.09.025 . PMID 26496605. S2CID 10525450.
^ Ohshima K, Okada N (2005). "SINEs y LINEs: simbiontes de genomas eucariotas con una cola común". Cytogenetic and Genome Research . 110 (1–4): 475–90. doi :10.1159/000084981. PMID 16093701. S2CID 42841487.
^ Nam, Chang Hyun; Youk, Jeonghwan; Kim, Jeong Yeon; Lim, Joonoh; Park, Jung Woo; Oh, Soo A; Lee, Hyun Jung; Park, Ji Won; Won, Hyein; Lee, Yunah; Jeong, Seung-Yong; Lee, Dong-Sung; Oh, Ji Won; Han, Jinju; Lee, Junehawk (18 de mayo de 2023). "Retrotransposición somática generalizada de L1 en el epitelio colorrectal normal". Nature . 617 (7961): 540–547. Bibcode :2023Natur.617..540N. doi : 10.1038/s41586-023-06046-z . ISSN 0028-0836. PMC 10191854 . Número de modelo: PMID37165195.
^ Stansfield WD, King RC (1997). Diccionario de genética (quinta edición). Oxford [Oxfordshire]: Oxford University Press. ISBN 978-0-19-509441-1.
^ Kramerov DA, Vassetzky NS (2005). Retroposones cortos en genomas eucariotas . Revista Internacional de Citología. Vol. 247. págs. 165–221. doi :10.1016/s0074-7696(05)47004-7. PMID 16344113.
^ Dewannieux M, Esnault C, Heidmann T (septiembre de 2003). "Retrotransposición mediada por LINE de secuencias Alu marcadas". Nature Genetics . 35 (1): 41–8. doi :10.1038/ng1223. PMID 12897783. S2CID 32151696.
^ Wells, JN; Feschotte, C (23 de noviembre de 2020). "Una guía de campo para los elementos transponibles eucariotas". Revisión anual de genética . 54 : 539–561. doi :10.1146/annurev-genet-040620-022145. PMC 8293684 . PMID 32955944.