Los retrotransposones (también llamados elementos transponibles de clase I ) son elementos móviles que se mueven en el genoma del huésped convirtiendo su ARN transcrito en ADN a través de la transcripción inversa . [1] Por lo tanto, se diferencian de los elementos transponibles de clase II, o transposones de ADN, en que utilizan un intermediario de ARN para la transposición y dejan el sitio donante de transposición sin cambios. [2]
A través de la transcripción inversa, los retrotransposones se amplifican rápidamente y se vuelven abundantes en genomas eucariotas como el maíz (49-78%) [3] y los humanos (42%). [4] Solo están presentes en eucariotas pero comparten características con retrovirus como el VIH , por ejemplo, la recombinación extracromosómica mediada por transcriptasa inversa discontinua . [5] [6]
Existen dos tipos principales de retrotransposones: los que tienen repeticiones terminales largas (LTR) y los que no tienen repeticiones terminales largas (non-LTR). Los retrotransposones se clasifican según la secuencia y el método de transposición. [7] La mayoría de los retrotransposones en el genoma del maíz son LTR, mientras que en los humanos son en su mayoría non-LTR.
Los retrotransposones LTR se caracterizan por sus repeticiones terminales largas (LTR), que están presentes tanto en los extremos 5' como 3' de sus secuencias. Estas LTR contienen los promotores de estos elementos transponibles (TE), son esenciales para la integración de TE y pueden variar en longitud desde poco más de 100 pares de bases (pb) hasta más de 1000 pb. En promedio, los retrotransposones LTR abarcan varios miles de pares de bases, y los ejemplos más grandes conocidos alcanzan hasta 30 kilobases (kb).
Los LTR son secuencias altamente funcionales y, por esa razón, los retrotransposones LTR y no LTR difieren en gran medida en sus mecanismos de transcripción inversa e integración. Los retrotransposones no LTR utilizan un proceso de transcripción inversa con cebado por diana (TPRT), que requiere que el ARN del TE sea llevado al sitio de escisión de la integrasa del retrotransposón, donde se transcribe de forma inversa. Por el contrario, los retrotransposones LTR experimentan una transcripción inversa en el citoplasma, utilizando dos rondas de cambio de plantilla y una formación de un complejo de preintegración (PIC) compuesto de ADN bicatenario y un dímero de integrasa unido a los LTR. Luego, este complejo se desplaza hacia el núcleo para su integración en una nueva ubicación genómica.
Los retrotransposones LTR suelen codificar las proteínas gag y pol , que pueden combinarse en un único marco de lectura abierto (ORF) o separarse en ORFs distintos. De forma similar a los retrovirus, la proteína gag es esencial para el ensamblaje de la cápside y el empaquetamiento del ARN del TE y las proteínas asociadas. La proteína pol es necesaria para la transcripción inversa e incluye estos dominios cruciales: PR (proteasa), RT (transcriptasa inversa), RH ( RNasa H ) e INT (integrasa). Además, algunos retrotransposones LTR tienen un ORF para una proteína de envoltura ( env ) que se incorpora a la cápside ensamblada, lo que facilita la unión a las superficies celulares.
Un retrovirus endógeno es un retrovirus sin efectos patógenos virales que se ha integrado en el genoma del huésped insertando su información genética heredable en las células que puede transmitirse a la siguiente generación como un retrotransposón. [8] Debido a esto, comparten características con los retrovirus y los retrotransposones. Cuando el ADN retroviral se integra en el genoma del huésped, evolucionan hacia retrovirus endógenos que influyen en los genomas eucariotas. Tantos retrovirus endógenos se han insertado en genomas eucariotas que permiten comprender la biología entre las interacciones virus-huésped y el papel de los retrotransposones en la evolución y la enfermedad. Muchos retrotransposones comparten características con los retrovirus endógenos, la propiedad de reconocer y fusionarse con el genoma del huésped. Sin embargo, existe una diferencia clave entre los retrovirus y los retrotransposones, que está indicada por el gen env. Aunque es similar al gen que realiza la misma función en los retrovirus, el gen env se utiliza para determinar si el gen es retroviral o retrotransposón. Si el gen es retroviral, puede evolucionar de un retrotransposón a un retrovirus. Se diferencian por el orden de secuencias en los genes pol. Los genes Env se encuentran en los tipos de retrotransposones LTR Ty1-copia ( Pseudoviridae ), Ty3-gypsy ( Metaviridae ) y BEL/Pao. [9] [8] Codifican glicoproteínas en la envoltura del retrovirus necesarias para la entrada en la célula huésped. Los retrovirus pueden moverse entre células, mientras que los retrotransposones LTR solo pueden moverse ellos mismos dentro del genoma de la misma célula. [10] Muchos genes de vertebrados se formaron a partir de retrovirus y retrotransposones LTR. Un retrovirus endógeno o retrotransposón LTR tiene la misma función y ubicaciones genómicas en diferentes especies, lo que sugiere su papel en la evolución. [11]
Al igual que los retrotransposones LTR, los retrotransposones no LTR contienen genes para la transcriptasa inversa, la proteína de unión al ARN, la nucleasa y, a veces, el dominio H de la ribonucleasa [12], pero carecen de las repeticiones terminales largas. Las proteínas de unión al ARN se unen al intermediario de transposición del ARN y las nucleasas son enzimas que rompen los enlaces fosfodiéster entre los nucleótidos en los ácidos nucleicos. En lugar de LTR, los retrotransposones no LTR tienen repeticiones cortas que pueden tener un orden invertido de bases una al lado de la otra, además de las repeticiones directas que se encuentran en los retrotransposones LTR, que son solo una secuencia de bases que se repite a sí misma.
Aunque son retrotransposones, no pueden llevar a cabo la transcripción inversa utilizando un intermediario de transposición de ARN de la misma manera que los retrotransposones LTR. Esos dos componentes clave del retrotransposón siguen siendo necesarios, pero la forma en que se incorporan a las reacciones químicas es diferente. Esto se debe a que, a diferencia de los retrotransposones LTR, los retrotransposones no LTR no contienen secuencias que se unan al ARNt.
En su mayoría, se dividen en dos tipos: LINE (elementos nucleares intercalados largos) y SINE (elementos nucleares intercalados cortos). Los elementos SVA son la excepción entre los dos, ya que comparten similitudes con los LINE y los SINE, ya que contienen elementos Alu y diferentes cantidades de la misma repetición. Los SVA son más cortos que los LINE pero más largos que los SINE.
Aunque históricamente se los ha considerado como "ADN basura", las investigaciones sugieren que, en algunos casos, tanto los LINE como los SINE se incorporaron a genes nuevos para formar nuevas funciones. [13]
Cuando se transcribe un LINE, el transcrito contiene un promotor de la ARN polimerasa II que garantiza que los LINE se puedan copiar en cualquier lugar en el que se inserten. La ARN polimerasa II es la enzima que transcribe los genes en transcripciones de ARNm. Los extremos de las transcripciones de LINE son ricos en múltiples adeninas, [14] las bases que se agregan al final de la transcripción para que las transcripciones de LINE no se degraden. Esta transcripción es el intermediario de transposición del ARN.
El intermediario de transposición de ARN se desplaza desde el núcleo hacia el citoplasma para su traducción. Esto genera las dos regiones codificantes de un LINE que, a su vez, se une al ARN del que se transcribe. El ARN del LINE se desplaza luego hacia el núcleo para insertarse en el genoma eucariota.
Los LINE se insertan en regiones del genoma eucariota ricas en bases AT. En las regiones AT, LINE utiliza su nucleasa para cortar una hebra del ADN bicatenario eucariota. La secuencia rica en adenina en la transcripción de LINE se empareja con la hebra cortada para señalar dónde se insertará LINE con grupos hidroxilo. La transcriptasa inversa reconoce estos grupos hidroxilo para sintetizar el retrotransposón LINE donde se corta el ADN. Al igual que con los retrotransposones LTR, este nuevo LINE insertado contiene información del genoma eucariota, por lo que se puede copiar y pegar en otras regiones genómicas fácilmente. Las secuencias de información son más largas y más variables que las de los retrotransposones LTR.
La mayoría de las copias de LINE tienen una longitud variable al principio porque la transcripción inversa suele detenerse antes de que se complete la síntesis de ADN. En algunos casos, esto hace que se pierda el promotor de la ARN polimerasa II, por lo que las LINE no pueden seguir transponiéndose. [15]
Los retrotransposones LINE-1 (L1) constituyen una parte importante del genoma humano, con un estimado de 500.000 copias por genoma. Los genes que codifican para LINE1 humano suelen tener su transcripción inhibida por la unión de grupos metilo a su ADN llevada a cabo por proteínas PIWI y enzimas ADN metiltransferasas. La retrotransposición de L1 puede alterar la naturaleza de los genes transcritos al pegarse dentro o cerca de los genes, lo que a su vez podría conducir a una enfermedad humana. Los LINE1 solo pueden retrotransponerse en algunos casos para formar diferentes estructuras cromosómicas que contribuyen a las diferencias en la genética entre individuos. [17] Hay un estimado de 80-100 L1 activos en el genoma de referencia del Proyecto Genoma Humano, y un número aún menor de L1 dentro de esos L1 activos se retrotransponen con frecuencia. Las inserciones de L1 se han asociado con la tumorigénesis al activar genes relacionados con el cáncer (oncogenes) y disminuir los genes supresores de tumores.
Cada LINE1 humano contiene dos regiones desde las cuales se pueden codificar productos génicos. La primera región codificante contiene una proteína de cremallera de leucina involucrada en interacciones proteína-proteína y una proteína que se une al extremo terminal de los ácidos nucleicos. La segunda región codificante tiene una nucleasa de purina/pirimidina, transcriptasa inversa y proteína rica en aminoácidos cisteínas e histidinas. El extremo del LINE1 humano, al igual que con otros retrotransposones, es rico en adenina. [18] [19] [20]
La L1 humana se retrotranspone activamente en el genoma humano. Un estudio reciente identificó 1.708 eventos de retrotransposición somática de L1, especialmente en células epiteliales colorrectales. Estos eventos ocurren desde la embriogénesis temprana y la tasa de retrotransposición aumenta sustancialmente durante la tumorigénesis colorrectal. [21]
Los SINE son mucho más cortos (300 pb) que los LINE. [22] Comparten similitudes con los genes transcritos por la ARN polimerasa II, la enzima que transcribe los genes en transcripciones de ARNm, y la secuencia de iniciación de la ARN polimerasa III, la enzima que transcribe los genes en ARN ribosómico, ARNt y otras moléculas pequeñas de ARN. [23] Los SINE, como los elementos MIR de mamíferos, tienen un gen de ARNt al inicio y son ricos en adenina al final como en los LINE.
Los SINE no codifican una proteína transcriptasa inversa funcional y dependen de otros transposones móviles, especialmente LINE . [24] Los SINE explotan los componentes de transposición de LINE a pesar de que las proteínas de unión a LINE prefieren unirse al ARN LINE. Los SINE no pueden transponerse por sí mismos porque no pueden codificar transcripciones de SINE. Por lo general, consisten en partes derivadas de ARNt y LINE. La porción de ARNt contiene un promotor de ARN polimerasa III que es el mismo tipo de enzima que la ARN polimerasa II. Esto asegura que las copias de LINE se transcriban en ARN para una mayor transposición. El componente LINE permanece para que las proteínas de unión a LINE puedan reconocer la parte LINE del SINE.
Los Alu son los SINE más comunes en los primates. Tienen aproximadamente 350 pares de bases de longitud, no codifican proteínas y pueden ser reconocidos por la enzima de restricción AluI (de ahí el nombre). Su distribución puede ser importante en algunas enfermedades genéticas y cánceres. Copiar y pegar ARN Alu requiere que el extremo rico en adenina de Alu y el resto de la secuencia estén unidos a una señal. El Alu unido a la señal puede entonces asociarse con los ribosomas. El ARN LINE se asocia en los mismos ribosomas que el Alu. La unión al mismo ribosoma permite que los Alus de los SINE interactúen con LINE. Esta traducción simultánea del elemento Alu y LINE permite copiar y pegar SINE.
Los elementos SVA están presentes en niveles más bajos que los SINES y LINE en humanos. Los inicios de los elementos SVA y Alu son similares, seguidos de repeticiones y un final similar al retrovirus endógeno. Los LINE se unen a los sitios que flanquean los elementos SVA para transponerlos. Los SVA son uno de los transposones más jóvenes en el genoma de los grandes simios y uno de los más activos y polimórficos en la población humana. Los SVA se crearon mediante una fusión entre un elemento Alu, un VNTR (repetición en tándem de número variable) y un fragmento LTR. [25]
Los retrotransposones garantizan que no se pierdan por casualidad al aparecer solo en la genética celular que puede transmitirse de una generación a la siguiente a partir de los gametos parentales. Sin embargo, los LINE pueden transponerse a las células del embrión humano que eventualmente se desarrollan en el sistema nervioso, lo que plantea la pregunta de si esta retrotransposición de LINE afecta la función cerebral. La retrotransposición de LINE también es una característica de varios cánceres, pero no está claro si la retrotransposición en sí causa cáncer en lugar de solo un síntoma. La retrotransposición no controlada es mala tanto para el organismo huésped como para los propios retrotransposones, por lo que deben regularse. Los retrotransposones están regulados por la interferencia de ARN . La interferencia de ARN la lleva a cabo un grupo de ARN no codificantes cortos . El ARN no codificante corto interactúa con la proteína Argonaute para degradar las transcripciones de los retrotransposones y cambiar su estructura de histonas de ADN para reducir su transcripción.
Los retrotransposones LTR surgieron más tarde que los retrotransposones no LTR, posiblemente a partir de un retrotransposón no LTR ancestral que adquirió una integrasa de un transposón de ADN. Los retrovirus adquirieron propiedades adicionales para sus envolturas virales al tomar los genes relevantes de otros virus utilizando el poder del retrotransposón LTR.
Debido a su mecanismo de retrotransposición, los retrotransposones se amplifican en número rápidamente y componen el 40% del genoma humano. Las tasas de inserción de los elementos LINE1, Alu y SVA son 1/200 – 1/20, 1/20 y 1/900 respectivamente. Las tasas de inserción de LINE1 han variado mucho durante los últimos 35 millones de años, por lo que indican puntos en la evolución del genoma.
Cabe destacar que una gran cantidad de 100 kilobases en el genoma del maíz muestran variedad debido a la presencia o ausencia de retrotransposones. Sin embargo, dado que el maíz es genéticamente inusual en comparación con otras plantas, no se puede utilizar para predecir la retrotransposición en otras plantas.
Las mutaciones causadas por retrotransposones incluyen: